Przejdź do treści
fewtokensai
Słownik AI

Audyt RAG

Audyt RAG — Audyt RAG (Retrieval-Augmented Generation) to systematyczny przegląd produkcyjnego systemu RAG pod kątem jakości pobierania (retrieval), generowania (generation), kosztów i bezpieczeństwa. Wynikiem jest uszeregowana lista napraw: od strategii chunkingu i wyboru modelu embeddingowego, przez framework ewaluacji, po optymalizację kosztów wywołań LLM.

Co sprawdza audyt RAG

  1. Strategia chunkingu — jak duże są fragmenty dokumentów wstrzykiwane do LLM, czy zachowują kontekst, jak są oznaczane metadanymi.
  2. Model embeddingowy — czy rozumie domenę (finanse, prawo, medycyna) i czy nie jest niepotrzebnie drogi.
  3. Vector DB — wybór i konfiguracja (ChromaDB, Pinecone, Vertex AI Vector Search, pgvector), indeksowanie, filtrowanie.
  4. Ewaluacja retrievalu — recall@k, MRR (Mean Reciprocal Rank), pokrycie typowych zapytań.
  5. Prompt generacyjny — czy model dostaje czytelny kontekst i jasne instrukcje, jak unikać halucynacji.
  6. Metryki end-to-end — faithfulness, answer relevance, hallucination rate, latencja, koszt na zapytanie.
  7. Bezpieczeństwo — czy w embeddingach są dane osobowe (RODO), czy prompt-injection jest blokowany.

Częste pułapki

  1. Brak ewaluacji w ogóle — system „działa”, bo product manager przetestował 5 zapytań.
  2. Generyczny model embeddingowy w niszowej domenieall-MiniLM-L6-v2 w polskim prawie podatkowym to ślepa uliczka.
  3. Retrieval jednoetapowy — zaawansowany RAG używa multi-hop, hybrid search i rerankerów.
  4. Vector DB jako jedyny indeks — w wąsko zdefiniowanych domenach BM25 + filtrowanie bije dense vectors.
  5. Brak monitoringu jakości — system degraduje się przy nowych dokumentach, a nikt tego nie zauważa.

Jak fewtokensai pomaga

Robię audyty RAG w 1–2 tygodnie, z konkretnym raportem uszeregowanym pod ROI. Mam doświadczenie z produkcyjnym RAG-iem (IG Group: chatbot nad wewnętrzną bazą wiedzy, ponad 100 tys. USD rocznych oszczędności). Umów audyt lub przeczytaj o usłudze Enterprise RAG.

Porozmawiajmy o Twoim AI

Porozmawiajmy.

30 minut bez zobowiązań. Opowiedz, gdzie utknęło wdrożenie AI lub co planujesz — wyjdziesz z rozmowy z konkretnymi krokami.