Retrieval-Augmented Generation (RAG)

Was bedeutet RAG?

RAG ist ein Ansatz, bei dem ein KI-Modell (wie ChatGPT) beim Generieren von Antworten zusätzliche, externe Informationen aus einer Wissensdatenbank, Dokumenten oder dem Internet „abruft“ (retrieval), bevor es die eigentliche Antwort generiert (generation).
So kann das Modell aktuelle, spezifische und kontextbezogene Informationen liefern, auch über Dinge, die es beim ursprünglichen Training noch gar nicht „gelernt“ hatte.

Beispiel:
Ein reines Sprachmodell (LLM) weiß nur, was es bis zum Zeitpunkt seines Trainings gelernt hat.
Ein RAG-System kann beim Antworten z.B. in deiner Unternehmensdokumentation, in Gesetzestexten oder im Internet nach aktuellen Infos suchen und diese für eine bessere Antwort einbeziehen.

Typische Einsatzgebiete von RAG:

  • Chatbots, die auf interne Firmenwissen zugreifen sollen
  • FAQ-Systeme, die immer aktuell sein müssen
  • Juristische oder medizinische Beratungs-KIs, die auf große, sich verändernde Datenbanken zugreifen
  • „Enterprise GPT“-Lösungen

Technisch
RAG kombiniert zwei Komponenten:

  1. Retriever: Holt die passenden Texte/Dokumente (z. B. mit Vektordatenbanken).
  2. Generator: Erstellt aus diesen Infos eine verständliche Antwort (z. B. GPT-4, Llama, Claude).

Vorteil:
Das Modell kann mit aktuellen und firmenspezifischen Informationen arbeiten, ohne dass man es komplett neu trainieren muss. Retrieval-Augmented Generation (RAG) macht generative KI schlauer, weil sie beim Antworten gezielt nachliest.

Warenkorb