Was ist Retrieval Augmented Generation (RAG)

Was ist Retrieval Augmented Generation (RAG)

Die Abkürzung RAG steht für „Retrieval-Augmented Generation“ und ist eine Technik in der künstlichen Intelligenz, die immer mehr auch bei modernen Chatbots zu einem wichtigen Thema wird. Bei dieser Technik wird die Fähigkeit eines Sprachmodells zur Textgenerierung (Generation) mit einer Abfrage von Informationen (Retrieval) kombiniert.

Wie funktioniert RAG?

Retrieval Augmented Generation ist ein Prozess, der in zwei einfachen Schritten abläuft:

  1. Informationsabfrage (Retrieval): Zuerst sucht das System relevante Informationen aus einer großen Datenbank (meistens sogenannte Vektordatenbanken) oder einem Wissensspeicher. Diese Datenbank kann aus Texten, Artikeln, Dokumenten oder anderen Quellen bestehen.
  2. Textgenerierung (Generation): Basierend auf den abgerufenen Informationen generiert das Modell eine Antwort oder einen Text. Die abgerufenen Informationen helfen dem Modell, genauere und kontextbezogene Antworten zu geben.

Vektordatenbank – Gut zu wissen

Eine Vektordatenbank ist eine spezielle Datenbank, die Daten als numerische Vektoren speichert und effizient ähnliche Einträge finden kann. Das ermöglicht eine deutlich schnellere Suche in großen Datenmengen. Mehr Informationen über Vektordatenbanken gibt es hier.

Sehen wir uns ein Beispiel für RAG an

Eine Anfrage wie „Was ist die Hauptstadt von Frankreich?“ wird durch einen Chatbot beantwortet, indem er zunächst eine Datenbank mit geografischen Informationen durchsucht. Der Bot findet die relevante Information („Paris“) in der Datenbank und generiert daraus eine passende Antwort:

„Die Hauptstadt von Frankreich ist Paris.“

Analogie aus der echten Welt

Man kann das ein bisschen damit vergleichen, als würde ich eine Hausarbeit oder einen Artikel schreiben:

Ich fange an, nach Informationen zu suchen, vielleicht nicht in einer Vektordatenbank, aber auf Webseiten, in Büchern oder Zeitschriften – das wäre Schritt 1, also Retrieval. Nachdem ich die Infos habe, die ich brauche, kann ich damit beginnen meinen eigenen Text zu schreiben und erledige damit Schritt 2, die Generierung.

Was sind die Vorteile von RAG?

  • Genauigkeit: Durch den Zugriff auf eine Vielzahl von Quellen kann das Modell präzisere und aktuellere Informationen liefern und halluziniert weniger, das bedeutet es werden keine Fakten von der KI erfunden.
  • Besserer Kontext: Es kann besser auf spezifische Fragen eingegangen werden, da die KI auf relevante Daten aus der Datenbank zurückgreifen kann, die speziell für diese Anwendung bereitgestellt wurden.

Zusammengefasst

RAG kann für bessere Antworten bei Sprachmodellen und KI-Tools sorgen, denn die Technik kombiniert die guten Fähigkeiten zur Generierung von Text mit Präzision und Faktentreue durch die Abfrage von geprüften Informationen.

Die Technik ist besonders nützlich in Anwendungen, die aktuelle und spezifische Informationen benötigen, wie zum Beispiel Sprachassistenten, KI-Chatbots oder Suchmaschinen.

Autor

  • Johannes Ruof

    Johannes Ruof ist Mitgründer und Geschäftsführer der Meixner & Ruof UG. Als KI- und Office-Experte betreibt er zusammen mit Timothy Meixner den erfolgreichen YouTube-Kanal Digitale Profis (80.000+ Abonnent:innen).

    Alle Beiträge ansehen
Nach oben scrollen