Fünf Vektordatenbanken für generative KI-Modelle im Test

Vektordatenbanken bilden das Langzeitgedächtnis generativer KI-Modelle und sind auch darüber hinaus fürs Machine Learning nützlich. Ein Überblick.

Artikel verschenken
In Pocket speichern vorlesen Druckansicht 3 Kommentare lesen
Lesezeit: 14 Min.
Von
  • Nico Kreiling
Inhaltsverzeichnis

Obwohl Gartner die Vektordatenbanken erst am Anfang ihres Hype-Zyklus sieht, sind sie nach großen Sprachmodellen (Large Language Models, LLMs) derzeit vielleicht das meistdiskutierte KI-Thema. Vektordatenbanken speichern und verarbeiten hochdimensionale Daten in Form von Vektoren. Sie eignen sich damit hervorragend für die Embeddings, in denen LLMs den semantischen Kontext der verarbeiteten Token speichern.

Damit ermöglichen sie viele unterschiedliche Einsatzszenarien, die sich in drei Bereiche einteilen lassen: Die Retrieval Augmented Generation kommt häufig zum Einsatz, wenn man einem LLM Zugriff auf die eigenen Daten gewähren möchte. Dabei speichert ein Unternehmen seine Dokumente entsprechend aufbereitet in der Vektordatenbank und räumt dem Sprachmodell die Möglichkeit ein, auf die jeweils relevantesten zuzugreifen. Zweitens können sie Sprachmodellen einen Langzeitspeicher zur Verfügung stellen, denn LLMs sind in der Länge ihres Kontexts limitiert. Dies führt dazu, dass sie bei langen Konversationen die Anfänge schnell nicht mehr berücksichtigen. In Vektordatenbanken können LLMs Informationen vor dem Vergessen archivieren und später bei Bedarf nachschlagen.

Mehr zum Thema Künstliche Intelligenz (KI)
Nico Kreiling

Nico Kreiling arbeitet als Data Scientist bei scieneers und produziert Techtiefen, einen Entwickler-Podcast mit wechselnden Gästen aus allen Bereichen der IT.

Der Hauptanwendungsfall von Vektordatenbanken vor der Entwicklung großer Sprachmodelle waren neuronale Such- und Empfehlungssysteme. Das ist auch heute noch hochrelevant: das Finden der passenden Inhalte zu einer Suchanfrage oder einem Referenzobjekt, unabhängig von der exakten Formulierung, der verwendeten Sprache und sogar über verschiedene Medientypen. Aufgrund der aktuellen Beliebtheit von Vektordatenbanken ist auch das Angebot an Produkten enorm gewachsen. Dieser Artikel führt durch eine Reihe von Entscheidungskriterien und bietet eine erste Orientierung in einem Markt, der noch in heftiger Bewegung ist. Dieser Artikel führt durch eine Reihe von Entscheidungskriterien und bietet eine erste Orientierung in einem Markt, der noch in heftiger Bewegung ist.