KI-Glossar

Vektor-Datenbank (Vector Database)

Spezialisierte Datenbank, die Embeddings (mathematische Vektoren) speichert und nach semantischer Ähnlichkeit durchsucht — Kernkomponente für RAG-Setups und KI-gestützte Suche.

Eine Vektor-Datenbank ist ein Datenspeicher, der für eine besondere Suche optimiert ist: nicht nach exakter Übereinstimmung („zeige mir alle Dokumente mit dem Wort 'Vertrag'"), sondern nach semantischer Ähnlichkeit („zeige mir Dokumente, die inhaltlich am ähnlichsten zu dieser Frage sind"). Möglich wird das, indem Texte, Bilder oder Audio vorher in Embeddings (mathematische Vektoren) umgewandelt und dann als Punkte in einem hochdimensionalen Raum gespeichert werden.

Die Suche funktioniert geometrisch: Bei einer Anfrage wird auch die Frage in einen Vektor umgewandelt, und die Datenbank sucht die nächstgelegenen gespeicherten Vektoren — die semantisch ähnlichsten Inhalte. Das ist die Grundlage für RAG-Systeme: ein Wissens-Chatbot, der auf eigene Firmendokumente antwortet, sucht zuerst die relevantesten Abschnitte in der Vektor-Datenbank und übergibt sie als Kontext an das LLM.

Die wichtigsten Tools 2026 sind Qdrant (Open-Source, sehr beliebt, EU-hostbar), Weaviate (Open-Source mit GraphQL-API), pgvector (eine PostgreSQL-Erweiterung — praktisch, wenn Sie schon Postgres haben) und Pinecone (Managed Cloud-Service, US-fokussiert). Für AT-KMU-Projekte mit DSGVO-Anforderung sind Qdrant Self-Hosted oder pgvector die naheliegende Wahl.

Wichtig: eine Vektor-Datenbank lohnt sich nicht für jede Anwendung. Wenn Ihre Wissensbasis aus 20–30 kurzen Dokumenten besteht, reicht es oft, alle direkt im Prompt-Kontext zu übergeben. Eine Vektor-Datenbank macht ab etwa 50+ Dokumenten oder bei häufigen, unterschiedlichen Suchanfragen Sinn.

Auf einen Blick

Beliebte Tools: Qdrant (Open-Source), Weaviate, pgvector, Pinecone
Self-Hosting: Bei Qdrant, Weaviate und pgvector vollständig möglich
Performance: Sub-100ms Suche bei 1 Million Vektoren ist Standard
Speicherbedarf: Ca. 1–4 KB pro Text-Chunk, je nach Embedding-Modell

Beispiel aus der Praxis

Ein Wissens-Chatbot für eine Hausverwaltung wird mit 200 PDF-Dokumenten gefüttert (Hausordnungen, Mietverträge, FAQ). Jedes Dokument wird in Abschnitte (Chunks) zerlegt, jeder Chunk wird zu einem Embedding und in Qdrant gespeichert. Wenn ein Mieter fragt „Wer ist für die Reparatur der Waschmaschine zuständig?", findet die Vektor-Datenbank automatisch die 3 relevantesten Abschnitte (aus Mietvertrag, Hausordnung und FAQ), Claude formuliert daraus die Antwort.

Wann einsetzen — und wann nicht

Sinnvoll bei

RAG-Setups mit eigener Wissensbasis (Firmendokumente, FAQ, Verträge)
Semantische Suche statt klassischer Keyword-Übereinstimmung
Empfehlungs-Systeme (ähnliche Produkte, Artikel, Lösungen)
Wissensbasis hat 50+ Dokumente oder häufige, vielfältige Suchanfragen

Eher nicht bei

Sehr kleine Wissensbasis (unter 30 Dokumente) — Prompt-Kontext reicht
Strukturierte Daten mit klaren Filterregeln — klassische SQL-Datenbank besser
Exakte Keyword-Suche („alle Verträge mit Klausel X") — Volltext-Index besser

Häufige Fehler

Falsches Chunking — zu groß macht Treffer ungenau, zu klein verliert Kontext
Embedding-Modell und LLM aus unterschiedlichen Sprach-Familien — bricht Retrieval-Qualität ein
Keine Re-Ranking-Stufe nach der Vektor-Suche — der erste Treffer ist nicht immer der beste

Häufige Fragen

Wann brauche ich überhaupt eine Vektor-Datenbank?

Sobald Ihre Wissensbasis größer als 30–50 Dokumente wird oder Sie semantische Suche brauchen (Anfragen in natürlicher Sprache statt Keywords). Für einen Chatbot, der auf Firmen-PDFs antworten soll, ist sie praktisch Standard. Für ein einfaches FAQ mit 10 Einträgen reicht der direkte Prompt-Kontext.

Welche Vektor-Datenbank ist die richtige?

Für AT-KMU mit DSGVO-Fokus: Qdrant Self-Hosted (Open-Source, EU-hostbar, sehr ausgereift) oder pgvector (wenn Sie ohnehin PostgreSQL nutzen). Für Managed Cloud-Setups: Qdrant Cloud mit EU-Region. Pinecone ist beliebt, aber primär US-Hosting — für sensible Daten weniger ideal.

Was kostet eine Vektor-Datenbank im Betrieb?

Self-Hosted (Qdrant, pgvector auf Hostinger): ab €10–30/Monat zusätzlich zum Server. Managed Cloud (Qdrant Cloud, Pinecone): typisch €25–100/Monat bei KMU-Wissensbasis (~100k Vektoren). Bei sehr großen Wissensbasen (Millionen Vektoren) skaliert es entsprechend.

Sind Vektor-Datenbanken DSGVO-konform?

Bei Self-Hosting vollständig (die Daten verlassen Ihren Server nicht). Bei Managed-Cloud-Lösungen abhängig vom Anbieter — Qdrant Cloud mit EU-Region und AVV ist DSGVO-tauglich. Pinecone Standard läuft US-only, was DSGVO-rechtlich heikler ist.

Kann ich später die Vektor-Datenbank wechseln?

Ja, aber mit Aufwand. Die Embeddings selbst sind ein Datenformat (Liste von Zahlen), das jede Vektor-DB versteht. Was Sie neu einspielen müssen: die Daten plus Embeddings. Bei großen Wissensbasen plant man dafür ein Wartungs-Fenster — die Embeddings müssen nicht neu berechnet werden, nur re-importiert.

In der Praxis

In der Praxis: RAG-Chatbot mit Mieter-Wissen aus Hausordnungen

Mieter-Portal mit KI-Chatbot für Standardfragen

Ein eigenes Portal für Ihre Mieter beantwortet Standardfragen via KI-Chatbot rund um die Uhr — auf Basis Ihrer Hausordnung, FAQs und Ansprechpartner. Komplexes wird als Ticket eskaliert.

6–10 h/Woche ZeitersparnisProjekt Setup: 20–30 Tage

Eigene Analyse starten

Konkrete Frage zu diesem Thema?

Im Kennenlerngespräch übersetzen wir den richtigen Begriff in einen umsetzbaren Workflow für Ihr Unternehmen.

Kennenlerngespräch vereinbaren →

← Zurück zum Glossar