Vektor-Datenbank (Vector Database)
Spezialisierte Datenbank, die Embeddings (mathematische Vektoren) speichert und nach semantischer Ähnlichkeit durchsucht — Kernkomponente für RAG-Setups und KI-gestützte Suche.
Eine Vektor-Datenbank ist ein Datenspeicher, der für eine besondere Suche optimiert ist: nicht nach exakter Übereinstimmung („zeige mir alle Dokumente mit dem Wort 'Vertrag'"), sondern nach semantischer Ähnlichkeit („zeige mir Dokumente, die inhaltlich am ähnlichsten zu dieser Frage sind"). Möglich wird das, indem Texte, Bilder oder Audio vorher in Embeddings (mathematische Vektoren) umgewandelt und dann als Punkte in einem hochdimensionalen Raum gespeichert werden.
Die Suche funktioniert geometrisch: Bei einer Anfrage wird auch die Frage in einen Vektor umgewandelt, und die Datenbank sucht die nächstgelegenen gespeicherten Vektoren — die semantisch ähnlichsten Inhalte. Das ist die Grundlage für RAG-Systeme: ein Wissens-Chatbot, der auf eigene Firmendokumente antwortet, sucht zuerst die relevantesten Abschnitte in der Vektor-Datenbank und übergibt sie als Kontext an das LLM.
Die wichtigsten Tools 2026 sind Qdrant (Open-Source, sehr beliebt, EU-hostbar), Weaviate (Open-Source mit GraphQL-API), pgvector (eine PostgreSQL-Erweiterung — praktisch, wenn Sie schon Postgres haben) und Pinecone (Managed Cloud-Service, US-fokussiert). Für AT-KMU-Projekte mit DSGVO-Anforderung sind Qdrant Self-Hosted oder pgvector die naheliegende Wahl.
Wichtig: eine Vektor-Datenbank lohnt sich nicht für jede Anwendung. Wenn Ihre Wissensbasis aus 20–30 kurzen Dokumenten besteht, reicht es oft, alle direkt im Prompt-Kontext zu übergeben. Eine Vektor-Datenbank macht ab etwa 50+ Dokumenten oder bei häufigen, unterschiedlichen Suchanfragen Sinn.
Auf einen Blick
- Beliebte Tools
- Qdrant (Open-Source), Weaviate, pgvector, Pinecone
- Self-Hosting
- Bei Qdrant, Weaviate und pgvector vollständig möglich
- Performance
- Sub-100ms Suche bei 1 Million Vektoren ist Standard
- Speicherbedarf
- Ca. 1–4 KB pro Text-Chunk, je nach Embedding-Modell
Ein Wissens-Chatbot für eine Hausverwaltung wird mit 200 PDF-Dokumenten gefüttert (Hausordnungen, Mietverträge, FAQ). Jedes Dokument wird in Abschnitte (Chunks) zerlegt, jeder Chunk wird zu einem Embedding und in Qdrant gespeichert. Wenn ein Mieter fragt „Wer ist für die Reparatur der Waschmaschine zuständig?", findet die Vektor-Datenbank automatisch die 3 relevantesten Abschnitte (aus Mietvertrag, Hausordnung und FAQ), Claude formuliert daraus die Antwort.
Wann einsetzen — und wann nicht
Sinnvoll bei
- RAG-Setups mit eigener Wissensbasis (Firmendokumente, FAQ, Verträge)
- Semantische Suche statt klassischer Keyword-Übereinstimmung
- Empfehlungs-Systeme (ähnliche Produkte, Artikel, Lösungen)
- Wissensbasis hat 50+ Dokumente oder häufige, vielfältige Suchanfragen
Eher nicht bei
- Sehr kleine Wissensbasis (unter 30 Dokumente) — Prompt-Kontext reicht
- Strukturierte Daten mit klaren Filterregeln — klassische SQL-Datenbank besser
- Exakte Keyword-Suche („alle Verträge mit Klausel X") — Volltext-Index besser
Häufige Fehler
- Falsches Chunking — zu groß macht Treffer ungenau, zu klein verliert Kontext
- Embedding-Modell und LLM aus unterschiedlichen Sprach-Familien — bricht Retrieval-Qualität ein
- Keine Re-Ranking-Stufe nach der Vektor-Suche — der erste Treffer ist nicht immer der beste
Häufige Fragen
Wann brauche ich überhaupt eine Vektor-Datenbank?
Welche Vektor-Datenbank ist die richtige?
Was kostet eine Vektor-Datenbank im Betrieb?
Sind Vektor-Datenbanken DSGVO-konform?
Kann ich später die Vektor-Datenbank wechseln?
In der Praxis: RAG-Chatbot mit Mieter-Wissen aus Hausordnungen
Mieter-Portal mit KI-Chatbot für Standardfragen
Ein eigenes Portal für Ihre Mieter beantwortet Standardfragen via KI-Chatbot rund um die Uhr — auf Basis Ihrer Hausordnung, FAQs und Ansprechpartner. Komplexes wird als Ticket eskaliert.
Eigene Analyse startenKonkrete Frage zu diesem Thema?
Im Kennenlerngespräch übersetzen wir den richtigen Begriff in einen umsetzbaren Workflow für Ihr Unternehmen.
Kennenlerngespräch vereinbaren →