KI-Glossar

LLM (Large Language Model)

Großes Sprachmodell wie GPT-4, Claude oder Mistral — die Engine, die hinter den meisten KI-Anwendungen steckt und Text versteht und erzeugt.

Ein LLM ist ein Modell, das mit enormen Mengen Text trainiert wurde, um Sprache zu verstehen und sinnvolle Antworten zu erzeugen. Wenn man heute im Business-Kontext von „KI" spricht, meint man fast immer genau diese Modelle.

Bekannte Beispiele: GPT (OpenAI), Claude (Anthropic), Gemini (Google), Mistral (Frankreich, EU-Hosting möglich). LLMs allein lösen keine Geschäftsprobleme — sie müssen mit den richtigen Daten, Werkzeugen und Prozessen kombiniert werden. Genau das ist der Kern moderner KI-Automation.

Modelle unterscheiden sich in drei für die Praxis relevanten Dimensionen. Erstens Größe und Qualität — größere Modelle (Claude Opus, GPT-4o) verstehen komplexere Aufgaben, kosten aber pro Anfrage 5- bis 20-mal mehr als kleinere Modelle (Claude Haiku, GPT-4o-mini). Zweitens Hosting — US-Anbieter wie OpenAI und Anthropic liefern Top-Qualität, EU-Anbieter wie Mistral oder Aleph Alpha bieten DSGVO-bewusstere Setups. Drittens spezialisiert versus generalistisch — manche Modelle sind auf Code, andere auf Sprachübersetzung oder strukturierte Datenextraktion optimiert.

In produktiven KMU-Workflows ist die wichtigste Entscheidung selten „welches Modell ist das beste", sondern „welches Modell reicht für diese Aufgabe — und wann sollte ich auf ein größeres umschwenken". Eine Mail-Klassifikation, eine FAQ-Beantwortung, eine Rechnungsdatenextraktion läuft mit kleinen Modellen oft genauso gut wie mit teuren — bei einem Bruchteil der Kosten.

Auf einen Blick

Marktführer 2026
GPT (OpenAI), Claude (Anthropic), Gemini (Google), Mistral (FR)
EU-Hosting
Mistral (Frankreich), Aleph Alpha (Deutschland), Open-Source self-hosted
Kostenfaktor
Modellgröße plus Token-Verbrauch — bis zu 20× Spreizung
Typische Tokens
500–3.000 für Klassifikation, 5.000–50.000 für Recherche
Beispiel aus der Praxis

Ein internes Wissens-Tool nutzt Claude als Antwort-Engine, kombiniert es per RAG mit Zugriff auf interne PDFs — und liefert Mitarbeiteranfragen in Sekunden statt Stunden.

Wann einsetzen — und wann nicht

Sinnvoll bei

  • Sprachverarbeitung — Verstehen, Generieren, Übersetzen
  • Klassifikation unstrukturierter Texte (Mails, Dokumente, Anfragen)
  • Strukturierte Datenextraktion aus Freitext
  • Generative Aufgaben (Texte, Zusammenfassungen, Übersetzungen)

Eher nicht bei

  • Klar regelbasierte Entscheidungen — If-Then reicht, ist billiger und deterministisch
  • Numerische Berechnungen oder logisches Reasoning ohne Tool-Unterstützung
  • Sehr kleine, hochrepetitive Aufgaben — klassische Regex oder ML reichen

Häufige Fehler

  • Immer das teuerste Modell nehmen statt zu prüfen, ob ein kleineres reicht
  • Keine Versionierung der Prompts — Modell-Updates ändern Verhalten, nichts ist mehr reproduzierbar
  • Kein Output-Validation-Layer — das Modell halluziniert, die Anwendung übernimmt es ungeprüft

Häufige Fragen

Welches LLM soll ich für mein KMU nehmen?
Faustregel: Für 80 Prozent aller Aufgaben reicht ein kleines, günstiges Modell (Claude Haiku, GPT-4o-mini). Erst bei komplexen Aufgaben (langen Recherchen, mehrstufigem Reasoning, präzisem Code) lohnt sich der Wechsel auf ein großes Modell. Wer einsteigt, sollte mit dem kleinen anfangen und nur dort upgraden, wo die Trefferquote nicht reicht.
Sind LLMs DSGVO-konform?
Es kommt auf das Setup an. US-Modelle können DSGVO-konform genutzt werden, wenn keine personenbezogenen Daten übermittelt werden oder ein Enterprise-Vertrag mit EU-Datenresidenz und „no training" besteht. EU-Modelle (Mistral, selbst gehostete Open-Source-Modelle wie Llama oder Qwen) machen die Compliance deutlich einfacher.
Wie aktuell ist das Wissen eines LLMs?
Begrenzt durch den Trainings-Cut-Off — typisch 6–18 Monate alt. Für aktuelle Informationen braucht es Web-Such-Anbindung oder RAG. Modelle, die ihren Cut-Off „raten" oder Daten erfinden, sind ein klassisches Halluzinations-Risiko.
Kann ich LLMs für sensible Inhalte nutzen?
Mit Vorsicht und klarem Setup. Bei besonders sensiblen Daten (Patientendaten, Anwaltskorrespondenz, Finanzdaten) empfiehlt sich ein selbst gehostetes Open-Source-Modell oder ein EU-Anbieter mit Auftragsverarbeitungsvertrag und „no training". US-Cloud-APIs ohne Enterprise-Vertrag sind dafür nicht geeignet.
In der Praxis

In der Praxis: LLM klassifiziert eingehende Mieter-Mails

Mieter-Mails automatisch sortieren & weiterleiten

KI klassifiziert eingehende Mieter-Mails, sortiert sie in passende Gmail-Labels (oder Outlook-Ordner), antwortet automatisch mit Eingangsbestätigung und Ticketnummer und benachrichtigt den zuständigen Verwalter.

5–8 h/Woche ZeitersparnisQuick Win Setup: 3–5 Tage
Eigene Analyse starten

Konkrete Frage zu diesem Thema?

Im Kennenlerngespräch übersetzen wir den richtigen Begriff in einen umsetzbaren Workflow für Ihr Unternehmen.

Kennenlerngespräch vereinbaren →