KI-Glossar

LLM (Large Language Model)

Großes Sprachmodell wie GPT-4, Claude oder Mistral — die Engine, die hinter den meisten KI-Anwendungen steckt und Text versteht und erzeugt.

Ein LLM ist ein Modell, das mit enormen Mengen Text trainiert wurde, um Sprache zu verstehen und sinnvolle Antworten zu erzeugen. Wenn man heute im Business-Kontext von „KI" spricht, meint man fast immer genau diese Modelle.

Bekannte Beispiele: GPT (OpenAI), Claude (Anthropic), Gemini (Google), Mistral (Frankreich, EU-Hosting möglich). LLMs allein lösen keine Geschäftsprobleme — sie müssen mit den richtigen Daten, Werkzeugen und Prozessen kombiniert werden. Genau das ist der Kern moderner KI-Automation.

Modelle unterscheiden sich in drei für die Praxis relevanten Dimensionen. Erstens Größe und Qualität — größere Modelle (Claude Opus, GPT-4o) verstehen komplexere Aufgaben, kosten aber pro Anfrage 5- bis 20-mal mehr als kleinere Modelle (Claude Haiku, GPT-4o-mini). Zweitens Hosting — US-Anbieter wie OpenAI und Anthropic liefern Top-Qualität, EU-Anbieter wie Mistral oder Aleph Alpha bieten DSGVO-bewusstere Setups. Drittens spezialisiert versus generalistisch — manche Modelle sind auf Code, andere auf Sprachübersetzung oder strukturierte Datenextraktion optimiert.

In produktiven KMU-Workflows ist die wichtigste Entscheidung selten „welches Modell ist das beste", sondern „welches Modell reicht für diese Aufgabe — und wann sollte ich auf ein größeres umschwenken". Eine Mail-Klassifikation, eine FAQ-Beantwortung, eine Rechnungsdatenextraktion läuft mit kleinen Modellen oft genauso gut wie mit teuren — bei einem Bruchteil der Kosten.

Auf einen Blick

Marktführer 2026: GPT (OpenAI), Claude (Anthropic), Gemini (Google), Mistral (FR)
EU-Hosting: Mistral (Frankreich), Aleph Alpha (Deutschland), Open-Source self-hosted
Kostenfaktor: Modellgröße plus Token-Verbrauch — bis zu 20× Spreizung
Typische Tokens: 500–3.000 für Klassifikation, 5.000–50.000 für Recherche

Beispiel aus der Praxis

Ein internes Wissens-Tool nutzt Claude als Antwort-Engine, kombiniert es per RAG mit Zugriff auf interne PDFs — und liefert Mitarbeiteranfragen in Sekunden statt Stunden.

Wann einsetzen — und wann nicht

Sinnvoll bei

Sprachverarbeitung — Verstehen, Generieren, Übersetzen
Klassifikation unstrukturierter Texte (Mails, Dokumente, Anfragen)
Strukturierte Datenextraktion aus Freitext
Generative Aufgaben (Texte, Zusammenfassungen, Übersetzungen)

Eher nicht bei

Klar regelbasierte Entscheidungen — If-Then reicht, ist billiger und deterministisch
Numerische Berechnungen oder logisches Reasoning ohne Tool-Unterstützung
Sehr kleine, hochrepetitive Aufgaben — klassische Regex oder ML reichen

Häufige Fehler

Immer das teuerste Modell nehmen statt zu prüfen, ob ein kleineres reicht
Keine Versionierung der Prompts — Modell-Updates ändern Verhalten, nichts ist mehr reproduzierbar
Kein Output-Validation-Layer — das Modell halluziniert, die Anwendung übernimmt es ungeprüft

Häufige Fragen

Welches LLM soll ich für mein KMU nehmen?

Faustregel: Für 80 Prozent aller Aufgaben reicht ein kleines, günstiges Modell (Claude Haiku, GPT-4o-mini). Erst bei komplexen Aufgaben (langen Recherchen, mehrstufigem Reasoning, präzisem Code) lohnt sich der Wechsel auf ein großes Modell. Wer einsteigt, sollte mit dem kleinen anfangen und nur dort upgraden, wo die Trefferquote nicht reicht.

Sind LLMs DSGVO-konform?

Es kommt auf das Setup an. US-Modelle können DSGVO-konform genutzt werden, wenn keine personenbezogenen Daten übermittelt werden oder ein Enterprise-Vertrag mit EU-Datenresidenz und „no training" besteht. EU-Modelle (Mistral, selbst gehostete Open-Source-Modelle wie Llama oder Qwen) machen die Compliance deutlich einfacher.

Wie aktuell ist das Wissen eines LLMs?

Begrenzt durch den Trainings-Cut-Off — typisch 6–18 Monate alt. Für aktuelle Informationen braucht es Web-Such-Anbindung oder RAG. Modelle, die ihren Cut-Off „raten" oder Daten erfinden, sind ein klassisches Halluzinations-Risiko.

Kann ich LLMs für sensible Inhalte nutzen?

Mit Vorsicht und klarem Setup. Bei besonders sensiblen Daten (Patientendaten, Anwaltskorrespondenz, Finanzdaten) empfiehlt sich ein selbst gehostetes Open-Source-Modell oder ein EU-Anbieter mit Auftragsverarbeitungsvertrag und „no training". US-Cloud-APIs ohne Enterprise-Vertrag sind dafür nicht geeignet.

In der Praxis

In der Praxis: LLM klassifiziert eingehende Mieter-Mails

Mieter-Mails automatisch sortieren & weiterleiten

KI klassifiziert eingehende Mieter-Mails, sortiert sie in passende Gmail-Labels (oder Outlook-Ordner), antwortet automatisch mit Eingangsbestätigung und Ticketnummer und benachrichtigt den zuständigen Verwalter.

5–8 h/Woche ZeitersparnisQuick Win Setup: 3–5 Tage

Eigene Analyse starten

Konkrete Frage zu diesem Thema?

Im Kennenlerngespräch übersetzen wir den richtigen Begriff in einen umsetzbaren Workflow für Ihr Unternehmen.

Kennenlerngespräch vereinbaren →

← Zurück zum Glossar