KI-Glossar

Multi-Agent-System

Setup aus mehreren spezialisierten KI-Agenten, die zusammenarbeiten — jeder mit klarer Rolle, statt einen Allzweck-Agenten alles auf einmal versuchen zu lassen.

Ein einzelner Agent, der alles erledigt, wird unzuverlässig: Er recherchiert, schreibt, prüft und versendet — und macht in jedem Schritt kleine Fehler, die sich addieren. Ein Multi-Agent-System teilt die Arbeit auf: Ein Agent recherchiert, ein zweiter strukturiert, ein dritter formuliert, ein vierter prüft.

Jeder Agent hat einen klaren Auftrag, eigene Werkzeuge und einen Prompt, der ausschließlich auf seine Rolle zugeschnitten ist. Die Qualität steigt deutlich, Fehler werden lokal isolierbar — und ein Mensch kann an genau einer Stelle eingreifen, ohne den ganzen Workflow umzuwerfen.

Aufbauseitig gibt es drei verbreitete Topologien. „Sequenzielle Pipeline" — Agent A liefert an B, B an C, jeder Schritt prüfbar. „Supervisor mit Spezialisten" — ein Supervisor-Agent koordiniert, delegiert an Spezialisten und sammelt die Ergebnisse. „Peer-to-Peer mit gemeinsamem Gedächtnis" — Agenten arbeiten parallel auf einem geteilten Zustand. Für KMU-Praxis ist die sequenzielle Pipeline meist die richtige Wahl, weil sie testbar, debugbar und kostenkontrolliert ist.

Multi-Agent-Systeme zahlen sich erst ab einer gewissen Komplexität aus. Wenn ein einzelner Agent mit klarem Prompt und drei bis vier Tool-Calls die Aufgabe stabil löst, ist ein zweiter Agent meist Overhead. Sobald aber das Briefing für einen einzelnen Agenten so lang wird, dass die Output-Qualität leidet, oder wenn unterschiedliche Schritte unterschiedliche Modelle brauchen (z.B. ein günstiges für die Klassifikation, ein teures für die Formulierung), ist die Aufteilung in mehrere Agenten der saubere Weg.

Auf einen Blick

Typische Topologien: Sequenzielle Pipeline, Supervisor mit Spezialisten, Peer-to-Peer
Lohn-Schwelle: Ab 4–6 Schritten oder bei nötigem Modell-Mix
Kosten: 2–5× ein einzelner Agent — mehr LLM-Calls pro Lauf
Frameworks: LangGraph, CrewAI, AutoGen, n8n AI Agent Nodes

Beispiel aus der Praxis

Ein Content-Workflow nutzt vier Agenten: Recherche-Agent (sammelt Quellen), Outline-Agent (erstellt Gliederung), Schreib-Agent (formuliert), Lektorat-Agent (prüft Fakten und Stil). Das Ergebnis ist konsistenter als bei einem einzigen „Generalisten" und im Fehlerfall klar reparierbar.

Wann einsetzen — und wann nicht

Sinnvoll bei

Aufgabe lässt sich klar in spezialisierte Teilaufgaben zerlegen
Verschiedene Schritte profitieren von verschiedenen Modellen (klein für Klassifikation, groß für Formulierung)
Einzelner Agent mit langem Prompt liefert inkonsistente Ergebnisse
Audit- oder Review-Schritt soll von einer anderen Instanz kommen als die Generierung

Eher nicht bei

Einzelner Agent löst die Aufgabe stabil — kein Bedarf, künstlich aufzuteilen
Latenz ist kritisch — jeder Agent kostet zusätzliche Hunderte bis Tausende Millisekunden
Kostenkontrolle ist eng — Multi-Agent kostet schnell ein Vielfaches

Häufige Fehler

Zu kleinteilige Aufteilung — ein „Wortzähl-Agent" und ein „Großschreib-Agent" sind unsinnige Spezialisierung
Kein klares Übergabeformat zwischen den Agenten (JSON-Schema fehlt) — Daten gehen verloren oder werden inkonsistent interpretiert
Endloser Loop zwischen zwei Agenten, die sich gegenseitig korrigieren — Schritt-Limit setzen

Häufige Fragen

Wann lohnt sich Multi-Agent gegenüber einem einzelnen Agenten?

Faustregel: wenn ein einzelner Agent in einem Briefing mehr als 1.000 Wörter Anweisungen für unterschiedliche Teilaufgaben braucht, oder wenn die Ergebnisqualität für eine der Teilaufgaben dauerhaft schwankt. Bei einfachen Aufgaben mit klarer Linie ist ein einzelner Agent die richtige Wahl.

Können die Agenten unterschiedliche Modelle nutzen?

Ja, und das ist oft sinnvoll. Klassifikation und Routing mit Claude Haiku oder GPT-4o-mini (schnell, günstig). Komplexe Recherche oder kreative Generierung mit Claude Sonnet oder GPT-4o (teurer, besser). Pro Schritt das passende Modell wählen — spart 50–70 Prozent Kosten gegenüber „alles mit dem großen Modell".

Wie debugge ich ein Multi-Agent-System?

Strukturiertes Logging pro Agent-Aufruf — Input, gewählte Tools, Tool-Outputs, finaler Agent-Output. Bei Fehlern lässt sich so genau eingrenzen, welcher Agent die falsche Entscheidung getroffen hat. Visualisierungstools (LangSmith, Anthropic Workbench) helfen, die Schritte als Trace darzustellen.

Sind Multi-Agent-Systeme schon produktionsreif für KMU?

Ja, in fokussierten Pipelines mit klar abgegrenzten Schritten. Was funktioniert: Content-Pipelines (Recherche → Outline → Schreiben → Review), Lead-Anreicherung (Suche → Klassifikation → Personalisierung), Dokument-Verarbeitung (Extraktion → Validierung → Strukturierung). Was noch wackelt: lange autonome Verhandlungs- oder Recherche-Ketten ohne Mensch.

In der Praxis

In der Praxis: Audio → Transkript → Struktur → Protokoll

Eigentümerversammlungs-Protokolle aus Audio in 20 Minuten

Versammlung wird per Handy oder Aufnahmegerät aufgezeichnet. KI transkribiert, erstellt ein WEG-konformes Protokoll mit Beschlüssen, Stimmenverteilung und TOPs. Sie korrigieren nur noch.

1.5–3 h/Woche ZeitersparnisMittlerer Aufwand Setup: 5–7 Tage

Eigene Analyse starten

Konkrete Frage zu diesem Thema?

Im Kennenlerngespräch übersetzen wir den richtigen Begriff in einen umsetzbaren Workflow für Ihr Unternehmen.

Kennenlerngespräch vereinbaren →

← Zurück zum Glossar