KI-Agenten im Unternehmen: Warum 42% der Projekte vor dem Echtbetrieb scheitern
Dr. Oliver Gausmann · 12. März 2026 · 9 Min. Lesezeit
42% der Unternehmen haben 2025 die Mehrheit ihrer KI-Initiativen abgebrochen, bevor sie in den Echtbetrieb gingen1. Im Vorjahr waren es 17%. Gleichzeitig prognostiziert Gartner, dass bis Ende 2026 rund 40% aller Enterprise-Anwendungen KI-Agenten eingebettet haben werden, ausgehend von unter 5% Anfang 20252. Für Unternehmen im Mittelstand stellt sich damit eine operative Frage: Wie schaffen es KI-Agenten im Unternehmen vom Pilotprojekt in den stabilen Betrieb, ohne als teure Lernübung zu enden?
Wie sieht der Markt für KI-Agenten 2026 aus?
Salesforce hat sein Produkt Agentforce in etwas über einem Jahr auf 29.000 Deals und 800 Millionen Dollar Jahresumsatz gebracht3. Von den 150.000 Salesforce-Kunden haben gerade einmal 6% einen bezahlten Agentforce-Vertrag6. Das Muster: Großkunden mit klarem Scope und eigenen Datenteams skalieren. Alle anderen bleiben im Piloten hängen.
ServiceNow testet seit Anfang 2026 eine „Autonomous Workforce", bei der ein KI-Agent intern mehr als 90% der IT-Anfragen bearbeitet, nach eigenen Angaben 99% schneller als ein menschlicher Mitarbeiter4. Gartner rechnet damit, dass über 40% der laufenden Projekte mit KI-Agenten bis Ende 2027 eingestellt werden, weil Kosten, Geschäftswert oder Risikokontrollen fehlen2.
Der Markt wächst 2026 auf geschätzte 10,9 Milliarden Dollar5. Wachstum im Markt bedeutet aber wenig für das einzelne Unternehmen, das gerade einen Piloten laufen hat. Für Unternehmen mit 50 bis 500 Mitarbeitern ist die Lage besonders unübersichtlich. Sie haben weder dedizierte KI-Teams noch Millionenbudgets für Implementierungsprojekte. Was sie haben: kurze Entscheidungswege, Nähe zum operativen Geschäft und die Möglichkeit, schneller zu lernen als Konzerne.
Warum scheitert der Übergang vom Piloten zum Echtbetrieb?
Drei Ursachen tauchen in den Daten konsistent auf. Keine davon ist technisch.
Ursache 1: Die Daten sind nicht bereit. Eine Studie von Precisely und der Drexel University zeigt, dass nur 12% der befragten Organisationen eine Datenqualität haben, die für KI ausreicht7. 70 bis 85% aller gescheiterten KI-Projekte lassen sich auf Probleme mit der Datenarchitektur zurückführen7. Im Mittelstand heißt das konkret: Das CRM ist halb gepflegt, die Vertragsdaten liegen in drei verschiedenen Systemen, und die Kundenkommunikation steckt in E-Mail-Postfächern einzelner Mitarbeiter. Ein KI-Agent, der auf dieser Basis Vertragsreviews oder Kundentickets bearbeiten soll, liefert unzuverlässige Ergebnisse. Im Piloten funktioniert alles, weil der Testdatensatz bereinigt wurde. Im Echtbetrieb bricht die Qualität ein, weil die echten Daten es nicht sind. Deloitte bestätigt: Fast die Hälfte der befragten Unternehmen nennt die Auffindbarkeit und Wiederverwendbarkeit von Daten als zentrale Hürde für ihre KI-Strategie8.
Ursache 2: Prozesse automatisiert, nicht neu gedacht. Deloitte beschreibt ein Phänomen, das sie „Workslop" nennen: Wenn KI-Agenten auf Prozesse aufgesetzt werden, die für Menschen entworfen wurden, entsteht zusätzliche operative Last8. Die erhoffte Effizienz bleibt aus. McKinsey formuliert die richtige Ausgangsfrage so: „Wie würde diese Funktion aussehen, wenn Agenten 60% davon übernehmen?"9. Die meisten Unternehmen stellen diese Frage nicht. Sie nehmen den bestehenden Prozess und ersetzen einzelne Schritte durch einen KI-Agenten. Das führt zu Agenten, die auf Freigaben warten, die nur ein Mensch erteilen kann, oder die Informationen aus Systemen brauchen, auf die sie keinen Zugriff haben.
Im Mittelstand verschärft sich dieses Problem, weil viele Abläufe informell funktionieren. Die erfahrene Mitarbeiterin im Vertriebsinnendienst weiß, welche Kunden priorisiert werden. In ihrem Kopf. Ein KI-Agent hat auf dieses Wissen keinen Zugriff.
Ursache 3: Agenten ohne Einbettung ins Gesamtsystem. Salesforce hat 1.050 IT-Verantwortliche befragt. Ergebnis: Die Hälfte der eingesetzten KI-Agenten arbeitet isoliert, ohne Anbindung an andere Systeme10. In einer separaten Frage gaben 86% an, sie befürchten wachsende Komplexität statt Wertschöpfung, wenn Agenten ohne Integration laufen10.
Wie das im Alltag aussieht: Die Geschäftsleitung testet einen Agenten im Kundensupport. Gleichzeitig probiert die Buchhaltung ein Tool für die Rechnungsprüfung. Das Marketing nutzt ein drittes Produkt für Content-Erstellung. Drei Agenten, drei Anbieter, drei Datensilos. Deloitte bezeichnet KI-Agenten inzwischen als „Silicon Workforce" und empfiehlt, sie wie Mitarbeiter zu führen: mit Onboarding, Leistungsmessung und klaren Verantwortlichkeiten8.
Der blinde Fleck: Prototyp ist Coding, Echtbetrieb ist Engineering
Ein Muster fällt in der Praxis immer wieder auf, das in den Studien zu kurz kommt. Viele Pilotprojekte mit KI-Agenten sind im Kern Coding-Projekte: Ein Entwickler oder ein externer Dienstleister baut einen funktionierenden Prototypen. Der Agent läuft in einer Testumgebung, beantwortet Kundenanfragen oder klassifiziert Tickets. Das reicht, um Stakeholder zu überzeugen.
Der Übergang in den Echtbetrieb erfordert etwas anderes. Er erfordert Software Engineering: Integration in bestehende Systeme (ERP, CRM, Ticketsystem), Anbindung an echte Datenquellen, Fehlerbehandlung, Monitoring, Zugriffsrechte, Wartung. Der Prototyp, der in der Demo beeindruckt hat, muss in ein Ökosystem aus bestehender Software und gewachsenen Datenstrukturen eingebettet werden. Das ist eine andere Disziplin. Und in vielen Unternehmen mit 50 bis 500 Mitarbeitern fehlt genau diese Kompetenz, weil die Entwicklerkapazität für den laufenden Betrieb gebunden ist.
Welche Prozesse eignen sich für KI-Agenten?
Bevor die Frage nach dem „Wie" kommt, steht die Frage nach dem „Wo". Gartner empfiehlt, KI-Agenten nur dort einzusetzen, wo der Geschäftswert klar messbar ist2. Vier Kriterien helfen bei der Auswahl:
Hohes Volumen bei klaren Regeln. Rechnungsprüfung, Vertragsklausel-Checks, Ticket-Triage im Kundensupport. Prozesse, die heute viel Zeit kosten und nach dokumentierbaren Regeln ablaufen. Niedriger Fehlerpreis. Wenn ein KI-Agent beim Sortieren von Support-Tickets einen Fehler macht, ist das korrigierbar. Wenn er bei einer Compliance-Prüfung einen Fehler macht, ist das ein Haftungsrisiko. Am Anfang stehen Prozesse, bei denen Fehler auffallen und behebbar sind. Strukturierte Daten vorhanden. Der Agent braucht saubere Eingangsdaten. Wenn die Vertragsdaten in nicht indexierten PDFs liegen, ist das ein Daten-Projekt, bevor es ein Agent-Projekt werden kann. Menschliche Eskalation definiert. Für jede Entscheidung, die der Agent trifft, muss klar sein: Ab welchem Schwellenwert geht der Fall an einen Menschen?
Ein Rechenbeispiel verdeutlicht die Dimension (Schätzung auf Basis typischer SaaS-Infrastrukturkosten). Ein KI-Agent für die Ticket-Triage in einem 200-Personen-Unternehmen verarbeitet etwa 500 Tickets pro Monat. Die KI-Infrastrukturkosten liegen zwischen 3 und 8 Euro pro Monat. Pro Ticket spart der Agent 15 bis 25 Minuten Bearbeitungszeit. Die Rechnung kippt bei einer Nachbearbeitungsquote von über 30 %, weil ab diesem Punkt die manuelle Korrektur den Zeitgewinn auffrisst. Die Datenqualität entscheidet also direkt über die Wirtschaftlichkeit.
Was Geschäftsführer und Vorstände jetzt tun müssen
Erst den Prozess verstehen, dann das Tool kaufen. Bevor Sie einen KI-Agenten einführen, dokumentieren Sie den Prozess, den er übernehmen soll. Im Detail: Welche Daten fließen ein, welche Entscheidungen fallen, wer wird bei Ausnahmen gefragt, welche Informationen existieren nur in den Köpfen einzelner Mitarbeiter? Ein Flussdiagramm auf Foliensatz-Niveau reicht dafür nicht. McKinsey-Daten zeigen, dass Unternehmen mit messbarem KI-Erfolg doppelt so häufig zuerst ihre Prozesse redesignt haben, bevor sie Technologie ausgewählt haben9.
Datenqualität als Investition behandeln. Wenn nur 12% der Organisationen eine KI-taugliche Datenqualität haben7, löst die IT-Abteilung das nicht nebenbei. Für den Mittelstand bedeutet das: CRM-Hygiene vor Agent-Deployment. Vertragsdaten zentralisieren. Kundenkommunikation indexierbar machen. Das ist unglamourös und dauert Wochen. Ohne diese Arbeit liefert jeder KI-Agent Ergebnisse, die manuell nachgeprüft werden müssen. Dann können Sie den Agenten auch weglassen.
Einen Agent-Verantwortlichen benennen. Auch wenn es nur eine halbe Stelle ist, im Mittelstand braucht es häufig keine komplette KI-Abteilung. Trotzdem braucht jemand den Überblick: Welche Agenten laufen, was kosten sie pro Monat (Token-Verbrauch, API-Gebühren, Wartung), wie entwickelt sich die Ergebnisqualität, welche neuen Anwendungsfälle sind sinnvoll? Ohne diese Rolle entstehen die isolierten Agenten, die Salesforce in seiner Studie beschreibt10.
Nehmen Sie sich einen einzelnen Prozess vor und messen Sie 90 Tage lang drei Kennzahlen: Bearbeitungszeit, Fehlerquote, Kosten pro Vorgang. Kearney berichtet von einem Klienten, der mit diesem Ansatz die laufenden Betriebskosten um über 30% gesenkt hat11. Der Schlüssel war die Beschränkung auf einen Prozess und die saubere Messung, bevor der nächste Bereich hinzukam.
Meine Einordnung
Ich habe in einem meiner Mandate erlebt, wie ein Unternehmen mit rund 200 Mitarbeitern KI-Agenten im Kundensupport einführen wollte. Der Pilot lief hervorragend: bereinigter Datensatz, klare Testfälle, Ticket-Bearbeitungszeit halbiert. Im Echtbetrieb brach die Qualität nach zwei Wochen ein. Die Ursache war banal. Die Hälfte der relevanten Kundeninformationen lag in persönlichen E-Mails und Slack-Nachrichten der Servicemitarbeiter, außerhalb des Ticketsystems. Der Agent arbeitete mit einem Bruchteil des Kontexts, den ein erfahrener Mitarbeiter hatte.
Die Lösung war ein zweiwöchiges Projekt, in dem das Serviceteam seine informellen Wissensquellen in ein strukturiertes System überführt hat. Der gleiche Agent funktionierte danach zuverlässig. Die Kosten für dieses kleine Datenprojekt lagen bei einem Bruchteil dessen, was ein neues KI-Tool gekostet hätte.
Meine Erfahrung deckt sich mit dem, was die Daten zeigen. Der Engpass bei KI-Agenten im Unternehmen liegt in der Vorbereitung: saubere Daten, durchdachte Prozesse, klare Verantwortlichkeiten. Das klingt nach Grundlagenarbeit, weil es Grundlagenarbeit ist. Unternehmen mit 50 bis 500 Mitarbeitern haben dabei einen strukturellen Vorteil. Sie können in Wochen umsetzen, wofür Konzerne Monate brauchen. Wer diesen Vorteil nutzt und mit einem Prozess anfängt, wird zu den 58% gehören, deren Projekte den Echtbetrieb erreichen.
Wie Sie die KI-Reife Ihres Unternehmens systematisch bewerten, bevor Sie in Agenten investieren, zeigt der AI Readiness Check für den Mittelstand der Convios GmbH. Den regulatorischen Rahmen für KI-Systeme, der ab August 2026 gilt, finden Sie im EU AI Act Enforcement Guide.
Quellen
1S&P Global Market Intelligence, AI & Machine Learning Use Cases 2025
2Gartner, Agentic AI Project Cancellation Forecast Juni 2025
3Salesforce Q4 FY2026 Earnings, Agentforce ARR
4ServiceNow Autonomous Workforce, L1 Service Desk AI
5Precedence Research, Agentic AI Market 2026
6Salesforce Ben, Agentforce Adoption Analysis
7Precisely und Drexel University, AI Data Quality Study 2025
8Deloitte Tech Trends 2026, Silicon Workforce
9McKinsey, Seizing the Agentic AI Advantage 2025
Hat Ihnen dieser Artikel geholfen?
Sie haben Fragen zu diesem Thema?
Gespräch vereinbaren