Eine Führungskraft ordnet allein in einem verglasten Besprechungsraum ein Raster aus leeren Karten, ein Bild für Entscheidungsrechte und KI-Architektur.
STRATEGIE & MANAGEMENT

Die KI-Wertlücke 2025: 88 Prozent nutzen KI, nur 6 Prozent verdienen daran

Fast jedes Unternehmen nutzt inzwischen KI, aber kaum eines sieht sie am Ergebnis. Die McKinsey-Erhebung 2025 beziffert die Lücke: 88 Prozent regelmäßige Nutzung, nur rund 6 Prozent mit nennenswerter, skalierter EBIT-Wirkung. Wer trotz Lizenz nichts am Ergebnis merkt, gehört damit zur klaren Mehrheit. Die übliche Diagnose, es fehle am besseren Modell, an mehr Schulung oder am richtigen Use Case, verfehlt den Kern. Die Daten zeigen einen anderen Hebel: KI ist eine Architekturfrage, nicht zuerst eine Technikfrage.

Dieser Artikel ordnet acht Stränge ein: was die McKinsey-Zahlen wirklich sagen, warum die übliche Diagnose meistens falsch ist, warum Architektur statt Technik der eigentliche Hebel ist, warum es eine namentlich verantwortliche Person braucht, warum ein klarer Default die Schulung schlägt, wie die deutsche und europäische Lage aussieht, welche Risiken die These selbst hat und was Unternehmen jetzt konkret tun sollten.

Zusammenfassung

Die McKinsey-Erhebung State of AI 2025 (November 2025, rund 1.993 Befragte in etwa 105 Ländern) zeigt eine Lücke zwischen Nutzung und Wert: 88 Prozent der Organisationen nutzen KI regelmäßig in mindestens einer Funktion, nach 78 Prozent im Vorjahr, aber nur etwa 39 Prozent berichten überhaupt eine EBIT-Wirkung auf Unternehmensebene, die meisten davon unter 5 Prozent. Nur rund 6 Prozent sind KI-Spitzenreiter mit mehr als 5 Prozent EBIT-Anteil aus KI. Die übrigen rund 94 Prozent haben damit kein Modellproblem, sondern ein Wertproblem. Die übliche Diagnose, es fehle am besseren Modell, an mehr Schulung oder am richtigen Use Case, trägt nicht, denn Spitzenreiter und Nachzügler nutzen dieselben Modelle. Laut McKinsey (März 2025) hat die grundlegende Neugestaltung von Arbeitsabläufen den stärksten Zusammenhang mit dem EBIT, doch nur 21 Prozent der Anwender hatten überhaupt einen Workflow grundlegend umgebaut, und CEO-Aufsicht über die KI-Governance korreliert bei größeren Unternehmen am stärksten mit der EBIT-Wirkung. Daraus folgt die Architektur-These: wer entscheidet was, mit welchen Regeln, gemessen woran. Drei Hebel stechen heraus, ein klarer Default im Arbeitsablauf, ein Mandat statt reiner Schulungsmenge und ein benannter, mehrjährig verantwortlicher KI-Architektur-Eigner. IBM (Mai 2026) berichtet, dass 76 Prozent der Unternehmen einen Chief AI Officer haben, nach 26 Prozent ein Jahr zuvor, betont aber, dass das Mandat zählt, nicht der Titel. Eine MIT-NANDA-Studie (August 2025) ordnet rund 95 Prozent der generativen KI-Piloten als ohne messbaren Ergebnisbeitrag ein und nennt als Hauptgrund eine Lernlücke der Organisation. Die Zahlen haben Grenzen: McKinsey misst EBIT per Selbstauskunft, und erzwungene Defaults können nach hinten losgehen. Für Unternehmen heißt das: einen Eigner mit Mandat benennen, Entscheidungsrechte, Regeln und Messgrößen am EBIT festlegen, einen vollständigen Arbeitsablauf umbauen und Wert messen, nicht Lizenzen.

88 Prozent
der Organisationen nutzen KI regelmäßig in mindestens einer Funktion
McKinsey, State of AI 2025
6 Prozent
KI-Spitzenreiter mit mehr als 5 Prozent EBIT-Anteil aus KI
McKinsey, State of AI 2025
39 Prozent
berichten überhaupt EBIT-Wirkung, die meisten unter 5 Prozent
McKinsey, State of AI 2025
21 Prozent
hatten einen Workflow grundlegend umgebaut, der größte EBIT-Hebel
McKinsey, März 2025
95 Prozent
der generativen KI-Piloten ohne messbaren Ergebnisbeitrag
MIT Project NANDA, 2025
76 Prozent
haben einen Chief AI Officer, nach 26 Prozent im Vorjahr
IBM, Mai 2026

Die Zahl, die fast alle falsch lesen

88 Prozent der Organisationen nutzen KI regelmäßig in mindestens einer Funktion, aber nur rund 6 Prozent ziehen daraus eine nennenswerte, skalierte EBIT-Wirkung. Das ist das Kernergebnis der McKinsey-Erhebung State of AI 2025. Wer KI bereits im Haus hat und trotzdem nichts am Ergebnis sieht, ist damit nicht die Ausnahme, sondern der Normalfall. Die Lücke zwischen Einsatz und Wirkung ist die eigentliche Geschichte hinter den Adoptionsrekorden.

Die Zahlen lohnen einen genauen Blick. Die Nutzung ist in einem Jahr von 78 auf 88 Prozent gestiegen, fast flächendeckend. Doch nur etwa 39 Prozent der Befragten berichten überhaupt eine EBIT-Wirkung auf Unternehmensebene, und die meisten davon beziffern sie auf unter 5 Prozent des Ergebnisses. Als KI-Spitzenreiter, mit mehr als 5 Prozent EBIT-Anteil aus KI und berichtetem deutlichem Mehrwert, gelten nur rund 6 Prozent, exakt 5,5 Prozent der rund 1.993 Befragten in etwa 105 Ländern. Die Erhebung wurde im Juni und Juli 2025 durchgeführt.

Daraus folgt die unbequeme Lesehilfe. Die übrigen rund 94 Prozent haben kein Modellproblem, sie haben ein Wertproblem. Die KI ist da, sie wird genutzt, und trotzdem bleibt die Wirkung auf das Ergebnis aus. Genau dieses Muster zeigt sich auch an anderer Stelle: dass ein hoher Anteil von Initiativen nie in der Produktion ankommt, hat innobu bereits in der Analyse zur Rebuild-Era der KI-Agenten beschrieben. Die Wertlücke ist also kein Einzelbefund, sondern ein wiederkehrender Befund.

Warum die Diagnose meistens falsch ist

Drei Erklärungen dominieren die Diskussion, und alle drei verfehlen den Kern. In den meisten Gesprächen über stockende KI-Wertschöpfung fällt eine dieser drei Antworten. Die Daten der McKinsey-Erhebung stützen jedoch keine davon, denn der Unterschied zwischen den 6 Prozent und dem Rest liegt nicht in der Technik. Wer die Diagnose falsch stellt, investiert konsequent weiter in das Falsche.

Die erste Antwort lautet: Wir brauchen das bessere Modell. Doch Spitzenreiter und Nachzügler greifen auf denselben Markt an Modellen zu, oft auf dieselben Anbieter. Der Unterschied liegt in der Organisation, nicht in der Modellgüte. Die zweite Antwort lautet: Wir brauchen mehr Schulung. Schulung ohne Befugnis erzeugt jedoch geschulte Personen ohne Mandat, und die Nutzungsquote bleibt niedrig. Die dritte Antwort lautet: Wir brauchen den richtigen Use Case. Verstreute Einzelfälle summieren sich aber nicht zu EBIT, solange niemand Entscheidungsrechte und Messung verantwortet.

Wie schwer die Lücke wiegt, zeigt eine vielzitierte Studie des MIT-Programms NANDA vom August 2025. Sie ordnet rund 95 Prozent der untersuchten generativen KI-Piloten als ohne messbaren Ergebnisbeitrag ein. Als Hauptgrund nennen die Autoren keine schwachen Modelle, sondern eine Lernlücke der Organisation: Die Werkzeuge passen sich nicht an die Arbeitsabläufe an, und die Organisation lernt nicht, sie richtig einzusetzen. Diese Befunde decken sich mit dem älteren KI-Produktivitätsparadoxon , das schon zeigte, wie KI-Investitionen ohne organisatorische Änderung verpuffen.

Der eigentliche Hebel: Architektur, nicht Technik

Der größte messbare EBIT-Hebel ist die Neugestaltung der Arbeitsabläufe, nicht die Wahl des Modells. McKinsey hat in der Erhebung vom März 2025 rund 25 organisatorische Merkmale getestet, und der grundlegende Umbau von Workflows hatte den stärksten Zusammenhang mit dem Ergebnis. Bemerkenswert ist die Gegenzahl: Nur 21 Prozent der Anwender hatten zu diesem Zeitpunkt überhaupt einen Arbeitsablauf grundlegend umgebaut. Der wirksamste Hebel war also zugleich der am seltensten gezogene.

Vergleichsdiagramm: KI als Technikfrage führt zu niedriger Nutzung ohne EBIT-Wirkung, KI als Architekturfrage zu skalierter Nutzung mit messbarer EBIT-Wirkung.
Zwei Wege im Vergleich: KI als Technikfrage endet bei einer Lizenz mit niedriger Nutzung, KI als Architekturfrage führt über Default, Mandat und einen benannten Eigner zu messbarer EBIT-Wirkung.

Architektur meint hier nicht die IT-Architektur, sondern die organisatorische Ordnung. Es geht um drei nüchterne Fragen: wer entscheidet was, mit welchen Regeln, gemessen woran. Eine KI-Architekturfrage klärt Entscheidungsrechte, verbindliche Leitplanken und Messgrößen, die am EBIT hängen, statt an der Zahl der ausgerollten Werkzeuge. Solange KI als reine Technikfrage behandelt wird, bleibt sie eine Lizenz mit niedriger Nutzung. Sobald sie als Architekturfrage behandelt wird, beginnt sie, das Ergebnis zu bewegen.

Das Profil der Spitzenreiter bestätigt das Muster. Sie sind etwa dreimal so häufig dabei, Arbeitsabläufe grundlegend neu zu gestalten, und zeigen etwa dreimal so häufig eine starke Beteiligung der Führung. Mehr als ein Drittel von ihnen steckt über 20 Prozent des Digitalbudgets in KI, sie investieren also rund fünfmal so häufig substanziell. Die Trennlinie verläuft damit nicht zwischen guten und schlechten Modellen, sondern zwischen Organisationen, die ihre Abläufe und Entscheidungswege umbauen, und solchen, die ein neues Werkzeug nur über alte Prozesse legen.

Verantwortung mit Namen: der KI-Architektur-Eigner

Ohne eine namentlich verantwortliche Person bleibt KI eine Lizenz mit niedriger Nutzung. Entscheidungsrechte, Regeln und Messung brauchen einen Eigner, der sie zusammenhält und über Funktionsgrenzen hinweg durchsetzt. Die Praxis bewegt sich in diese Richtung, der Titel allein bringt aber nichts.

Eine verantwortliche Führungskraft erläutert drei Kolleginnen und Kollegen ein abstraktes Ablaufdiagramm am Whiteboard, ein Bild für ein klares Mandat.
Verantwortung mit Namen: Eine Person mit Mandat führt den Umbau der Arbeitsabläufe, statt KI als verstreutes Werkzeug ohne Eigner zu betreiben.

Die Zahlen zeigen die Bewegung. Laut der IBM-CEO-Studie vom Mai 2026 haben 76 Prozent der Unternehmen inzwischen einen Chief AI Officer, nach nur 26 Prozent ein Jahr zuvor. Das ist eine Selbstauskunft der Vorstände und sollte vorsichtig gelesen werden, doch die Richtung ist klar. IBM selbst formuliert die entscheidende Einschränkung: Nicht der Titel zählt, sondern das Mandat, also Entscheidungsbefugnis, klare Prioritäten und Leitplanken. Ein Chief AI Officer ohne Befugnis ist nur ein weiteres Schild an einer Tür.

Dass eine benannte Verantwortung wirkt, zeigt auch der öffentliche Sektor. Die US-Verwaltung hat per Memo des Office of Management and Budget bereits 2024 einen Chief AI Officer je Behörde vorgeschrieben, mit klaren Aufgaben und Governance-Gremien. Wichtig ist neben dem Mandat der Zeithorizont. Der Umbau von Arbeitsabläufen und die daraus folgende EBIT-Wirkung brauchen Jahre, nicht Quartale. Wer die Rolle jährlich neu besetzt, verhindert echte Verantwortung. Diese Mehrjährigkeit ist ein Argument aus der Sache, keine belegte Kennzahl, aber sie folgt unmittelbar aus dem langsamen Wirkpfad des Umbaus.

Der Default schlägt die Schulung

Wer Nutzung will, ändert den Standardweg, nicht nur das Wissen. Ein klarer Default macht KI zum normalen Werkzeug im Arbeitsablauf, statt zur Option, die jede Person aktiv wählen müsste. Schulung vermittelt Können, ein Default verändert das Verhalten. Beides zusammen wirkt, der Default ist aber der stärkere Hebel auf die Nutzungsquote.

In der Praxis gibt es dafür klare Beispiele. Shopify erklärte den KI-Einsatz 2025 intern für nicht optional und verankerte KI-Kompetenz in den Leistungsbewertungen. Wer zusätzliche Stellen wollte, musste zunächst begründen, warum KI die Aufgabe nicht erledigen kann. Der Default lag damit auf der Seite der Nutzung. Solche Vorgaben verschieben den Ausgangspunkt jedes Arbeitstags, und genau dort entsteht Nutzungsquote.

Der Default hat aber eine Grenze, und die ist ernst zu nehmen. Duolingo hatte sich 2025 ebenfalls als KI-first erklärt und KI-Nutzung an Leistungsbewertungen geknüpft, nahm die erzwungene Kennzahl nach Kritik aus der Belegschaft jedoch wieder zurück. Die Lehre ist nicht, auf Defaults zu verzichten, sondern sie sinnvoll einzubetten statt sie zu erzwingen. Dazu passt ein weiterer McKinsey-Befund aus der Studie zur sogenannten Superagency: Der Engpass ist die Führung, nicht die Belegschaft, und nur 1 Prozent der Unternehmen hält sich selbst für KI-reif. Der Default ist eine Führungsentscheidung, kein Schulungsthema.

Deutsche und EU-Perspektive

Die deutsche Lage spiegelt das globale Muster, oft mit größerem Abstand zwischen Einsatz und Wert. Die Adoption steigt, doch die Wertzuordnung hinkt hinterher, und die Governance-Reife ebenso. Zugleich gibt die EU mit der Kompetenzpflicht des AI Act einen rechtlichen Anker, der die Eigner- und Governance-Frage von der Kür zur Pflicht macht.

Die Zahlen sind ernüchternd. Laut Bitkom-Studienbericht vom Februar 2026 kann nur etwa die Hälfte der KI-nutzenden Firmen einen konkreten Wertbeitrag zuordnen. Eine Untersuchung von Freshworks vom Mai 2026 beziffert, dass deutsche Firmen im Schnitt rund 26 Prozent ihres KI-Budgets verlieren, bevor überhaupt Wert entsteht, dass nur 15 Prozent KI in Kernprozesse integriert haben und 36 Prozent in Pilotprojekten feststecken. Diese Zahl stammt von einem Anbieter und ist entsprechend einzuordnen, sie passt aber ins Bild. Wie schnell die reine Nutzung in Deutschland zugleich wächst, zeigt die ifo-Auswertung zur KI-Nutzung : Mehr als die Hälfte der Unternehmen setzt KI ein, ohne dass daraus automatisch Wert entsteht.

Auf der Regelseite wirkt der EU AI Act als Anker. Artikel 4 verpflichtet Anbieter und Betreiber seit dem 2. Februar 2025 zu ausreichender KI-Kompetenz im Unternehmen. Das macht Kompetenz und damit Governance zur rechtlichen Pflicht, nicht zur freiwilligen Übung, und gibt der Eigner-Rolle einen formalen Aufhänger. Wer die weiteren Fristen und Pflichten einordnen will, findet sie in unserem Beitrag zu den Hochrisiko-Fristen des EU AI Act . Eine GitLab-Untersuchung vom Oktober 2025 zeigt zugleich, dass die deutsche Governance-Reife der Investition hinterherhinkt: Erst rund 48 Prozent der befragten Unternehmen hatten ihre Prozesse an die rechtlichen Vorgaben angepasst.

Herausforderungen und Risiken

Die Architektur-These ist belastbar, aber kein Allheilmittel, und die Datenlage hat Grenzen. Wer sie überdehnt, ersetzt einen Mythos durch den nächsten. Eine ehrliche Einordnung gehört deshalb dazu, sonst entsteht aus der berechtigten Kritik am Modellfokus ein neuer Glaubenssatz.

Die erste Grenze liegt in den Zahlen selbst. McKinsey misst die EBIT-Wirkung per Selbstauskunft der Befragten, und der berichtete statistische Zusammenhang erklärt nur etwa 20 Prozent der Streuung. Das ist ein Hinweis, kein Beweis. Auch die vielzitierte MIT-Zahl von 95 Prozent bezieht sich auf Piloten ohne messbaren Ergebnisbeitrag, nicht auf gescheiterte KI insgesamt, und beruht auf einer kleinen, teils qualitativen Stichprobe. Beide Befunde stützen die These, taugen aber nicht als exakte Messlatte.

Die zweite Grenze ist die Umsetzung. Organisatorischer Umbau ist langsam, teuer und politisch heikel. Entscheidungsrechte neu zu verteilen, erzeugt Widerstand, und ein benannter Eigner kann selbst zum Engpass werden, wenn ihm Befugnis oder Ressourcen fehlen. Hinzu kommt die Gefahr, das Pendel zu überdrehen: Erzwungene Defaults können nach hinten losgehen, wie das Beispiel Duolingo zeigt. Schließlich vereinfacht die Zuspitzung Architektur statt Modell bewusst. Datenqualität, Sicherheit und die Wahl des Modells bleiben relevante Randbedingungen, ohne die auch die beste Architektur nicht trägt.

Was Unternehmen jetzt tun sollten

Behandle KI als Architekturfrage und gib ihr einen Namen, einen Default und eine Messgröße. Das ist die kurze Antwort. Die folgenden Schritte machen aus Nutzung Wirkung, und sie lassen sich in den nächsten Quartalen beginnen, ohne auf das nächste Modell zu warten.

Zwei Kolleginnen und Kollegen bauen einen kompletten Arbeitsablauf um, indem sie Karten und Pfeile auf einem großen Blatt anordnen, ein Bild für Workflow-Umbau.
Aus verstreuten Piloten wird Wirkung: ein vollständiger Arbeitsablauf wird End-to-End umgebaut und KI dort als Default gesetzt.

Fünf Schritte für die nächsten Quartale

  1. Einen Eigner mit Mandat benennen

    Lege eine namentlich verantwortliche Person für die KI-Architektur fest, gib ihr Entscheidungsbefugnis, Budget und einen mehrjährigen Horizont. Das Mandat ist wichtiger als der Titel, und Kontinuität ist wichtiger als ein jährlicher Wechsel.

  2. Entscheidungsrechte, Regeln und Messgrößen festlegen

    Kläre konkret, wer was entscheiden darf, mit welchen Leitplanken für Datenschutz, Sicherheit und Qualität und gemessen an welcher Größe. Verknüpfe die Messung mit dem EBIT, nicht mit der Zahl der Lizenzen.

  3. Einen Arbeitsablauf End-to-End umbauen

    Baue einen vollständigen Prozess um, statt viele Pilotprojekte zu streuen, und setze KI dort als Default. Der Workflow-Umbau hat in den McKinsey-Daten den stärksten Zusammenhang mit dem Ergebnis.

  4. Wert messen, nicht Lizenzen

    Verfolge die tatsächliche Nutzungsquote im Arbeitsablauf und den Beitrag zum Ergebnis. Stelle die Kennzahl von der Anzahl gekaufter Werkzeuge auf den realen Wert um, den die Nutzung erzeugt.

  5. Governance und Recht zusammenführen

    Verknüpfe die Eigner-Rolle mit der Kompetenzpflicht des EU AI Act, damit Governance, Compliance und Wertschöpfung an einem Strang ziehen, statt sich gegenseitig zu blockieren.

Weiterführende Informationen

Häufig gestellte Fragen

Was sagt die McKinsey-Erhebung 2025 zur KI-Wertlücke? +

Die McKinsey-Erhebung State of AI 2025 (November 2025, rund 1.993 Befragte in etwa 105 Ländern) zeigt eine große Lücke zwischen Nutzung und Wert. 88 Prozent der Organisationen nutzen KI regelmäßig in mindestens einer Funktion, nach 78 Prozent im Vorjahr. Doch nur etwa 39 Prozent berichten überhaupt eine EBIT-Wirkung auf Unternehmensebene, und die meisten davon beziffern sie auf unter 5 Prozent. Nur rund 6 Prozent gelten als KI-Spitzenreiter mit mehr als 5 Prozent EBIT-Anteil aus KI. Fast flächendeckende Nutzung trifft also auf kaum messbaren Beitrag zum Ergebnis.

Warum ist die niedrige KI-Wertschöpfung kein Modellproblem? +

Weil Spitzenreiter und Nachzügler dieselben Modelle nutzen. Den Unterschied macht die Organisation. Laut McKinsey (März 2025) hat die grundlegende Neugestaltung von Arbeitsabläufen den stärksten Zusammenhang mit dem EBIT, doch nur 21 Prozent der Anwender hatten überhaupt einen Workflow grundlegend umgebaut. Eine MIT-NANDA-Studie (August 2025) ordnet rund 95 Prozent der generativen KI-Piloten als ohne messbaren Ergebnisbeitrag ein und nennt als Hauptgrund eine Lernlücke der Organisation, nicht die Modellqualität. Ein besseres Modell, mehr Schulung oder der nächste Use Case lösen das nicht.

Was bedeutet KI als Architekturfrage? +

Architektur meint hier nicht die IT-Architektur, sondern die organisatorische Ordnung: wer entscheidet was, mit welchen Regeln und gemessen woran. Eine KI-Architekturfrage klärt Entscheidungsrechte, verbindliche Leitplanken, einen klaren Default im Arbeitsablauf und Messgrößen, die am EBIT hängen. McKinsey-Spitzenreiter sind etwa dreimal so häufig dabei, Arbeitsabläufe grundlegend neu zu gestalten, und zeigen häufiger eine starke Führungsbeteiligung. Solange KI als reine Technikfrage behandelt wird, bleibt sie eine Lizenz mit niedriger Nutzung.

Braucht ein Unternehmen einen Chief AI Officer? +

Eine namentlich verantwortliche Person für die KI-Architektur ist sinnvoll, der Titel allein bringt aber wenig. Laut IBM (Mai 2026) haben 76 Prozent der Unternehmen inzwischen einen Chief AI Officer, nach 26 Prozent ein Jahr zuvor. IBM betont jedoch, dass nicht der Titel zählt, sondern das Mandat, also Entscheidungsbefugnis, klare Prioritäten und Leitplanken. Wichtig ist ein mehrjähriger Horizont, weil Workflow-Umbau und EBIT-Wirkung Zeit brauchen. Ein jährlicher Rollenwechsel verhindert echte Verantwortung.

Wie misst man den Wert von KI richtig? +

Wert, nicht Lizenzen. Statt der Anzahl gekaufter Werkzeuge oder geschulter Personen zählen die tatsächliche Nutzungsquote im Arbeitsablauf und der Beitrag zum Ergebnis. Sinnvoll ist, mindestens einen vollständigen Arbeitsablauf End-to-End umzubauen, KI dort als Default zu setzen und den Effekt am EBIT zu verfolgen, statt verstreute Pilotprojekte zu zählen. McKinsey verknüpft die größte EBIT-Wirkung mit grundlegendem Workflow-Umbau und mit CEO-Aufsicht über die KI-Governance. Die EBIT-Zahlen sind allerdings Selbstauskunft und mit Vorsicht zu lesen.