Agentic AI als Angriffsfläche: Wenn KI-Agenten zum Sicherheitsrisiko werden
KI-Agenten geben nicht mehr nur Auskunft, sie handeln. Ende Mai 2026 zeigte ein Vorfall bei Meta, wie schnell daraus ein Sicherheitsproblem wird: Ein KI-Support-Bot gab fremde Instagram-Konten frei, ohne dass ein Passwort geknackt wurde. Der Fall steht für ein größeres Muster. Unternehmen führen Agenten schneller ein, als sie sie absichern. Für deutsche Entscheider hat das mit Blick auf EU AI Act und NIS2 direkte Konsequenzen.
Agentische KI verschiebt das Sicherheitsrisiko von der Auskunft zur Aktion. Beim Meta-Vorfall Ende Mai 2026 baten Angreifer den KI-Support-Bot, eine fremde E-Mail-Adresse an Instagram-Konten zu hängen, und lösten so Übernahmen aus, ohne ein Passwort zu knacken. Marktdaten aus 2026 zeigen eine breite Lücke zwischen Verbreitung und Kontrolle: 48 Prozent der Sicherheitsfachleute sehen agentische KI als wichtigsten Angriffsvektor, nur 21,9 Prozent behandeln Agenten als eigene Identität. Die wirksamsten Gegenmaßnahmen sind nicht spektakulär. Eindeutige Agenten-Identitäten, Least Privilege, eine Prüfung vor jeder Aktion und durchgehendes Monitoring bilden eine nachvollziehbare Rechenschaftskette, wie sie auch der EU AI Act ab dem 2. August 2026 erwartet.
Was geschah: Ein Support-Bot verschenkte fremde Konten
Ende Mai 2026 übernahmen Angreifer prominente Instagram-Konten, ohne ein einziges Passwort zu knacken. Sie öffneten einen Chat mit Metas KI-Support-Assistenten und baten ihn, eine von ihnen kontrollierte E-Mail-Adresse an ein fremdes Konto zu hängen. Der Bot tat das im Rahmen seines normalen Ablaufs, schickte den Bestätigungscode an die Angreifer-Adresse und gab damit den Weg zum Passwort-Reset frei. Es war kein technischer Einbruch, sondern eine erfüllte Bitte.
Betroffen waren laut Berichten unter anderem das Instagram-Konto des Weißen Hauses aus der Obama-Zeit und das eines ranghohen Vertreters der US Space Force. Meta erklärte das Problem am 1. Juni 2026 für behoben, doch in den Tagen danach meldeten weitere Nutzer und Sicherheitsforscher übernommene Konten. Instagram begann, gezielt gewarnte Betroffene zu informieren. Konten mit Mehr-Faktor-Authentifizierung blieben verschont, schon ein einfacher SMS-Code hätte den Angriff gestoppt.
Anleitung kursiert
Eine Schritt-für-Schritt-Anleitung zum Missbrauch des KI-Support-Bots verbreitet sich über Messenger-Kanäle. Erste prominente Konten werden übernommen und mit fremden Inhalten überschrieben.
Meta meldet Behebung
Meta erklärt die Lücke für geschlossen und spielt einen Notfall-Patch aus. Der Angriffsweg lief vollständig durch den regulären Support-Ablauf, ohne klassischen Sicherheitsalarm.
Übernahmen gehen weiter
Trotz Patch melden weitere Nutzer Kontoübernahmen. Instagram beginnt, betroffene Konten aktiv zu warnen. Mehr-Faktor-Authentifizierung erweist sich als wirksamster Schutz.
Warum KI-Agenten eine neue Angriffsfläche öffnen
Klassische Chatbots geben Auskunft, Agenten handeln. Dieser Schritt von der Antwort zur Aktion verschiebt das Risiko grundlegend. Ein Agent ruft Programmierschnittstellen auf, ändert Datensätze und löst Transaktionen aus. Eine Anweisung in natürlicher Sprache kann damit zur Ausführung werden, ohne dass eine herkömmliche Kontrolle anschlägt. Der Meta-Vorfall ist die anschauliche Form eines allgemeinen Problems.
Der Angriff auf Meta lief durch den ganz normalen Support-Ablauf. Im Sicherheitsteam ging kein Alarm ein, weil formal nichts Verbotenes passierte. Sprachschnittstellen lassen sich nur schwer begrenzen, denn was sich formulieren lässt, lässt sich auch als legitimer Auftrag tarnen. Prompt-basierte Schutzregeln im Systemtext versagen gegen anpassungsfähige Angriffe. Nötig sind externe, feste Kontrollen, die unabhängig vom Modellverhalten greifen.
Die Zahlen: Verbreitung überholt Kontrolle
KI-Agenten verbreiten sich schneller, als Unternehmen sie absichern. Mehrere Erhebungen aus 2026 zeigen eine breite Lücke zwischen Einsatz und Kontrolle, und ein gefährliches Maß an Selbstüberschätzung. 48 Prozent der Sicherheitsfachleute nennen agentische KI den wichtigsten Angriffsvektor für 2026. Zugleich behandelt nur ein kleiner Teil der Teams Agenten als eigenständige Identität.
Die größte Schwachstelle ist nicht ein einzelner Vorfall, sondern die Selbstüberschätzung. 88 Prozent der befragten Organisationen berichten von bestätigten oder vermuteten Agenten-Sicherheitsvorfällen im letzten Jahr, doch 82 Prozent der Führungskräfte halten ihre bestehenden Richtlinien für ausreichend. Diese Differenz ist das eigentliche Risiko, weil sie gezielte Verbesserung verhindert.
"AI chatbots create interesting new attack surface, and we're likely going to see a lot more of these kinds of attacks."
Die wichtigsten Risikoklassen nach OWASP
OWASP hat 2026 erstmals eine Top-10-Liste speziell für agentische KI-Anwendungen veröffentlicht. Sie benennt Risiken, die es bei klassischer Software in dieser Form nicht gab, weil Agenten Ziele verfolgen, ein Gedächtnis führen und Werkzeuge bedienen. Vier Klassen sind für die Praxis besonders relevant.
| Risikoklasse | Was dabei passiert |
|---|---|
| Goal Hijacking | Eine eingeschleuste Anweisung lenkt den Agenten auf ein manipuliertes Ziel um. Er handelt weiter scheinbar regulär, verfolgt aber den Zweck des Angreifers. |
| Memory Poisoning | Falsche Informationen verseuchen das dauerhafte Gedächtnis des Agenten und verzerren spätere Entscheidungen, auch lange nach dem eigentlichen Angriff. |
| Tool-Missbrauch | Programmierschnittstellen, Datenbanken oder Shell-Zugriffe werden über die vorgesehene Grenze hinaus genutzt. Der Meta-Bot hängte eine fremde E-Mail an ein Konto, weil ihm diese Aktion erlaubt war. |
| Excessive Agency | Zu weit gefasste Rechte erlauben unautorisierte oder nicht umkehrbare Aktionen. Ein Agent mit breiten Berechtigungen wird zum Generalschlüssel für Angreifer. |
Diese Klassen lassen sich nicht durch bessere Formulierungen im Systemprompt schließen. Sie verlangen technische Leitplanken außerhalb des Modells: feste Prüfungen vor dem Werkzeugaufruf, getrennte und überwachte Gedächtnisse sowie eng begrenzte Rechte. Das BSI verweist in seinen Leitlinien zur sicheren KI-Entwicklung auf genau solche externen Kontrollen.
Deutsche und europäische Perspektive
Für deutsche Unternehmen ist das kein Randthema. KI-Agenten gehören laut Bitkom zu den am schnellsten wachsenden Einsatzfeldern, und die Regulierung rückt näher. 41 Prozent der deutschen Unternehmen nutzen KI aktiv, mehr als doppelt so viele wie die 17 Prozent von 2024. Wer Agenten im Kundenkontakt oder in internen Abläufen einsetzt, betreibt damit eine sicherheitsrelevante Komponente, oft ohne sie so zu behandeln.
Ab dem 2. August 2026 greifen die Pflichten des EU AI Act für Hochrisiko-Systeme. Verlangt werden Widerstandsfähigkeit gegen Manipulation und eine nachvollziehbare Kette von der menschlichen Freigabe über die Agenten-Identität bis zur ausgeführten Aktion. Die Begründung "Die KI war es" gilt dabei nicht als Verteidigung. Wer einen Agenten betreibt, bleibt für dessen Aktionen verantwortlich.
NIS2, DORA und der EU AI Act überschneiden sich zunehmend, wenn KI-Systeme im Spiel sind. Ein formaler NIS2-Review steht 2026 an und dürfte Meldepflichten für KI-Modellfehler schärfen. Das BSI hat bereits Leitfäden für sichere KI-Entwicklung und für die Integration von KI in Industriesteuerungen vorgelegt, die ausdrücklich KI-Software-Agenten einschließen. Wer früh eine saubere Rechenschaftskette aufbaut, erfüllt mehrere Vorgaben gleichzeitig.
Herausforderungen und Gegenstimmen
Nicht jede Alarmstimmung ist berechtigt, und ein Teil der Lücke ist ein Wahrnehmungsproblem, kein technisches. Eine ausgewogene Sicht hilft mehr als Panik. Kritische Stimmen warnen, dass Agenten ohne Governance vom Nutzenversprechen zum Sicherheitsrisiko kippen können. Gleichzeitig zeigt der Meta-Fall, dass einfache Grenzen oft ausreichen.
- Kosten gegen Nutzen: 33 Prozent der Unternehmen berichten laut Bitkom, dass KI teurer ausfällt als erwartet. Sicherheitsaufwand kommt obendrauf und konkurriert mit dem Produktivitätsversprechen.
- Einfache Grenzen wirken: Der Meta-Vorfall scheiterte an einer fehlenden Prüfung, nicht an exotischer Technik. Mehr-Faktor-Authentifizierung hätte die Übernahmen verhindert. Viele Risiken lassen sich mit bekannten Mitteln senken.
- Selbstüberschätzung als Kernrisiko: Wenn 82 Prozent ihre Regeln für ausreichend halten, die Praxis aber das Gegenteil zeigt, fehlt die Grundlage für gezielte Verbesserung. Ehrliche Bestandsaufnahme ist der erste Schritt.
- Tempo der Angreifer: Dieselben Agenten, die Verteidiger entlasten, helfen auch Angreifern, Schwächen schneller zu finden. Der Schutz muss mit dem Tempo der Werkzeuge mithalten.
Was Unternehmen jetzt tun sollten
Die wirksamsten Maßnahmen sind nicht spektakulär. Sie verlagern die Kontrolle weg vom Vertrauen in den Agenten hin zu festen Prüfungen vor jeder Aktion. Im Kern geht es um eine durchgehende Rechenschaftskette: Jede Aktion lässt sich von der menschlichen Freigabe über eine eindeutige Identität bis zur ausgeführten Aktion zurückverfolgen.
Diese Kette ist zugleich der Rahmen, den der EU AI Act für Hochrisiko-Systeme erwartet. Sie lässt sich in fünf konkreten Schritten umsetzen, die unabhängig vom eingesetzten Agenten-Framework funktionieren.
Fünf Schritte zu mehr Agenten-Sicherheit
-
Agenten als eigene Identität führen
Gib jedem Agenten eine eindeutige, nachvollziehbare Identität statt geteilter API-Schlüssel. Nur so lässt sich jede Aktion einem Verantwortlichen zuordnen, und kompromittierte Agenten lassen sich gezielt abschalten.
-
Rechte nach Least Privilege begrenzen
Vergib Rechte nur für den konkreten Auftrag, fachlich und zeitlich eng begrenzt. Ein Support-Agent darf Auskunft geben, aber nicht eigenmächtig Kontaktdaten ändern. Prüfe jede Berechtigung gegen den realen Bedarf.
-
Vor jeder Aktion prüfen
Setze eine feste Autorisierung vor jeden Werkzeug- oder Schnittstellenaufruf. Sensible Schritte wie das Ändern von Zugangsdaten oder das Auslösen von Zahlungen brauchen eine zusätzliche menschliche Freigabe.
-
Durchgehend protokollieren
Erfasse jede Agenten-Aktion in einem Audit-Log und ordne sie einer Identität zu. Anomalie-Erkennung meldet ungewöhnliche Zugriffe, bevor aus einem Vorfall ein Schaden wird. NIS2 verlangt ohnehin belastbare Nachweise.
-
An etablierten Rahmen ausrichten
Orientiere dich an OWASP für agentische KI , ISO/IEC 42001 und dem NIST AI Risk Management Framework, statt eigene Insellösungen zu bauen. Eine fundierte Einordnung zu KI-Agenten-Governance im Enterprise und zu KI-Agenten und Enterprise-Sicherheit findest du in den verlinkten Artikeln.
Weiterführende Informationen
Häufig gestellte Fragen
Agentische KI bezeichnet KI-Systeme, die nicht nur Auskunft geben, sondern eigenständig Werkzeuge aufrufen, Datensätze ändern und Aktionen ausführen. Genau dieser Schritt von der Antwort zur Aktion schafft eine neue Angriffsfläche: Eine Anweisung in natürlicher Sprache kann zur Ausführung werden, ohne dass eine klassische Sicherheitskontrolle anschlägt.
Ende Mai 2026 baten Angreifer Metas KI-Support-Assistenten, eine von ihnen kontrollierte E-Mail-Adresse an fremde Instagram-Konten zu hängen. Der Bot tat das im normalen Support-Ablauf, schickte den Bestätigungscode an die Angreifer-Adresse und ermöglichte so einen Passwort-Reset. Konten mit Mehr-Faktor-Authentifizierung blieben verschont.
Der Angriff lief durch den ganz normalen Support-Ablauf, deshalb schlug kein Alarm an. Prompt-basierte Schutzregeln versagen gegen anpassungsfähige Angriffe. Wirksam sind nur externe, feste Kontrollen wie eine Prüfung vor jedem Werkzeugaufruf, eindeutige Agenten-Identitäten und durchgehendes Monitoring.
Der EU AI Act verlangt für Hochrisiko-Systeme Widerstandsfähigkeit gegen Manipulation und eine nachvollziehbare Kette von der menschlichen Freigabe über die Agenten-Identität bis zur ausgeführten Aktion. Die Pflichten für Hochrisiko-Systeme greifen ab dem 2. August 2026. Die Begründung "Die KI war es" gilt nicht als Verteidigung.
OWASP hat 2026 erstmals eine Top-10-Liste speziell für agentische KI veröffentlicht. Zentrale Risiken sind Goal Hijacking (manipuliertes Ziel), Memory Poisoning (verseuchtes Gedächtnis), Tool-Missbrauch (Schnittstellen über die Grenze hinaus genutzt) und Excessive Agency (zu weit gefasste Rechte für unautorisierte Aktionen).
Jeder Agent braucht eine eigene, nachvollziehbare Identität statt geteilter Schlüssel. Rechte werden nach dem Least-Privilege-Prinzip eng begrenzt. Vor jedem Werkzeug- oder Schnittstellenaufruf steht eine feste Prüfung, bei sensiblen Schritten mit menschlicher Freigabe. Durchgehendes Monitoring ordnet jede Aktion einer Identität zu.