Leeres Startup-Büro spät am Abend, Schreibtischstühle zurückgeschoben, ein Netzwerkschrank blinkt grün, während im Hintergrund gedimmte Dashboards weiterlaufen

Mehr Bots als Menschen: Das Agentenweb erreicht die Unternehmen

Seit Mitte 2026 stammt die Mehrheit der Web-Anfragen von automatisierten Systemen. Was der Wendepunkt für Webpräsenz, Bot-Management und Inhaltsstrategie bedeutet.

Cloudflare meldet einen historischen Wendepunkt: Erstmals erzeugen Bots mehr Web-Traffic als Menschen, 57,4 Prozent gegenüber 42,6 Prozent. Getrieben wird das vom Agentenweb, in dem KI-Agenten und Crawler für jede Anfrage hunderte Seiten abrufen. Dieser Artikel erklärt, wie sich der Traffic zusammensetzt, warum das Verhältnis aus dem Gleichgewicht gerät und was deutsche Unternehmen bei Bot-Management, Inhalten und EU-Regulierung beachten sollten.

Zusammenfassung

Im Web stammt seit Mitte 2026 die Mehrheit der Anfragen nicht mehr von Menschen, sondern von automatisierten Systemen: Cloudflare misst 57,4 Prozent Bot-Anteil gegenüber 42,6 Prozent menschlichem Traffic. CEO Matthew Prince hatte diesen Punkt erst für 2027 erwartet, getrieben hat ihn das Agentenweb, in dem KI-Agenten für eine einzige Anfrage hunderte Seiten abrufen. KI-Crawler machen rund 22 Prozent des Bot-Traffics aus, davon dienen über 80 Prozent dem Modelltraining. Das eigentliche Problem ist das Ungleichgewicht: ClaudeBot rief je zurückverwiesenem Besucher zeitweise rund 38.000 Seiten ab, GPTBot rund 1.091, Google nur etwa 5. Inhalte fließen zur KI, Traffic kaum zurück. Für deutsche Unternehmen verschieben sich Rechte und Pflichten gleichzeitig: Cloudflare bewirbt ein Pay-per-Crawl-Modell, und der EU AI Act verschärft ab dem 2. August 2026 die Pflichten zu Trainingsdaten-Transparenz und maschinenlesbaren Opt-outs. Der sinnvolle Weg ist nicht pauschales Blockieren, sondern bewusstes Steuern nach Zweck.

Zum ersten Mal surfen mehr Bots als Menschen

Seit Mitte 2026 stammt die Mehrheit der Anfragen im Web von automatisierten Systemen, nicht von Menschen. Cloudflare misst einen Bot-Anteil von 57,4 Prozent gegenüber 42,6 Prozent menschlichem Traffic. Damit ist eine Schwelle überschritten, die das Unternehmen erst für 2027 erwartet hatte. Der Treiber ist das Agentenweb: KI-Agenten rufen für eine einzige Nutzeranfrage oft hunderte Seiten ab.

57,4 %
Bot-Anteil am Web-Traffic
erstmals mehrheitlich automatisiert
42,6 %
Anteil menschlicher Zugriffe
nun in der Minderheit
~20 %
Bot-Anteil vor dem KI-Boom
Ausgangswert zum Vergleich
~22 %
KI-Crawler am gesamten Bot-Traffic
Rest: Suche, Monitoring, Schaden
~68,6 %
agentischer Traffic in Nordamerika
regionale Unterschiede sind groß
2027 → 2026
Wendepunkt früher als erwartet
laut Cloudflare-CEO Matthew Prince
Agentenweb ist ein Web, in dem KI-Agenten und automatisierte Crawler die Mehrheit der Anfragen erzeugen und Inhalte teils im Auftrag von Menschen abrufen. Es löst das Bild vom Web als Ort menschlicher Besucher ab.

Matthew Prince formuliert es nüchtern: Der Anstieg kam schneller, als er vorhergesagt hatte, und die Daten seien etwas ungenau, in ihrer Aussage aber eindeutig. Die Verschiebung passt zur Entwicklung autonomer Werkzeuge, die innobu im Beitrag zum KI-nativen Browser und der AgentOS-Strategie beschrieben hat: Wenn Agenten selbst im Netz recherchieren und handeln, verschiebt sich die Last vom Menschen am Bildschirm zur Maschine im Hintergrund.

Wie sich der Bot-Traffic zusammensetzt

Nicht jeder Bot ist gleich, und die Unterscheidung ist für Unternehmen entscheidend. KI-Crawler machen rund 22 Prozent des gesamten Bot-Traffics aus, der Rest sind Suchmaschinen, Monitoring-Dienste, Verfügbarkeitsprüfungen und schädliche Bots. Innerhalb des KI-Crawlings dominiert das Sammeln von Trainingsdaten klar vor allen anderen Zwecken.

~80 %
Training der KI-Modelle
~15 %
Suche und Indexierung
~3 %
Live-Abruf für Nutzeranfragen

Nützliche Crawler

Suchmaschinen, Monitoring und Verfügbarkeitsprüfungen halten eine Website auffindbar und betriebsbereit. Sie zu sperren schadet meist mehr, als es nützt.

KI-Trainings-Crawler

Sie sammeln Inhalte für das Modelltraining. GPTBot von OpenAI überholte ClaudeBot im Mai 2026 und kam auf rund 11,5 Prozent der KI-Bot-Anfragen, einzelne Crawler wie Applebot legten in einem Monat um etwa 140 Prozent zu.

Agenten im Nutzerauftrag

Live-Abrufe für eine konkrete Frage oder einen Einkauf erzeugen Verweis-Traffic und potenzielle Kunden. Anthropic trennt seine Crawler inzwischen nach Trainings- und Live-Zweck.

Wichtig

Bevor du über Sperren nachdenkst, musst du wissen, welcher Bot welchen Zweck verfolgt. Ein Trainings-Crawler, ein Suchmaschinen-Index und ein Einkaufs-Assistent sehen technisch ähnlich aus, haben für dein Geschäft aber völlig unterschiedliche Folgen.

Das Ungleichgewicht: Crawling ohne Gegenleistung

Das eigentliche Problem für Inhalteanbieter ist nicht die Menge, sondern das Verhältnis. Crawler nehmen sehr viele Inhalte auf, schicken aber kaum Besucher zurück. Cloudflare nennt für Anthropics ClaudeBot zeitweise mehrere zehntausend abgerufene Seiten je zurückverwiesenem Besucher, gemessen als Crawl-to-Referral-Verhältnis.

Dienst Crawl-to-Referral Bedeutung
ClaudeBot (Anthropic) ca. 38.000:1 Zehntausende Seiten je Besucher zurück
GPTBot (OpenAI) ca. 1.091:1 Tausend Seiten je Besucher zurück
Perplexity ca. 195:1 deutlich ausgeglichener als Trainings-Crawler
Google ca. 5,4:1 klassische Suche verweist noch Besucher
Crawl-to-Referral-Verhältnis ist die Zahl der von einem Dienst abgerufenen Seiten je einem Besucher, den derselbe Dienst auf die Website zurückverweist. Ein hohes Verhältnis heißt: viel Inhalt entnommen, kaum Traffic zurückgegeben.

Hinzu kommt, dass Verweise von Suchmaschinen sinken, seit KI-Zusammenfassungen Antworten direkt anzeigen, statt auf Quellen zu verlinken. Für werbe- oder abofinanzierte Anbieter bricht damit ein Teil der Geschäftsgrundlage weg. Genau diese Verschiebung der Sichtbarkeit hat innobu im Artikel zur KI-Traffic-Krise und den SEO-Strategien für Google-Alternativen vertieft.

Das offene Web schließt sich: Wenn das Geben von Inhalten und das Erhalten von Besuchern dauerhaft auseinanderfallen, sperren immer mehr Anbieter ihre Inhalte ab oder verlangen Bezahlung. Das verändert die Spielregeln für jeden, dessen Geschäftsmodell auf Reichweite über das offene Web beruht.

Deutsche und EU-Perspektive

Für deutsche und europäische Unternehmen verschieben sich Rechte und Pflichten gleichzeitig. Der EU AI Act erreicht am 2. August 2026 die volle Geltung wichtiger Vorschriften. Anbieter von KI-Modellen müssen unter anderem ihre Trainingsdatenquellen offenlegen und maschinenlesbare Opt-outs respektieren.

Menschen gehen die Stufen eines europäischen Regierungsgebäudes hinauf, über dem Eingang hängen eine Nationalflagge und die Europaflagge, daneben ein Messingschild
Während Crawler das Web fluten, regelt der EU AI Act ab August 2026 Transparenz über Trainingsdaten und maschinenlesbare Opt-outs.

Die Text-und-Data-Mining-Ausnahme der EU-Urheberrechtsrichtlinie erlaubt Rechteinhabern einen maschinenlesbaren Vorbehalt gegen die Nutzung ihrer Inhalte. Wer diesen Vorbehalt korrekt setzt und dokumentiert, hat im Streitfall eine bessere Position. Deutsche und französische Anbieter setzen robots.txt und Consent-Flags bereits strenger ein, was internationale Datensammler teils zum Ausschluss dieser Quellen zwingt.

Pay-per-Crawl ist ein Modell, mit dem Seitenbetreiber Zugriffe von KI-Crawlern sperren oder bepreisen können. Cloudflare-CEO Matthew Prince hält ein solches Bezahlmodell für den wahrscheinlichen nächsten Schritt, die nötige Infrastruktur ist aber noch im Aufbau.

Für die Souveränität europäischer Anbieter ist die Frage zentral, wer den Zugang zum Agentenweb kontrolliert und zu welchen Bedingungen. Diese Debatte ordnet innobu im Artikel zur EU-Tech-Souveränität bei Chips, Cloud und KI ein. Wer den eigenen Einsatz plant, sollte ihn von Beginn an mit den Fristen des EU AI Act für Hochrisiko-Systeme zusammendenken.

Herausforderungen und Risiken

Die Lage ist nicht so eindeutig, wie die Schlagzeile nahelegt, und jede Reaktion hat Kosten. Vier Punkte sollten Unternehmen nüchtern bewerten, bevor sie pauschale Sperren verhängen.

Die Messung ist unscharf

Prince selbst nennt die Daten ungenau. Die Begriffe Bot, Crawler und Agent werden unterschiedlich verwendet, und regionale Ausreißer sind groß: In einzelnen Regionen führen Menschen noch knapp, während Nordamerika weit über dem Schnitt liegt. Eine einzige Prozentzahl verdeckt diese Spannweite.

robots.txt ist nur eine Empfehlung

Die Datei robots.txt gibt Crawlern eine Anweisung, erzwingt aber nichts. Aggressive oder getarnte Crawler ignorieren sie. Verlässliche Kontrolle braucht zusätzlich technische Maßnahmen und überprüfbare Agenten-Identitäten, deren Standards erst entstehen.

Sichtbarkeit gegen Schutz

Wer Trainings-Crawler aussperrt, kann zugleich aus KI-Antworten verschwinden und damit künftige Reichweite verlieren. Der Schutz der eigenen Inhalte und die Auffindbarkeit in KI-Systemen stehen in direktem Zielkonflikt, der sich nicht für jedes Unternehmen gleich auflöst.

Kunden nicht versehentlich aussperren

Agentische Einkaufs- und Recherche-Assistenten handeln zunehmend im Auftrag echter Kunden. Wer sie pauschal blockiert, verliert womöglich Umsatz. Bot-Abwehr kostet zudem Infrastruktur und erzeugt Fehlalarme, die menschliche Nutzer treffen können.

Was Unternehmen jetzt tun sollten

Der sinnvolle Weg ist nicht pauschales Blockieren, sondern bewusstes Steuern. Unternehmen sollten zuerst verstehen, welcher Anteil ihres Traffics automatisiert ist und welche Bots welchen Zweck verfolgen, und daraus eine differenzierte Zugriffsregel ableiten. Fünf Schritte helfen dabei.

Hände eines Netzwerkadministrators stecken ein Patchkabel in eine Firewall-Appliance im Serverschrank, daneben gebündelte Netzwerkkabel und ein Beschriftungsgerät
Bot-Management beginnt an der Infrastruktur: Zugriffe nach Zweck trennen, statt jeden Crawler gleich zu behandeln.
  1. Traffic-Analyse aufsetzen

    Trenne menschliche und automatisierte Zugriffe und unterscheide KI-Crawler nach Zweck: Training, Suche oder Live-Abruf. Erst diese Sicht zeigt, wie viel deines Traffics von Maschinen kommt und welche davon dir nützen.

  2. Crawler-Policy definieren

    Lege fest, welche Crawler du zulässt und welche du einschränkst. Steuere das über robots.txt und eine llms.txt, lass Suche und nützliche Agenten zu und schränke reine Trainings-Crawler dort ein, wo Inhalte einen eigenen Wert haben.

  3. Bot-Management einführen

    Setze Werkzeuge ein, die legitime von getarnten Zugriffen trennen, etwa über signierte Agenten-Identitäten. So vermeidest du, dass aggressive Crawler die Regeln umgehen oder echte Nutzer fälschlich blockiert werden.

  4. Inhalte für Agenten lesbar halten

    Strukturierte Daten, eine klare Seitenstruktur und maschinenlesbare Zusammenfassungen erhalten die Auffindbarkeit in KI-Systemen, ohne alles freizugeben. So bleibst du in agentischen Antworten präsent, statt unsichtbar zu werden.

  5. Lizenzierung und Compliance prüfen

    Bewerte Pay-per-Crawl und Content-Lizenzen, wenn deine Inhalte einen eigenständigen Wert haben. Dokumentiere maschinenlesbare Opt-outs und bereite die Pflichten des EU AI Act vor, bevor die Frist im August greift.

Wer den Schritt zu agentengetriebenen Geschäftsmodellen plant, findet weitere Einordnung in den Artikeln zum agentischen Commerce mit ChatGPT Instant Checkout und zur Governance-Lücke beim Wildwuchs von KI-Agenten .

Wichtig

Das Agentenweb ist kein vorübergehender Effekt, sondern die neue Grundlage. Der Wert entsteht nicht durch Abschotten, sondern durch eine bewusste Regel, die nützliche Zugriffe zulässt, schädliche abwehrt und den eigenen Inhalten dort einen Preis gibt, wo sie ihn wert sind.

Weiterführende Informationen

Häufig gestellte Fragen

Erzeugen Bots wirklich mehr Web-Traffic als Menschen? +

Ja. Cloudflare meldet für 2026 erstmals einen Bot-Anteil von 57,4 Prozent gegenüber 42,6 Prozent menschlichem Traffic. Der Wendepunkt kam Mitte 2026, früher als Cloudflare-CEO Matthew Prince mit 2027 erwartet hatte. Treiber sind KI-Agenten, die für eine einzige Anfrage oft hunderte Seiten abrufen. Prince räumt ein, die Daten seien etwas ungenau, in ihrer Aussage aber eindeutig.

Was ist das Agentenweb? +

Das Agentenweb bezeichnet ein Web, in dem KI-Agenten und Crawler die Mehrheit der Zugriffe ausmachen und Inhalte teils im Auftrag von Menschen abrufen. Es löst das Bild vom Web als Ort menschlicher Besucher ab. Für Unternehmen heißt das, dass ein Großteil der Anfragen an die eigene Website von Maschinen kommt, deren Zweck von Training über Suche bis zu konkreten Nutzeraufträgen reicht.

Sollten Unternehmen KI-Crawler einfach blockieren? +

Pauschales Blockieren ist selten sinnvoll. Wer Trainings-Crawler aussperrt, kann zugleich aus KI-Antworten verschwinden und damit künftige Reichweite verlieren. Wer agentische Einkaufs- oder Recherche-Assistenten blockiert, sperrt unter Umständen zahlende Kunden aus. Sinnvoller ist eine differenzierte Regel, die nach Zweck unterscheidet, Suche und nützliche Agenten zulässt und Trainings-Crawler bei Bedarf einschränkt.

Was ist Pay-per-Crawl? +

Pay-per-Crawl ist ein Modell, mit dem Seitenbetreiber Zugriffe von KI-Crawlern sperren oder bepreisen können, statt Inhalte kostenlos freizugeben. Cloudflare-CEO Matthew Prince hält ein solches Bezahlmodell für den wahrscheinlichen nächsten Schritt im Web. Die nötigen Protokolle und die Infrastruktur dafür befinden sich noch im Aufbau, und die Verbreitung ist bislang begrenzt.

Was ändert der EU AI Act für KI-Crawler? +

Mit der vollen Geltung wichtiger Vorschriften ab dem 2. August 2026 müssen Anbieter von KI-Modellen unter anderem ihre Trainingsdatenquellen offenlegen und maschinenlesbare Opt-outs respektieren. Die Text-und-Data-Mining-Ausnahme der EU-Urheberrechtsrichtlinie erlaubt Rechteinhabern einen maschinenlesbaren Vorbehalt gegen die Nutzung ihrer Inhalte. Für deutsche Unternehmen steigt damit der Wert dokumentierter Zugriffsregeln.