Hermes Agent 2026: Der erste produktive Open-Source-KI-Agent mit Selbstverbesserung
Nous Research hat mit Hermes Agent v0.10 am 16. April 2026 einen selbstverbessernden Open-Source-Agenten veröffentlicht. Das Projekt wächst schneller als LangChain und AutoGen zusammen. Für deutsche Entscheider stellt sich die Frage, ob damit eine ernstzunehmende Alternative zu proprietären Agent-Plattformen entstanden ist.
Hermes Agent ist ein quelloffenes KI-Agent-Framework von Nous Research, erstmals am 25. Februar 2026 veröffentlicht. Die Version 0.10.0 vom 16. April 2026 bündelt 118 Skills, dreischichtigen Speicher und sechs Messaging-Integrationen. Sieben Wochen nach dem Release hat das Projekt 95.600 GitHub-Stars überschritten und inzwischen mehr als 103.000 erreicht. Das technische Alleinstellungsmerkmal ist GEPA, ein bei der ICLR 2026 als Oral akzeptierter Selbstverbesserungs-Mechanismus, der Agenten mit 20 oder mehr selbst erzeugten Skills 40 Prozent schneller bei wiederholten Aufgaben macht. Self-Hosting auf europäischer Infrastruktur startet bei 5 Euro pro Monat, die MIT-Lizenz verhindert Vendor Lock-in. Für deutsche Unternehmen ist das Framework eine strategisch interessante Option, für den produktiven Enterprise-Einsatz braucht es aber noch Reifezeit, Audit-Logging und klare Governance.
Was Hermes Agent ist und warum er jetzt wichtig wird
Nous Research hat am 16. April 2026 Version 0.10.0 von Hermes Agent veröffentlicht. Sieben Wochen nach dem Erst-Release am 25. Februar 2026 hat das Projekt die Marke von 95.600 GitHub-Stars überschritten und die historischen Wachstumskurven von LangChain und AutoGen zusammen erreicht. Für dich als Entscheider heißt das, dass Hermes Agent kein Forschungsprojekt mehr ist, sondern ein auf dem eigenen Server betreibbares Framework mit produktiv nutzbarer Selbstverbesserung.
Das Tempo ist bemerkenswert. Release v0.8.0 am 8. April 2026 brachte 209 gemergte Pull Requests und 82 geschlossene Issues. Nur acht Tage später folgte v0.10.0 mit der nächsten Schicht Reife: drei Speicher-Ebenen, sechs Messaging-Gateways und ein geschlossener Lern-Loop. Das ist die Release-Kadenz eines gut finanzierten Forschungslabors, nicht eines Hobby-Projekts.
Erstes Release
Nous Research veröffentlicht Hermes Agent auf GitHub unter MIT-Lizenz mit der Positionierung "the open source agent that grows with you".
Version 0.8.0 mit GEPA-Selbstevolution
209 gemergte PRs, 82 geschlossene Issues, native Google-AI-Studio-Integration, MCP OAuth 2.1 mit PKCE und das erste produktive Release mit GEPA-basierter Skill-Verbesserung.
Version 0.10.0 mit 118 Skills
Aktuelle Version mit dreischichtigem Speicher, sechs Messaging-Integrationen und geschlossenem Lern-Loop, der wiederverwendbare Skills aus Erfahrung erzeugt.
Die drei Säulen: Speicher, Skills, Modell-Agnostik
Hermes Agent unterscheidet sich von etablierten Frameworks wie LangChain, CrewAI oder dem Microsoft Agent Framework durch drei Design-Entscheidungen: einen persistenten mehrschichtigen Speicher, eine automatische Skill-Generierung aus gelöster Arbeit und konsequente Modell-Unabhängigkeit. Die Kombination macht den Agenten zum ersten Open-Source-System mit praxistauglicher Selbstverbesserung.
Dreischichtiger Speicher
Kurzzeit-Kontext für die aktuelle Session, persistente Langzeit-Konversationen mit FTS5 Full-Text-Search und prozedurale Skill-Memory mit LLM-Summarization. Zusammen ergeben die Schichten ein Modell, das Aufgaben von vor Wochen wiederfindet.
Automatische Skill-Erzeugung
Nach komplexen Aufgaben erzeugt der Agent eigenständig wiederverwendbare Skill-Dokumente. Diese werden bei Nutzung weiter verbessert und durch periodische Impulse im Speicher verankert.
Modell-Agnostik
Unterstützt werden Nous Portal, OpenRouter mit über 200 Modellen, NVIDIA NIM, Xiaomi MiMo, z.ai GLM, Kimi Moonshot, MiniMax, Hugging Face, OpenAI und eigene Endpunkte. Live-Modell-Switching funktioniert mitten in einer Session ohne Neustart.
Das Herzstück ist GEPA, ein Verfahren von Gupta und Kollegen. GEPA steht für Genetic-Pareto und nutzt Large Language Models, um komplette Execution-Traces zu analysieren. Statt einen Reinforcement-Learning-Reward-Skalar zu verarbeiten, liest das System Fehlermeldungen, Profiling-Daten und Argumentationsketten und schlägt gezielte Prompt-Verbesserungen vor. Das Paper wurde bei der ICLR 2026 als Oral akzeptiert.
GEPA ermöglicht Open-Source-Modellen wie gpt-oss-120b, proprietäre Frontier-Modelle bei Enterprise-Tasks um etwa 3 Prozent zu übertreffen, bei 20 bis 90 Mal geringeren Kosten.
Die Zahl der 40 Prozent ist ein Tempo-Gewinn bei Domain-ähnlichen Aufgaben, nicht ein Qualitätsgewinn. GEPA macht den Agenten effizienter, nicht klüger. Für Routine-Pfade ist das relevant, für Grundsatz-Entscheidungen oder neue Domänen gibt es keinen automatischen Vorteil.
Deployment, Kosten und Integrationen
Hermes Agent läuft auf Linux, macOS, WSL2 und Android via Termux. Die Installation erfolgt mit einem einzigen Shell-Kommando. Für persönliche Nutzung reicht ein VPS mit 1 vCPU und 1 GB RAM für 5 Euro pro Monat, etwa bei Hetzner oder IONOS. Für Team-Deployments mit permanentem Betrieb und mehreren Messaging-Gateways empfehlen unabhängige Reviews 2 vCPU und 4 GB RAM.
| Komponente | Anforderung | Kosten (Schätzung) |
|---|---|---|
| Framework-Lizenz | MIT, keine Usage-Caps | 0 Euro |
| VPS (persönliche Nutzung) | 1 vCPU, 1 GB RAM | ab 5 Euro pro Monat |
| VPS (Team, Always-On) | 2 vCPU, 4 GB RAM | ab 15 Euro pro Monat |
| LLM-Kosten pro komplexe Aufgabe | Budget-Modelle wie Claude Haiku 4.5, GPT-5.4 Mini, Hermes 4 70B | ca. 0,30 US-Dollar |
| Messaging-Integrationen | Telegram, Discord, Slack, WhatsApp, Signal, Email, CLI | im Framework enthalten |
| Sandbox-Backends | local, Docker, SSH, Singularity, Modal | je nach Modal-Nutzung variabel |
Die Sandbox-Auswahl ist ein ernster Unterschied. Hermes Agent trennt die Ausführung von Tool-Calls in fünf Backend-Optionen. Für kritische Deployments lassen sich Tools in isolierten Docker-Containern oder via SSH auf abgesicherten Remote-Hosts betreiben. Kombiniert mit dem bereits in v0.8.0 integrierten MCP -OAuth-2.1-PKCE-Authentifizierungsstandard und OSV-Malware-Scanning für MCP-Extensions ergibt das eine Sicherheits-Architektur, die für ein 7 Wochen junges Projekt ungewöhnlich robust wirkt.
PRs in v0.8
Zusammenführungen in acht Tagen zeigen die Entwicklungsgeschwindigkeit und die Beteiligung der Community.
LLM-Provider
Von Nous Portal über OpenRouter mit 200 Modellen bis zu lokalen Endpunkten. Keine Bindung an einen einzelnen Anbieter.
Contributors
Über 500 Entwickler haben bereits zum Projekt beigetragen. Eine aktive Beteiligung aus der Open-Source-Community.
Deutsche und EU-Perspektive
Hermes Agent trifft einen Nerv in der Debatte um digitale Souveränität. Laut Bitkom wollen 99 Prozent der deutschen Unternehmen digitale Unabhängigkeit, aber nur 57 Prozent haben eine Exit-Strategie für Nicht-EU-Software. Ein selbst gehosteter Open-Source-Agent auf europäischer Infrastruktur adressiert genau dieses Delta. Der Vorstoß Frankreichs im April 2026, den Ausstieg aus Nicht-EU-Software zu ordnen, macht die Frage zusätzlich politisch.
Microsoft hat am 2. April 2026 das Agent Governance Toolkit unter MIT-Lizenz veröffentlicht. Das Toolkit deckt die OWASP Agentic Top 10 und den EU AI Act ab, mit 20 Adaptern für LangChain, CrewAI, Google ADK und Microsoft Agent Framework. Auch wenn Hermes Agent bisher nicht als expliziter Adapter genannt ist, zeigt der Schritt, dass die Infrastruktur für Open-Source-Governance gerade jetzt entsteht.
Vergleich mit OpenClaw und proprietären Plattformen
Hermes Agent steht in direkter Konkurrenz zu OpenClaw, dem reichweitenstärksten Open-Source-Agenten. OpenClaw hat fünfeinhalb Mal mehr GitHub-Stars, aber auch eine deutlich andere Sicherheitsbilanz. Wer zwischen beiden wählt, entscheidet zwischen Ökosystem-Breite und Lern-Tiefe.
| Aspekt | Hermes Agent | OpenClaw |
|---|---|---|
| GitHub-Stars | 103.000+ | 345.000+ |
| Messaging-Integrationen | 6 (kuratiert) | 50+ (breit) |
| Skills | 118 (kuratiert) | 2.857 ClawHub |
| Lern-Mechanismus | GEPA, autonome Skill-Erzeugung | Session-basiert, Skill-Ökosystem |
| Memory-Architektur | FTS5 plus LLM-Summarization, dreischichtig | Session-basiert mit Auto-Notes |
| CVEs seit Januar 2026 | 0 | 9 inkl. CVE-2026-25253 (CVSS 8.8) |
| Supply-Chain-Vorfälle | keine bekannt | ClawHavoc mit 341 schädlichen Skills |
| Reife | jung, schnelle Iteration | etabliert, Governance-Partner |
OpenClaws explosives Wachstum hat Lücken in der Infrastruktur-Bereitschaft offengelegt. Microsoft und Cisco haben eigene Warnungen zu Deployments auf Standard-Infrastruktur herausgegeben. Hermes Agents kleinerer Umfang und strengere Prüfprozesse haben bisher vergleichbare Vorfälle vermieden.
The New Stack, April 2026Gegenüber proprietären Plattformen wie SAP Joule , Microsoft Copilot Studio oder Salesforce Agentforce bietet Hermes Agent ein völlig anderes Werteversprechen. Keine Lizenzkosten, keine Cloud-Migrationspflicht, volle Datenhoheit, aber auch weniger Tiefenintegration in ERP- oder CRM-Systeme. Die Wahl hängt davon ab, ob dein Use-Case in dokumentierten Enterprise-Prozessen oder in flexiblen, technisch-kreativen Automationen liegt.
Herausforderungen und Risiken
Hermes Agent ist jung und nicht für jedes Enterprise-Szenario reif. Die unabhängige Bewertung aus dem deutschen Mittelstand, etwa durch die KI Agentur Stuttgart und biteno im März und April 2026, fällt verhalten aus. Zu früh für produktiven Einsatz im Regelbetrieb, zu wenig Dokumentation für große Rollouts, zu wenig Community-Support für kritische Pfade.
API-Stabilität
Zwischen v0.x-Releases ist die API-Stabilität nicht garantiert. Version-Pinning wird explizit empfohlen, Upgrade-Pfade müssen aktiv kuratiert werden.
Memory-Opacity
Was der Agent gelernt und gespeichert hat, ist schwer zu auditieren. Für DSGVO und EU AI Act sind dedizierte Audit-Tools nötig, die Hermes nicht mitliefert.
Angriffsfläche
Ein permanent laufender systemd-Service mit fünf Messaging-Gateways ist eine erhebliche Angriffsfläche. Das Gateway selbst muss sorgfältig abgesichert werden.
Ein weiterer Punkt: Hermes Agent ist nicht als Code-Generierungs-Plattform gebaut. Wer eine Coding-Agenten-Lösung braucht, ist bei Claude Code, Aider oder Cursor besser aufgehoben. Hermes zielt auf persistente Konversation, Aufgaben-Automation, Research und Routine-Orchestrierung. Die Skill-Qualität variiert bei komplexen Multi-Phase-Aufgaben, besonders wenn Domänen-Wissen fehlt.
Was Unternehmen jetzt tun sollten
Für die meisten deutschen Unternehmen ist Hermes Agent im April 2026 eine strategische Option, kein Produktivsystem. Die richtige Haltung ist ein Pilot unter kontrollierten Bedingungen, um den Self-Improving-Ansatz zu verstehen und für spätere Entscheidungen gegen oder mit proprietären Plattformen einzuordnen.
Scout-Modus aktivieren
Beauftrage einen Technologie-Scout, Hermes Agent als Referenz für Self-Improving-Ansätze zu beobachten. Release-Noten lesen, GitHub-Issues verfolgen, Community-Aktivität bewerten.
Isolierten Pilot starten
Richte einen Pilot für Entwickler-Produktivität, Research-Unterstützung oder Routine-Automation ein. Nicht in produktive Kundendaten-Prozesse integrieren.
Self-Hosting in EU testen
Deploye Hermes Agent auf einem europäischen VPS, etwa bei Hetzner oder IONOS. Prüfe Netzwerk-Isolation, Firewall-Regeln und Credential-Management.
Audit-Logging einplanen
Plane Memory-Inspection und Audit-Logging von Beginn an ein. Nicht nachrüsten. Der EU AI Act verlangt dokumentierte Entscheidungslogik.
Modell-Agnostik nutzen
Verwende Budget-Modelle für Routine-Tasks, Frontier-Modelle nur für kritische Pfade. Live-Switching ermöglicht feine Abstufung ohne Umbau.
Security-Review
Führe eine Security-Review für die Messaging-Gateway-Deployments durch, bevor reale Accounts angebunden werden. Der systemd-Service ist eine erweiterte Angriffsfläche.
Weiterführende Informationen
Häufig gestellte Fragen
Hermes Agent ist ein quelloffenes KI-Agent-Framework von Nous Research, erstmals am 25. Februar 2026 veröffentlicht. Der Agent läuft auf deinem eigenen Server, speichert Gespräche persistent, erzeugt automatisch neue Skills aus gelösten Aufgaben und ist unter MIT-Lizenz frei nutzbar. Version 0.10.0 vom 16. April 2026 bündelt 118 Skills, dreischichtigen Speicher und sechs Messaging-Integrationen.
Hermes Agent ist der erste Open-Source-Agent mit produktiv nutzbarer Selbstverbesserung auf Basis von GEPA. Agenten mit 20 oder mehr selbst erzeugten Skills sind laut Nous Research 40 Prozent schneller bei wiederholten Aufgaben in der gleichen Domäne. Das Projekt hat nach sieben Wochen bereits 95.600 GitHub-Stars erreicht, schneller als LangChain und AutoGen. Dazu kommt Modell-Agnostik mit 15+ LLM-Providern und konsequente MIT-Lizenzierung ohne Enterprise-Tier.
Das Framework selbst ist kostenlos unter MIT-Lizenz. Self-Hosting auf einem europäischen VPS startet bei 5 Euro pro Monat für persönliche Nutzung mit 1 vCPU und 1 GB RAM. Team-Deployments mit Always-On-Betrieb brauchen 2 vCPU und 4 GB RAM, erhältlich ab etwa 15 Euro pro Monat. LLM-Kosten liegen bei etwa 0,30 US-Dollar pro komplexer Aufgabe mit Budget-Modellen wie Claude Haiku 4.5, GPT-5.4 Mini oder Hermes 4 70B.
Derzeit nur eingeschränkt. Die Dokumentation ist unvollständig, die Community ist jung und die API-Stabilität zwischen v0.x-Releases ist nicht garantiert. Für Pilotprojekte mit Entwickler-Produktivität, Research-Assistenz oder Routine-Automation ist Hermes Agent eine sinnvolle Option. Für kritische ERP- oder Kundendaten-Prozesse sollten Unternehmen vorerst auf etabliertere Plattformen wie SAP Joule oder Microsoft Copilot Studio setzen oder auf einen reiferen Release warten.
Hermes Agent kann mit Self-Hosting auf europäischer Infrastruktur DSGVO-Anforderungen gut abbilden. Für den EU AI Act ab 2. August 2026 braucht es zusätzlich Audit-Logging, Transparenz-Dokumentation und einen Skill-Vetting-Prozess. Microsoft hat am 2. April 2026 das Agent Governance Toolkit unter MIT-Lizenz veröffentlicht, das Compliance-Pattern für Open-Source-Frameworks abbildet und die OWASP Agentic Top 10 sowie EU-AI-Act-Anforderungen deckt.
OpenClaw hat mit 345.000 GitHub-Stars und über 50 Messaging-Integrationen mehr Reichweite, aber im März 2026 neun CVEs inklusive CVE-2026-25253 mit CVSS 8.8 und die ClawHavoc-Supply-Chain-Attacke mit 341 schädlichen Skills. Hermes Agent ist kleiner mit 6 Messaging-Integrationen und 118 kuratierten Skills, bisher ohne CVE und stärker auf Lernarchitektur und Sicherheit ausgerichtet. OpenClaw gewinnt bei Ökosystem-Breite, Hermes bei Lern-Tiefe und Security-Posture.
GEPA steht für Genetic-Pareto und ist ein Verfahren zur automatischen Prompt- und Skill-Optimierung. Anders als Reinforcement-Learning-Ansätze, die Execution-Traces zu einem einzelnen Reward-Skalar verdichten, nutzt GEPA ein LLM, um komplette Traces mit Fehlermeldungen, Profiling-Daten und Argumentationsketten zu lesen und gezielte Verbesserungen vorzuschlagen. Das Paper wurde bei der ICLR 2026 als Oral akzeptiert und ermöglicht laut Databricks Research Open-Source-Modellen, proprietäre Frontier-Modelle bei Enterprise-Tasks bei 20 bis 90 Mal geringeren Kosten zu übertreffen.