Unkontrollierte Tokens und Sicherheitslücken können die Skalierung blockieren. Nutanix Agent Gateway bietet zentrale Governance, Token-Quoten und sicheren Tool-Zugriff für Ihre Enterprise-KI. 

Da die IT-Landschaften von Unternehmen einen massiven Zustrom autonomer künstlicher Intelligenz erleben, hat sich der operative Fokus rasant von experimentellen Pilotprojekten hin zu vollwertigen Produktivumgebungen verschoben. Unternehmen testen nicht mehr nur große Sprachmodelle (LLMs); sie betten Netzwerke autonomer Agenten direkt in ihre Kernprozesse ein. Diese rasante Entwicklung bringt jedoch kritische Risiken in Bezug auf Sicherheitsgrenzen, API-Compliance und unvorhersehbare Token-Verbrauchskosten mit sich. Als Reaktion auf diese systemischen Herausforderungen hat Nutanix, Spezialist für hybrides Multicloud-Computing, die allgemeine Verfügbarkeit des Nutanix Agent Gateway bekanntgegeben. Als integraler Bestandteil von Nutanix Enterprise AI 2.7 fungiert diese produktionsbereite Lösung als zentrale Kontrollebene, um Interaktionen zwischen autonomen KI-Agenten, Unternehmenswerkzeugen und verschiedenen LLMs sicher zu steuern und zu überwachen.

Die Industrialisierung von Agentic AI

Moderne Unternehmen bewegen sich schnell über einfache Chatbot-Schnittstellen hinaus. Das heutige Geschäftsumfeld setzt zunehmend auf sogenannte Agentic AI – Systeme, in denen autonome Software-Agenten eigenständig mit Unternehmensdatenbanken, externen APIs und internen Anwendungen interagieren, um hochkomplexe, mehrstufige Workflows zu automatisieren. Während dies eine beispiellose operative Geschwindigkeit ermöglicht, stellt es Plattformteams und IT-Administratoren vor architektonische Herausforderungen. Ohne einen zentralen Kontrollpunkt können Hunderte oder Tausende von Agenten, die mit separaten Modell-Endpunkten kommunizieren, zu gravierenden Lücken in der Sicherheitsüberwachung, unbefugtem Zugriff auf private Datenquellen und explodierenden Cloud-Ausgaben durch unkontrollierten Token-Verbrauch führen.

Nutanix Agent Gateway adressiert diese Infrastrukturprobleme direkt, indem es einen einheitlichen Zugang für alle Agenten-Interaktionen etabliert. Unabhängig davon, ob ein Unternehmen modernste Basismodelle aus der Public Cloud nutzt oder private LLMs im eigenen Rechenzentrum hostet, wendet das Gateway eine konsistente Governance-Schicht an. Dadurch wird sichergestellt, dass das Verhalten autonomer Agenten perfekt mit den Compliance- und Sicherheitsrichtlinien des Unternehmens übereinstimmt.

Nutzen von Envoy Open Source für Enterprise-Zuverlässigkeit

Im architektonischen Zentrum dieser Version steht die tiefe Integration von Nutanix in die Open-Source-Community, insbesondere in das Projekt Envoy AI Gateway. Mit der Überführung des Envoy AI Gateway in den Produktivbetrieb mit der Version 1.0 agiert Nutanix als aktiver Maintainer und Mitgestalter des Projekts. Diese Zusammenarbeit stellt sicher, dass die Transparenz und Zuverlässigkeit auf Enterprise-Niveau, die historisch den weltweiten Internetverkehr über den klassischen Envoy-Proxy angetrieben haben, nun direkt auf moderne KI-Workloads übertragen werden.

„Nutanix ist stolz darauf, ein aktiver Mitwirkender in der Envoy AI Gateway-Community zu sein“, betont Debo Dutta, Chief AI Officer bei Nutanix. „Wir nutzen die Fähigkeiten des Projekts, um unseren Kunden transparente Flexibilität über mehrere Anbieter hinweg und eine produktionsbereite KI-Infrastruktur zu bieten.“ Dieses auf offenen Standards basierende Framework verleiht Unternehmen die Agilität, flexibel zwischen großen KI-Ökosystemen zu wechseln, ohne sich in eine Anbieterabhängigkeit (Vendor Lock-in) zu begeben.

Frühe Implementierungen in der Praxis unterstreichen den realen Nutzen dieses Ansatzes. Shingo Omura, Principal Architect of AI Infrastructure bei LY Corporation, erklärte, dass sie das Envoy AI Gateway nutzen, um den Traffic ihrer mandantenfähigen, selbstgehosteten LLMs zu verwalten. Laut Omura bietet die Lösung eine einheitliche API für flexibles Routing, tokenbasiertes Rate-Limiting, Authentifizierung, Autorisierung und Erweiterbarkeit, was die betriebliche Effizienz ihrer gesamten LLM-Plattform maximiert und sich eng an offenen Standards wie der Kubernetes Gateway API Inference Extension orientiert.

Granulare Architektur und Kernfunktionen

Das Nutanix Agent Gateway bietet ein umfassendes Set an Funktionen, das explizit für die einzigartigen betrieblichen Herausforderungen der Agenten-Ära entwickelt wurde. Zu den wichtigsten Funktionen der Version 1.0 gehören:

  • Natives Model Context Protocol (MCP) Gateway: Es bietet produktionsbereites MCP-Routing und Server-Multiplexing hinter einem einzigen Endpunkt. IT-Teams können Filterungen auf Tool-Ebene (tool-level filtering) mit strengen Include/Exclude-Regeln einrichten, um sicherzustellen, dass Agenten nur auf autorisierte Unternehmensressourcen zugreifen. Zudem nutzt es OAuth 2.0 mit JWT-Claim-Weiterleitung für einen sicheren Identitätsnachweis.
  • Einheitliche Multi-Provider-API: Entwickler erhalten eine einzige, OpenAI-kompatible Schnittstelle vor allen wichtigen KI-Anbietern. Dies umfasst direkte Verbindungen oder Cloud-Endpunkte für OpenAI, Anthropic, Google Gemini, Azure OpenAI, AWS Bedrock sowie Plattformen wie Groq, Together, Mistral, Cohere, DeepSeek und SambaNova.
  • Token-basiertes Verkehrsmanagement: Um unkontrollierte API-Kosten zu drosseln, setzt das Gateway präzise Ratenbegrenzungen, Budgets und Quoten durch. Es versteht die spezifischen Kostenstrukturen von KI-Workloads und bietet eine separate Kostenzuordnung für Input-, Output-, Cache- und Reasoning-Tokens.
  • KI-native Observability und Auditing: Durch den Einsatz von verteiltem Tracing via OpenInference und semantischen OpenTelemetry-Konventionen bietet die Plattform vollständige Transparenz über Chat-, Embeddings-, Bildgebungs- und Audio-Endpunkte. Zudem protokolliert ein detaillierter Audit-Log jede einzelne MCP-Anfrage für lückenlose Compliance-Nachweise.

Strategie für Skalierung und langfristige Kostenkontrolle

Der entscheidende geschäftliche Vorteil des Gateways liegt darin, Unternehmen einen datengestützten Pfad zur Kostenoptimierung aufzuzeigen. Durch die Zentralisierung der Token-Überwachung über verschiedene Public-Cloud-Anbieter hinweg können IT-Abteilungen exakt identifizieren, welche Workloads die externen Servicegebühren in die Höhe treiben. Diese Transparenz ermöglicht es Unternehmen, hochvolumige, vorhersagbare Workloads systematisch von teuren externen APIs auf selbstgehostete, private Modelle zu migrieren, die auf der eigenen, kosteneffizienten Unternehmensinfrastruktur laufen.

Sammy Zoghlami, Senior Vice President EMEA bei Nutanix, fasst zusammen: „Unternehmen bewegen sich schnell von Pilotprojekten zu hoch skalierten Agentic-AI-Bereitstellungen mit Hunderten oder gar Tausenden autonomen Agenten. Ohne eine zentralisierte Governance wird es schwierig, Kosten, Zugriffe und Compliance zu kontrollieren. Nutanix Agent Gateway stellt ein einheitliches Governance-Framework bereit, um Agentic-AI-Bereitstellungen abzusichern und zu überwachen.“

Von Jakob Jung

Dr. Jakob Jung ist Chefredakteur Security Storage und Channel Germany. Er ist seit mehr als 20 Jahren im IT-Journalismus tätig. Zu seinen beruflichen Stationen gehören Computer Reseller News, Heise Resale, Informationweek, Techtarget (Storage und Datacenter) sowie ChannelBiz. Darüber hinaus ist er für zahlreiche IT-Publikationen freiberuflich tätig, darunter Computerwoche, Channelpartner, IT-Business, Storage-Insider und ZDnet. Seine Themenschwerpunkte sind Channel, Storage, Security, Datacenter, ERP und CRM. Kontakt – Contact via Mail: jakob.jung@security-storage-und-channel-germany.de

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

WordPress Cookie Hinweis von Real Cookie Banner