NVIDIA und Amazon Web Services starten ein KI-Modell speziell für autonome Agenten. Das Nemotron 3 Ultra Sprachmodell mit 550 Milliarden Parametern soll beim Einsatz von KI-Agenten deutlich schneller und kostengünstiger sein als bisherige Systeme. Mit einer einfachen One-Click-Deployment auf AWS SageMaker JumpStart können Entwickler das Modell sofort nutzen.
Das Hybrid-Modell kombiniert Transformer- und Mamba-Architektur im Mixture-of-Experts-Format. Das bedeutet praktisch: Von den 550 Milliarden Parametern werden nur 55 Milliarden pro Schritt aktiviert. Dadurch benötigt die KI weniger Rechenpower und kann trotzdem längere Aufträge bearbeiten – bis zu einer Million Tokens im Kontext.
Für Enterprise-Anwendungen mit komplexen, mehrstufigen Aufgaben ist das relevant: Agents, die Dutzende von Werkzeugen aufrufen, mehrere Sub-Agenten koordinieren und ihre Arbeit selbst überprüfen, arbeiten mit Nemotron 3 Ultra 5-mal schneller und bis zu 30 Prozent günstiger als mit bisherigen Modellen. Besonders für Coding-Agenten, Forschungsaufgaben oder mehrstufige Business-Prozesse macht sich die Spezialisierung aus.