NVIDIA hat Nemotron 3 Ultra über Olamas Cloud-Plattform veröffentlicht. Das Open-Source-Sprachmodell mit 550 Milliarden Parametern ist speziell für autonome KI-Agenten optimiert und kann bis zu einer Million Token-Kontext verarbeiten. Mit nur 55 Milliarden aktiven Parametern pro Token und NVIDIAs 4-Bit-Floating-Point-Format soll das Modell 30 Prozent kostengünstiger laufen als vergleichbare Systeme. Nemotron 3 Ultra wurde für komplexe, mehrstufige Workflows trainiert und eignet sich besonders für Coding-Agenten, Forschungsaufgaben und Enterprise-Anwendungen. Die Integration mit beliebten Agent-Frameworks wie Claude Code, OpenClaw und Hermes ist bereits möglich.
NVIDIAs neues 550-Milliarden-Modell für KI-Agenten startet
Unsere Einordnung
Nemotron 3 Ultra adressiert einen wachsenden Markt: Unternehmen brauchen spezialisierte, effiziente Modelle für autonome Agenten – nicht nur große Allzweck-LLMs. NVIDIAs Fokus auf Kosteneffizienz und native Integrationen positioniert das Modell als praktische Alternative zu geschlossenen Systemen, könnte aber auch Druck auf andere Open-Source-Entwickler ausüben.
Schlüsselfakten
- 550 Milliarden Parameter, aber nur 55 Milliarden pro Token aktiv (MoE-Architektur)
- 1 Million Token Kontext für lange Dokumentenzusammenhänge und Multi-Step-Workflows
- 30% Kosteneinsparung gegenüber anderen führenden Open-Source-Modellen
- Optimiert für NVIDIAs NVFP4 4-Bit-Format für speicher- und rechnereffiziente Nutzung
- Direkt integrierbar mit Claude Code, OpenClaw und Hermes Agent-Frameworks