✍️ Blog

NVIDIAs neues 550-Milliarden-Modell für KI-Agenten startet

17. Juni 2026·Quelle: Ollama Blog

NVIDIA hat Nemotron 3 Ultra über Olamas Cloud-Plattform veröffentlicht. Das Open-Source-Sprachmodell mit 550 Milliarden Parametern ist speziell für autonome KI-Agenten optimiert und kann bis zu einer Million Token-Kontext verarbeiten. Mit nur 55 Milliarden aktiven Parametern pro Token und NVIDIAs 4-Bit-Floating-Point-Format soll das Modell 30 Prozent kostengünstiger laufen als vergleichbare Systeme. Nemotron 3 Ultra wurde für komplexe, mehrstufige Workflows trainiert und eignet sich besonders für Coding-Agenten, Forschungsaufgaben und Enterprise-Anwendungen. Die Integration mit beliebten Agent-Frameworks wie Claude Code, OpenClaw und Hermes ist bereits möglich.

Unsere Einordnung

Nemotron 3 Ultra adressiert einen wachsenden Markt: Unternehmen brauchen spezialisierte, effiziente Modelle für autonome Agenten – nicht nur große Allzweck-LLMs. NVIDIAs Fokus auf Kosteneffizienz und native Integrationen positioniert das Modell als praktische Alternative zu geschlossenen Systemen, könnte aber auch Druck auf andere Open-Source-Entwickler ausüben.

Schlüsselfakten

550 Milliarden Parameter, aber nur 55 Milliarden pro Token aktiv (MoE-Architektur)
1 Million Token Kontext für lange Dokumentenzusammenhänge und Multi-Step-Workflows
30% Kosteneinsparung gegenüber anderen führenden Open-Source-Modellen
Optimiert für NVIDIAs NVFP4 4-Bit-Format für speicher- und rechnereffiziente Nutzung
Direkt integrierbar mit Claude Code, OpenClaw und Hermes Agent-Frameworks

Artikel teilen

Weitere News

📰News

FCC-Regelung lenkt Blick auf KI-Sicherheit in Lagern

1. August 2026

📊Analyse

KI-Steuersoftware im Test: ChatGPT vs. Spezialtools

1. August 2026

📰News

Generalist erweitert GEN-1 für verschiedene Roboterhände

1. August 2026

Alle News