NVIDIA hat Cosmos 3 vorgestellt – ein universelles KI-Modell, das Videogenerierung, physikalisches Denken und Aktionsplanung in einer einzigen Architektur vereint. Das auf Hugging Face verfügbare System soll Entwicklern ermöglichen, realistische Simulationen für Robotik, autonome Fahrzeuge und intelligente Räume zu erstellen – ohne mehrere spezialisierte Modelle kombinieren zu müssen.
Cosmos 3 basiert auf einer Mixture-of-Transformers-Architektur (MoT) und kombiniert Funktionen früherer separater Modelle wie Cosmos Predict für Videogenerierung, Cosmos Transfer für kontrollierte Generierung und Cosmos Reason für Szenenverständnis. Die Lösung unterstützt auch Post-Training auf eigenen Daten und umfasst offene Datensätze für physikalische KI-Anwendungen.