🚀 Produkt-Launch

Google stellt Gemma 4 12B vor: Multimodales KI-Modell für lokale Nutzung

12. Juni 2026·Quelle: Google Stitch / Flutter

Google hat Gemma 4 12B veröffentlicht, ein kompaktes KI-Modell, das Bilder, Audio und Text verarbeitet – ohne separate Encoder. Die neue Architektur reduziert Latenz und Speicherverbrauch erheblich. Besonderheit: Das Modell läuft komplett lokal auf Standard-Computern, auch auf Apple Silicon. Entwickler können es als lokalen API-Server einsetzen oder direkt in native macOS-Apps integrieren. Das Modell beherrscht Spracherkennung, Video-Verständnis und agentengestütztes Problemlösen – und kann sogar seinen eigenen Code schreiben. Google erweitert damit sein Ökosystem für dezentrale, datenschutzfreundliche KI-Anwendungen.

Unsere Einordnung

Googles Strategie, leistungsstarke Multimodal-KI in kompakte, lokal lauffähige Pakete zu schnüren, adressiert einen wachsenden Markt für datenschutzfreundliche, latenzarme KI. Die encoder-freie Architektur ist ein echtes Optimierungssprung – während andere Hersteller an größeren Modellen feilen, fokussiert Google auf praktische Effizienz für Entwickler. Das könnte der Wendepunkt sein, an dem lokale KI-Agenten alltagsfähig werden.

Schlüsselfakten

Encoder-freie Architektur: Ein einziger Decoder verarbeitet alle Modalitäten statt mehrerer separater Encoder
Deutlich schneller: Reduzierte Latenz und optimierter Speicherverbrauch durch einheitliches System
Läuft vollständig lokal: Funktioniert offline auf Standard-PCs und Apple Silicon ohne Cloud-Abhängigkeit
Agentengestützt: Kann eigenständig Code schreiben, Videos analysieren und mit Tools wie OpenCode integriert werden
Native macOS-Apps: Google AI Edge Gallery und Eloquent App bringen Gemma 4 12B auf den Desktop

Artikel teilen

Weitere News

📰News

Reibung macht Roboter-Weltmodelle präziser

27. Juli 2026

📰News

Shark-Saugroboter: Kritische Sicherheitslücke entdeckt

27. Juli 2026

📰News

Anthropic behält Fable dauerhaft in Claude Max

27. Juli 2026

Alle News