Auf der jährlichen Google I/O Konferenz hat der Konzern 2026 zwölf bedeutende Ankündigungen präsentiert. Im Mittelpunkt steht Gemini Omni, ein neues KI-Modell, das Videos aus beliebigen Eingabeformaten erstellen kann – kombiniert aus Bildern, Audio, Video und Text. Parallel dazu stellte Google eine überarbeitete Suchmaschine vor, die multimodale Abfragen ermöglicht: Nutzer können künftig Bilder, Dateien, Videos oder offene Browser-Tabs als Suchkriterien verwenden. Das Unternehmen beschreibt diese Entwicklungen als Beispiele für "technische Durchbrüche" und praktische Anwendungen seiner KI-Technologie im Alltag. Neben den beiden Flaggschiffen kündigten sich weitere, noch nicht näher spezifizierte Produktaktualisierungen an.
Google zeigt KI-Durchbrüche auf I/O 2026
Unsere Einordnung
Gemini Omni markiert einen qualitativen Sprung in multimodaler KI – die Fähigkeit, nahtlos zwischen Text, Bild, Audio und Video zu arbeiten, nähert sich menschlicher Verarbeitung an. Ob Googles Search-Überarbeitung tatsächlich besser ist als bestehende Multimodal-Suche, wird sich erst in der Praxis zeigen; derzeit konkurrieren hier auch OpenAI und andere Player. Der Fokus auf Videoerstellung könnte ein direkter Gegenzug gegen OpenAIs Sora sein.
Schlüsselfakten
- Gemini Omni: neues KI-Modell zur Videogenerierung aus kombinierten Eingaben (Bilder, Audio, Video, Text)
- Multimodale Suchfunktion: Nutzer können künftig mit Text, Bildern, Dateien, Videos oder Browser-Tabs suchen
- Konversative Videobearbeitung: Videos lassen sich durch natürlichsprachige Anweisungen editieren
- 12 Hauptankündigungen auf Google I/O 2026
- Focus auf praktische KI-Anwendungen im Alltag neben technologischen Durchbrüchen