Google DeepMind entwickelt einen intelligenten Mauszeiger, der mit KI-Funktionen arbeitet und Nutzern ermöglicht, über einfache Spracheingaben und Zeigegesten mit digitalen Inhalten zu interagieren – ohne umständliche Fenster wechseln zu müssen. Das Projekt zeigt, wie klassische Schnittstellen im Zeitalter von KI-Assistenten neu gedacht werden können.
Das System basiert auf Googles KI-Modell Gemini und folgt vier Interaktionsprinzipien, die es der KI ermöglichen, Kontext und Absicht des Nutzers automatisch zu verstehen. Statt aufwändige Prompts zu tippen, können Nutzer künftig einfach auf ein Objekt zeigen und einen Sprachbefehl geben – etwa "Zeig mir die Route" bei einem Gebäudefoto. Experimentelle Demos sind bereits in Google AI Studio verfügbar.
Die Innovation adressiert ein klassisches Frustrationsmoment: Bislang müssen Nutzer ihre Arbeit unterbrechen und ihre Daten in spezialisierte KI-Tools kopieren. Mit dem neuen Ansatz integrischt sich die KI nahtlos in bestehende Workflows, ohne den Nutzer aus seinem aktuellen Kontext herauszureißen. Die Entwicklung zeigt, dass auch etablierte Schnittstellen-Paradigmen – der Mauszeiger existiert seit über 50 Jahren praktisch unverändert – durch intelligente KI-Integration modernisiert werden können.