Google hat mit Gemini 2.0 eine überarbeitete Version seines KI-Modells veröffentlicht, die deutlich leistungsfähiger als ihr Vorgänger sein soll. Google erweitert die Künstliche Intelligenz damit um neue Tools zur Bild- und Videoerstellung sowie zur Bildbearbeitung. Zu den wichtigsten Neuerungen zählen der Bildgenerator Imagen 3, das Videomodell Veo 2 und das experimentelle Bearbeitungstool Whisk.
KI-Agenten und multimodale Fähigkeiten
Das neue Gemini-Modell setzt auf eine multimodale Verarbeitung, die unterschiedliche Medienformate kombiniert und analysiert. Google bezeichnet dies als Beginn einer neuen Ära von KI-Agenten, die künftig stärker in den hauseigenen Anwendungen verankert werden. Diese Technologie könnte insbesondere in Google-Diensten wie dem Assistant oder der Suche neue Funktionen ermöglichen.
- Gemini 2.0 Pro Experimental: „Unser führendes Modell, das für die neue Ära der KI entwickelt wurde, bietet mehr Sachlichkeit und eine außergewöhnliche Leistung bei Codierungs- und Mathe-Aufgaben. Gemini 2.0 Pro Experimental wird Ihnen helfen, die komplexesten Aufgaben mit größerer Leichtigkeit und Genauigkeit zu bewältigen.“
- Gemini 2.0 Flash Thinking: „Dieses experimentelle Modell basiert auf der Geschwindigkeit und Leistung von 2.0 Flash und stellt seinen Denkprozess in Echtzeit dar. Erweitern Sie es, um zu sehen, warum es auf eine bestimmte Weise reagiert hat, seine Annahmen und verfolgen Sie die Argumentation.“
Verbesserte KI-Bildgenerierung
Zusätzlich wurde die dritte Generation des Bildgenerators Imagen weiter optimiert, um realistischere und detailreichere Bilder zu erzeugen. Dank besserer Inhaltsanalyse und überarbeiteter Kompositionslogik lassen sich laut Google nun hochwertigere und stilistisch einheitlichere Bilder erstellen. Ein weiteres neues Tool ist Whisk, das Bilder analysieren, in einzelne Elemente zerlegen und anhand von Nutzeranweisungen umgestalten kann. Es funktioniert wie eine interaktive Schnittstelle für KI-gesteuerte Bildbearbeitung und könnte langfristig neue Möglichkeiten in der kreativen Gestaltung eröffnen.

Fortschritte bei der KI-Videoerstellung
Mit Veo 2 geht Google einen Schritt weiter in der automatisierten Videogenerierung. Obwohl die erstellten Clips derzeit nur wenige Sekunden lang sein können, wurden deutliche Fortschritte erzielt, um unnatürliche Bewegungen oder visuelle Fehler zu reduzieren. Das Ziel ist es, künftig noch realistischere Bewegtbilder zu ermöglichen. OpenAI versucht mit Sora eine ähnliche Lösung anzubieten, jedoch merkt man hier sehr stark, dass die KI Schwierigkeiten mit der Physik hat.
Mit * oder markierte Links sind „Affiliate-Links“. Mit dem Kauf über diesen Link erhalten wir eine Verkaufsprovision, ohne dass du mehr bezahlst.
Quellen:Aus Gründen der besseren Lesbarkeit wird auf die gleichzeitige Verwendung männlicher, weiblicher und diverser Sprachformen (m/w/d) verzichtet. Alle Personenbezeichnungen gelten gleichermaßen für alle Geschlechter.
Kommentieren, Austauschen und Fragen...
Schreibe einen eigenen Kommentar