Die besten Handys ab 600€ Die besten Handys < 500€ Die besten Saugroboter Die besten E-Scooter

Google enthüllt Gemini 2.0: Neues KI-Modell mit erweiterten Funktionen

Es wird spannend!

Google hat mit Gemini 2.0 eine überarbeitete Version seines KI-Modells veröffentlicht, die deutlich leistungsfähiger als ihr Vorgänger sein soll. Google erweitert die Künstliche Intelligenz damit um neue Tools zur Bild- und Videoerstellung sowie zur Bildbearbeitung. Zu den wichtigsten Neuerungen zählen der Bildgenerator Imagen 3, das Videomodell Veo 2 und das experimentelle Bearbeitungstool Whisk.

KI-Agenten und multimodale Fähigkeiten

Das neue Gemini-Modell setzt auf eine multimodale Verarbeitung, die unterschiedliche Medienformate kombiniert und analysiert. Google bezeichnet dies als Beginn einer neuen Ära von KI-Agenten, die künftig stärker in den hauseigenen Anwendungen verankert werden. Diese Technologie könnte insbesondere in Google-Diensten wie dem Assistant oder der Suche neue Funktionen ermöglichen.

Verbesserte KI-Bildgenerierung

Zusätzlich wurde die dritte Generation des Bildgenerators Imagen weiter optimiert, um realistischere und detailreichere Bilder zu erzeugen. Dank besserer Inhaltsanalyse und überarbeiteter Kompositionslogik lassen sich laut Google nun hochwertigere und stilistisch einheitlichere Bilder erstellen. Ein weiteres neues Tool ist Whisk, das Bilder analysieren, in einzelne Elemente zerlegen und anhand von Nutzeranweisungen umgestalten kann. Es funktioniert wie eine interaktive Schnittstelle für KI-gesteuerte Bildbearbeitung und könnte langfristig neue Möglichkeiten in der kreativen Gestaltung eröffnen.

gemini advanced google newsletter teaser
Teaser aus dem offiziellen Gemini-Advanced-Newsletter (Quelle: 9To5Google)

Fortschritte bei der KI-Videoerstellung

Mit Veo 2 geht Google einen Schritt weiter in der automatisierten Videogenerierung. Obwohl die erstellten Clips derzeit nur wenige Sekunden lang sein können, wurden deutliche Fortschritte erzielt, um unnatürliche Bewegungen oder visuelle Fehler zu reduzieren. Das Ziel ist es, künftig noch realistischere Bewegtbilder zu ermöglichen. OpenAI versucht mit Sora eine ähnliche Lösung anzubieten, jedoch merkt man hier sehr stark, dass die KI Schwierigkeiten mit der Physik hat.

Allround-PC Preisvergleich

Mit * oder markierte Links sind „Affiliate-Links“. Mit dem Kauf über diesen Link erhalten wir eine Verkaufsprovision, ohne dass du mehr bezahlst.

Quellen:
Max Jambor @ Allround-PC Max Jambor Redakteur

Als angehender Technikjournalist, ist er hauptsächlich für die Bereiche Mobile und Wearables zuständig und kümmert sich um News sowie Testberichte von Smartphones, Tablets, Smartwatches und Kopfhörern. In seiner Freizeit verfolgt er die neuesten Entwicklungen im Bereich Consumer Electronics und Künstlicher Intelligenz. Wenn er mal nicht am PC sitzt, trifft man ihn im Fitnessstudio, auf Reisen oder beim Feiern mit Freunden.

Aus Gründen der besseren Lesbarkeit wird auf die gleichzeitige Verwendung männlicher, weiblicher und diverser Sprachformen (m/w/d) verzichtet. Alle Personenbezeichnungen gelten gleichermaßen für alle Geschlechter.

^