ChatGPT wird wohl den meisten Menschen in den Sinn kommen, wenn sie an KI denken. Doch mit Google Gemini gibt es einen weiteren starken Konkurrenten in diesem Bereich, der vor allem im Smartphone-Sektor an Bedeutung gewinnen könnte. Doch welche Funktionen bietet das Sprachmodell Gemini eigentlich?
Ursprünglich ging Google Gemini Anfang 2023 als „Google Bard“ in den USA an den Start – vermutlich als Reaktion auf ChatGPT. Immerhin wurde die KI von OpenAI als „Code Red“ und somit als Bedrohung für Google eingestuft. Allerdings verlief der Launch eher holprig, denn der Chatbot wurde vor allem durch seine anfängliche Fehleranfälligkeit bekannt. Erst im Dezember 2023 wurde Bard dann offiziell zu Gemini umbenannt und zu einer KI erweitert.
Google Gemini erstellt Texte und beantwortet eure Fragen
Natürlich kann Gemini wie einst Bard als normaler Chatbot genutzt werden. Besonders praktisch ist dabei die Text-Generierung auf Basis eines Text-Prompts. Hiermit könnt ihr ganze Texte, Geschichten, E-Mail-Antworten oder Beschreibungen aus dem Nichts erschaffen. Eure Textbefehle sollten jedoch möglichst viele und vor allem konkrete Informationen beinhalten, damit die KI passende Antworten ausgeben kann. Außerdem hilft es, dem Chatbot eine bestimmte Rolle zuzuweisen, um einen gewissen Textstil zu erhalten. Daneben lassen sich auch Fragen beantworten und Texte in andere Sprachen übersetzen.
Gemini kann zudem, im Gegensatz zu Bard, Texte, Bilder, Videos und Audioaufnahmen verarbeiten. Ihr könnt unter anderem ein Bild hochladen und den Bildinhalt von Gemini analysieren lassen. Teilweise erkennt Gemini sogar explizite Produkte, die auf dem Bild gezeigt werden und gibt weitere Details hierzu aus.

Gemini Bild-Generator vorerst nicht mehr verfügbar
Gemini umfasst auch einen Bild-Generator, der ähnlich wie OpenAIs Dall-E funktioniert. Entsprechend wird auch hier ein Text-zu-Bild-Modell (Imagen 3) verwendet, das Bilder auf Basis eines Text-Prompts erstellt. Inzwischen fallen die Ergebnisse der Bild-KI sogar richtig gut aus – da braucht es schon ein geschultes Auge, um den Unterschied zur Realität zu erkennen. Natürlich könnt ihr der KI auch einen gewissen Stil vorschlagen, etwa den vom berühmten japanischen Animationsstudio Ghibli.

Gemini Advanced mit Zugriff auf Google Apps
Des Weiteren kann Gemini auch auf Google-Apps wie Google Maps, Google Flüge, Google Hotels und YouTube, aber auch Gmail, Google Drive und Google Docs zugreifen. Dabei soll die KI Usern helfen, schneller und effizienter Informationen zu sammeln und zu verarbeiten. Zum Beispiel kann Gemini nun bei der Reiseplanung unterstützen, indem es direkt auf Flug- und Hotelbuchungen zugreift und die besten Optionen vorschlägt. Auch die Planung von Tagesausflügen wird erleichtert, da die künstliche Intelligenz Vorschläge für Sehenswürdigkeiten und Aktivitäten aus YouTube und Google Maps zusammenstellen kann.

Google KI-Suche
Daneben ist Gemini auch fester Bestandteil der Google Suche werden. Die KI-gestützte Suchfunktion ist seit einiger Zeit verfügbar und soll Nutzern schneller konkrete Antworten auf ihre Anfragen liefern. Dafür fasst die künstliche Intelligenz die Suchergebnisse zusammen und zeigt das Ergebnis oberhalb der üblichen Weblinks an. Bisher arbeitet dieses Feature jedoch nicht zu 100 % korrekt, denn immer wieder berichten User über absurde Antworten. Auch lassen sich immer wieder Falschinformationen in der KI-Zusammenfassung finden.
Auch der Google Assistent profitiert von der Gemini-KI, denn der Sprachassistent basiert seit einiger Zeit auf dem Sprachmodell. Der Assistent lässt sich wie gewohnt mit dem Befehl „Okay Google“ aktivieren, verarbeitet die Anfrage aber per KI. Dadurch lässt sich deutlich natürlicher mit dem Assitant interagieren – ähnlich wie bei ChatGPT Voice.

Gemini Sprachmodell mit drei Versionen
Gemini basiert auf dem gleichnamigen Sprachmodell von Google, das auf den zuvor veröffentlichten Modellen LaMDA und PaLM aufbaut. Ein Sprachmodell wird mit einer großen Menge an Daten (Texte, Bildmaterial, Bücher, etc.) gefüttert und damit trainiert. Während des Trainings lernt das Modell, Muster und Zusammenhänge in der Sprache zu erkennen. Es lernt zum Beispiel, welches Wort wahrscheinlich als Nächstes kommt oder wie Sätze strukturiert sind.
Aktuell ist das Gemini Sprachmodell in mehrere Versionen unterteilt, wobei Gemini Flash 2.5 die Basis für die Standardversion bildet. Bei Gemini Nano handelt es sich um das kleinste Modell, das vor allem für Smartphones gedacht ist. Gemini 2.5 Pro ist wiederum deutlich leistungsfähiger und unterstützt auch bei komplexen Aufgaben, darunter beim Erstellen von Programmiercode.
Das Pro-Modell ist begrenzt in der kostenlosen Gemini-Verison verfügbar, kostet ansonsten aber. Daneben gibt es auch noch Gemini Ultra, welches aber nur im Google AI Ultra-Plan verfügbar ist, der 250 US-Dollar pro Monat kostet. In diesem Plan ist aber auch das neue Veo 3 Videomodell integriert, mit dem sich Kurzvideos per KI erstellen lassen.
Ist Google Gemini kostenlos?
Die Nutzung von Google Gemini Flash ist vollkommen kostenlos. Ihr könnt die App oder die Webseite ohne monatliches Abo frei nutzen. Lediglich Gemini Pro 2.5 kann nicht ohne Zusatzkosten aufgerufen werden. Das Ganze ist Teil von Google One und kostet rund 22 Euro pro Monat, wobei ebenfalls 2 TB Cloudspeicher im Abo enthalten sind.
Nutzung bei anderen Herstellern
Inzwischen wird Google Gemini auch von anderen Herstellern genutzt, darunter etwa Samsung. Die Südkoreaner nutzen Gemini Nano für die Galaxy AI (Tipps & Tricks), die zusammen mit dem Galaxy S25 (Ultra) erstmals vorgestellt wurde. Zu den Funktionen der Galaxy AI gehören etwa „Circle to Search“, das Zusammenfassen von Website-Inhalten, Live-Übersetzung beim Telefonieren und das Übersetzen von Chats. Honor nutzt wiederum Googles Veo 2, um eine Bild-zu-Video-Generierung zu bieten.
Mit * oder markierte Links sind „Affiliate-Links“. Mit dem Kauf über diesen Link erhalten wir eine Verkaufsprovision, ohne dass du mehr bezahlst.
Quellen: