ChatGPT wird wohl den meisten Menschen in den Sinn kommen, wenn sie an KI denken. Doch mit Google Gemini gibt es einen weiteren starken Konkurrenten in diesem Bereich, der vor allem im Smartphone-Sektor an Bedeutung gewinnen könnte. Doch welche Funktionen bietet das Sprachmodell Gemini eigentlich?
Ursprünglich ging Google Gemini Anfang 2023 als „Google Bard“ in den USA an den Start – vermutlich als Reaktion auf ChatGPT. Immerhin wurde die KI von OpenAI als „Code Red“ und somit als Bedrohung für Google eingestuft. Allerdings verlief der Launch eher holprig, denn der Chatbot wurde vor allem durch seine anfängliche Fehleranfälligkeit bekannt. Erst im Dezember 2023 wurde Bard dann offiziell zu Gemini unbenannt und zu einer KI erweitert.
Google Gemini erstellt Texte und beantwortet eure Fragen
Natürlich kann Gemini wie einst Bard als normaler Chatbot genutzt werden. Besonders praktisch ist dabei die Text-Generierung auf Basis eines Text-Prompts. Hiermit könnt ihr ganze Texte, Geschichten, E-Mail Antworten oder Beschreibungen aus dem Nichts erschaffen. Eure Textbefehle sollten jedoch möglichst viele und vor allem konkrete Informationen beinhalten, damit die KI passende Antworten ausgeben kann. Außerdem hilft es, dem Chatbot eine bestimmte Rolle zuzuweisen, um einen gewissen Textstil zu erhalten. Daneben lassen sich auch Fragen beantworten und Texte in andere Sprachen übersetzen.
Gemini kann zudem, im Gegensatz zu Bard, Texte, Bilder, Videos und Audioaufnahmen verarbeiten. Ihr könnt unter anderem ein Bild hochladen und den Bildinhalt von Gemini analysieren lassen. Teilweise erkennt Gemini sogar explizite Produkte, die auf dem Bild gezeigt werden und gibt weitere Details hierzu aus.

Gemini Bild-Generator vorerst nicht mehr verfügbar
Theoretisch umfasst Gemini auch einen Bild-Generator, der ähnlich wie OpenAIs Dall-E funktioniert. Entsprechend wird auch hier ein Text-zu-Bild-Modell (Imagen 2) verwendet, das Bilder auf Basis eines Text-Prompts erstellt. Leider ist die Funktion derzeit nicht nutzbar, da sie im Februar 2024 vorübergehend deaktiviert wurde. Grund hierfür waren unter anderem generierte Bilder von historischen Szenen, bei denen die falsche Hautfarbe verwendet wurde. Bisher ist nicht klar, wann das Feature wieder aktiviert wird. Bis dahin bleibt als Alternative Dall-e von OpenAI, das sowohl von ChatGPT als auch dem Microsoft Copilot genutzt wird.
Gemini Advanced mit Zugriff auf Google Apps
Neuerdings kann Gemini auch auf Google-Apps wie Google Maps, Google Flüge, Google Hotels und YouTube, aber auch Gmail, Google Drive und Google Docs zugreifen. Dabei soll die KI Usern helfen, schneller und effizienter Informationen zu sammeln und zu verarbeiten. Zum Beispiel kann Gemini nun bei der Reiseplanung unterstützen, indem es direkt auf Flug- und Hotelbuchungen zugreift und die besten Optionen vorschlägt. Auch die Planung von Tagesausflügen wird erleichtert, da die künstliche Intelligenz Vorschläge für Sehenswürdigkeiten und Aktivitäten aus YouTube und Google Maps zusammenstellen kann.

Google KI-Suche
Daneben soll Gemini bald auch fester Bestandteil der Google Suche werden. Die KI-gestützte Suchfunktion wird schon seit einiger Zeit als Beta getestet und soll Nutzern schneller konkrete Antworten auf ihre Anfragen liefern. Dafür fasst die künstliche Intelligenz die Suchergebnisse zusammen und zeigt das Ergebnis oberhalb der üblichen Weblinks an. Bisher arbeitet dieses Feature jedoch nicht zu 100 % korrekt, denn immer wieder berichten User über absurde Antworten. Hierzu zählt etwa der Vorschlag, Käse auf einer Pizza mit nicht giftigem Klebstoff zu befestigen.
Auch der Google Assistent profitiert von der Gemini KI, denn der Sprachassistent kann seit einiger Zeit auf das Sprachmodell zurückgreifen. Der Assistent lässt sich wie gewohnt mit dem Befehl „Okay Google“ aktivieren, verarbeitet die Anfrage aber über die Gemini App. Auf dem Google Pixel 9 (Pro) könnte Gemini den alten Google Assistent sogar komplett verdrängen.

Gemini Sprachmodell mit drei Versionen
Gemini basiert auf dem gleichnamigen Sprachmodell von Google, das auf den zuvor veröffentlichten Modellen LaMDA und PaLM aufbaut. Ein Sprachmodell wird mit einer großen Menge an Daten (Texte, Bildmaterial, Bücher, etc.) gefüttert und damit trainiert. Während des Trainings lernt das Modell, Muster und Zusammenhänge in der Sprache zu erkennen. Es lernt zum Beispiel, welches Wort wahrscheinlich als Nächstes kommt oder wie Sätze strukturiert sind.
Aktuell ist das Gemini Sprachmodell in drei Versionen unterteilt, wobei Gemini Pro die Basis für die Standardversion bildet. Bei Gemini Nano handelt es sich um das kleinste Modell, das vor allem für Smartphones gedacht ist. Gemini Ultra ist wiederum deutlich leistungsfähiger und unterstützt auch bei komplexen Aufgaben, darunter beim Erstellen von Programmiercode. Das Ultra-Modell ist zum jetzigen Zeitpunkt aber nicht in Deutschland verfügbar.
Ist Google Gemini kostenlos?
Die Nutzung von Google Gemini Pro ist vollkommen kostenlos. Ihr könnt die App oder die Webseite ohne monatliches Abo frei nutzen. Lediglich Gemini Advanced auf Basis von Gemini Pro 1.5 kann nicht ohne Zusatzkosten aufgerufen werden. Das Ganze ist Teil von Google One und kostet rund 22 Euro pro Monat, wobei ebenfalls 2 TB Cloudspeicher im Abo enthalten sind.
Nutzung bei anderen Herstellern
Inzwischen wird Google Gemini auch von anderen Herstellern genutzt, darunter etwa Samsung. Die Südkoreaner nutzen Gemini Nano für die Galaxy AI (Tipps & Tricks), die zusammen mit dem Galaxy S24 (Ultra) erstmals vorgestellt wurde. Zu den Funktionen der Galaxy AI gehören etwa „Circle to Search“, das Zusammenfassen von Website-Inhalten, Live-Übersetzung beim Telefonieren und das Übersetzen von Chats.
Es gibt auch Gerüchte, dass Apple an Google Gemini interessiert ist. Die Google KI könnte demnach mit einem zukünftigen iOS-Update seinen Weg auf das iPhone (Vergleichstest) finden. Laut einem Bericht von Bloomberg könnte Gemini für Aufgaben rund um generative KI zuständig sein, wozu das Erstellen von Texten, Bildern und Videos gehören.
Hierbei wird es sich allerdings nicht um Apple Intelligence handeln. Stattdessen könnte Gemini wie ChatGPT in das OS eingebunden werden, sodass User zukünftig aus mehreren KIs auswählen können. Weitere Details zur Integration könnte es zum nächsten iPhone Event im September geben, auf dem das iPhone 16 vorgestellt wird.
Mit * oder markierte Links sind „Affiliate-Links“. Mit dem Kauf über diesen Link erhalten wir eine Verkaufsprovision, ohne dass du mehr bezahlst.
Quellen:Aus Gründen der besseren Lesbarkeit wird auf die gleichzeitige Verwendung männlicher, weiblicher und diverser Sprachformen (m/w/d) verzichtet. Alle Personenbezeichnungen gelten gleichermaßen für alle Geschlechter.
Kommentieren, Austauschen und Fragen...
Schreibe einen eigenen Kommentar