Die besten Handys ab 600€ Die besten Handys < 500€ Die besten Saugroboter Die besten E-Scooter

Was ist Google Gemini? Diese Funktionen bietet die Google-Alternative zur ChatGPT!

Diese Funktionen bietet Gemini!
Google Gemini
Bild: Google

ChatGPT wird wohl den meisten Menschen in den Sinn kommen, wenn sie an KI denken. Doch mit Google Gemini gibt es einen weiteren starken Konkurrenten in diesem Bereich, der vor allem im Smartphone-Sektor an Bedeutung gewinnen könnte. Doch welche Funktionen bietet das Sprachmodell Gemini eigentlich?

Ursprünglich ging Google Gemini Anfang 2023 als „Google Bard“ in den USA an den Start – vermutlich als Reaktion auf ChatGPT. Immerhin wurde die KI von OpenAI als „Code Red“ und somit als Bedrohung für Google eingestuft. Allerdings verlief der Launch eher holprig, denn der Chatbot wurde vor allem durch seine anfängliche Fehleranfälligkeit bekannt. Erst im Dezember 2023 wurde Bard dann offiziell zu Gemini umbenannt und zu einer KI erweitert.

Google Gemini erstellt Texte und beantwortet eure Fragen

Natürlich kann Gemini wie einst Bard als normaler Chatbot genutzt werden. Besonders praktisch ist dabei die Text-Generierung auf Basis eines Text-Prompts. Hiermit könnt ihr ganze Texte, Geschichten, E-Mail-Antworten oder Beschreibungen aus dem Nichts erschaffen. Eure Textbefehle sollten jedoch möglichst viele und vor allem konkrete Informationen beinhalten, damit die KI passende Antworten ausgeben kann. Außerdem hilft es, dem Chatbot eine bestimmte Rolle zuzuweisen, um einen gewissen Textstil zu erhalten. Daneben lassen sich auch Fragen beantworten und Texte in andere Sprachen übersetzen.

Gemini kann zudem, im Gegensatz zu Bard, Texte, Bilder, Videos und Audioaufnahmen verarbeiten. Ihr könnt unter anderem ein Bild hochladen und den Bildinhalt von Gemini analysieren lassen. Teilweise erkennt Gemini sogar explizite Produkte, die auf dem Bild gezeigt werden und gibt weitere Details hierzu aus.

Google Gemini
Screenshot: Allround-PC

Gemini Bild-Generator vorerst nicht mehr verfügbar

Gemini umfasst auch einen Bild-Generator, der ähnlich wie OpenAIs Dall-E funktioniert. Entsprechend wird auch hier ein Text-zu-Bild-Modell (Imagen 3) verwendet, das Bilder auf Basis eines Text-Prompts erstellt. Inzwischen fallen die Ergebnisse der Bild-KI sogar richtig gut aus – da braucht es schon ein geschultes Auge, um den Unterschied zur Realität zu erkennen. Natürlich könnt ihr der KI auch einen gewissen Stil vorschlagen, etwa den vom berühmten japanischen Animationsstudio Ghibli.

köln ghibli ki gemini

Gemini Advanced mit Zugriff auf Google Apps

Des Weiteren kann Gemini auch auf Google-Apps wie Google Maps, Google Flüge, Google Hotels und YouTube, aber auch Gmail, Google Drive und Google Docs zugreifen. Dabei soll die KI Usern helfen, schneller und effizienter Informationen zu sammeln und zu verarbeiten. Zum Beispiel kann Gemini nun bei der Reiseplanung unterstützen, indem es direkt auf Flug- und Hotelbuchungen zugreift und die besten Optionen vorschlägt. Auch die Planung von Tagesausflügen wird erleichtert, da die künstliche Intelligenz Vorschläge für Sehenswürdigkeiten und Aktivitäten aus YouTube und Google Maps zusammenstellen kann.

Google Gemini

Google KI-Suche

Daneben ist Gemini auch fester Bestandteil der Google Suche werden. Die KI-gestützte Suchfunktion ist seit einiger Zeit verfügbar und soll Nutzern schneller konkrete Antworten auf ihre Anfragen liefern. Dafür fasst die künstliche Intelligenz die Suchergebnisse zusammen und zeigt das Ergebnis oberhalb der üblichen Weblinks an. Bisher arbeitet dieses Feature jedoch nicht zu 100 % korrekt, denn immer wieder berichten User über absurde Antworten. Auch lassen sich immer wieder Falschinformationen in der KI-Zusammenfassung finden.

Auch der Google Assistent profitiert von der Gemini-KI, denn der Sprachassistent basiert seit einiger Zeit auf dem Sprachmodell. Der Assistent lässt sich wie gewohnt mit dem Befehl „Okay Google“ aktivieren, verarbeitet die Anfrage aber per KI. Dadurch lässt sich deutlich natürlicher mit dem Assitant interagieren – ähnlich wie bei ChatGPT Voice.

Google Gemini
Bild: Google

Gemini Sprachmodell mit drei Versionen

Gemini basiert auf dem gleichnamigen Sprachmodell von Google, das auf den zuvor veröffentlichten Modellen LaMDA und PaLM aufbaut. Ein Sprachmodell wird mit einer großen Menge an Daten (Texte, Bildmaterial, Bücher, etc.) gefüttert und damit trainiert. Während des Trainings lernt das Modell, Muster und Zusammenhänge in der Sprache zu erkennen. Es lernt zum Beispiel, welches Wort wahrscheinlich als Nächstes kommt oder wie Sätze strukturiert sind.

Aktuell ist das Gemini Sprachmodell in mehrere Versionen unterteilt, wobei Gemini Flash 2.5 die Basis für die Standardversion bildet. Bei Gemini Nano handelt es sich um das kleinste Modell, das vor allem für Smartphones gedacht ist. Gemini 2.5 Pro ist wiederum deutlich leistungsfähiger und unterstützt auch bei komplexen Aufgaben, darunter beim Erstellen von Programmiercode.

Das Pro-Modell ist begrenzt in der kostenlosen Gemini-Verison verfügbar, kostet ansonsten aber. Daneben gibt es auch noch Gemini Ultra, welches aber nur im Google AI Ultra-Plan verfügbar ist, der 250 US-Dollar pro Monat kostet. In diesem Plan ist aber auch das neue Veo 3 Videomodell integriert, mit dem sich Kurzvideos per KI erstellen lassen.

Ist Google Gemini kostenlos?

Die Nutzung von Google Gemini Flash ist vollkommen kostenlos. Ihr könnt die App oder die Webseite ohne monatliches Abo frei nutzen. Lediglich Gemini Pro 2.5 kann nicht ohne Zusatzkosten aufgerufen werden. Das Ganze ist Teil von Google One und kostet rund 22 Euro pro Monat, wobei ebenfalls 2 TB Cloudspeicher im Abo enthalten sind.

Nutzung bei anderen Herstellern

Inzwischen wird Google Gemini auch von anderen Herstellern genutzt, darunter etwa Samsung. Die Südkoreaner nutzen Gemini Nano für die Galaxy AI (Tipps & Tricks), die zusammen mit dem Galaxy S25 (Ultra) erstmals vorgestellt wurde. Zu den Funktionen der Galaxy AI gehören etwa „Circle to Search“, das Zusammenfassen von Website-Inhalten, Live-Übersetzung beim Telefonieren und das Übersetzen von Chats. Honor nutzt wiederum Googles Veo 2, um eine Bild-zu-Video-Generierung zu bieten.

Allround-PC Preisvergleich

Mit * oder markierte Links sind „Affiliate-Links“. Mit dem Kauf über diesen Link erhalten wir eine Verkaufsprovision, ohne dass du mehr bezahlst.

Quellen:
Arian Krasniqi Profilbild Arian Krasniqi Redakteur

Seit 2021 schreibt er News und Artikel für Allround-PC und kommt ursprünglich aus dem Bereich der Hardware-Komponenten. Inzwischen berichtet er aber auch über verschiedene Gadgets, Smartphones sowie Tablets und informiert als ehemaliger Umwelt­ingenieursstudent über Neuheiten im Bereich der PV-Technik.

Samsung Galaxy Z Flip 6 gebogenes Innendisplay

Regelmäßig aktuelle Infos & Deals 💻📱💵

Garantiert kein lästiger Spam oder ähnlicher Quatsch, sondern maximal 1x pro Woche die wichtigsten Infos und die besten Angebote!

^