Künstliche Intelligenz hat in den letzten Jahren große Fortschritte gemacht – das merkt man vor allem an der Fähigkeit der Bildgenerierung. Während KI-Bilder vor ein paar Jahren noch direkt an witzigen Bildfehlern erkennbar waren, lassen sich heutige teilweise kaum von echten Fotos unterscheiden. Am bekanntesten dürfte dabei wohl der Bildgenerator Dall-E von OpenAI sein, der sowohl von ChatGPT als auch vom Microsoft Copilot genutzt wird. Doch wie funktioniert die Bild-KI überhaupt?
Dall-E ist aktuell in der Version 3 für ChatGPT-Plus und Enterprise-Abonnenten verfügbar. Allerdings müsst ihr nicht unbedingt Geld in die Hand nehmen, um die Bild-KI zu nutzen. Über den Bing Image Creator könnt ihr Dall-E 3 komplett kostenlos verwenden – einzig ein Microsoft-Account wird vorausgesetzt. Den sollten aber alle, die Windows 10 oder Windows 11 verwenden, besitzen. Im Folgenden wollen wir euch erklären, wie ihr Dall-E verwenden könnt und die besten Ergebnisse erzielt.
Was kann Dall-E 3?
Dall-E 3 basiert weiterhin auf dem ursprünglichen Transformer-basiertem Modell, das 2021 von OpenAI veröffentlicht wurde. Allerdings wurde der Bildgenerator seitdem deutlich aufgebohrt: In der dritten Generation bietet das Modell eine deutlich bessere Bildqualität sowie höhere Auflösungen, um Bilder realistischer wirken zu lassen. Zudem wurde die KI um neue Fähigkeiten erweitert, mit denen eine breitere Palette an Stilen und komplexere Szenarien generiert werden können.
Und diese Fortschritte merkt man extrem: Vor allem Hände und Gesichter werden von Dall-E 3 deutlich realistischer generiert, als es bei älteren KIs der Fall ist. Immerhin gehörten früher zusätzliche Finger und seltsame Verformungen zum KI-Alltag. Auch Texte werden nicht mehr in einer unverständlichen „Sprache“ erstellt, sondern sind tatsächlich leserlich.
Wofür lassen sich Bildgeneratoren einsetzen?
Bildgeneratoren können ziemlich praktisch sein, um Konzepte zu entwickeln, Lehrmaterialien zu visualisieren oder um Inspirationen zu sammeln. Auch auf der Arbeit können KI-Generatoren dabei helfen, schnell und kostengünstig Bilder für Werbekampagnen, Social Media und auch für Beiträge zu entwickeln. Selbst bei uns im Reaktionsalltag nutzen wir KI, um Titelbilder zu erstellen, die ansonsten nur schwer realisierbar wären.
So benutzt ihr Dall-E und andere Bildgeneratoren
Die Nutzung von Dall-E und anderen Bildgeneratoren könnte dabei nicht einfacher sein. Die Grundlage für die Generierung ist ein Text-Prompt vom User, der die Beschreibung des gewünschten Motivs enthält. Diese kann simpler oder komplexer sein – je nachdem, welches Ergebnis ihr erzielen wollt. In der Regel lohnt es sich einen genauen Text-Prompt zu erstellen, um ein möglichst ansehnliches Ergebnis zu erhalten. Ihr könnt euch natürlich auch von ChatGPT oder einer anderen KI, wie Google Gemini, bei der Erstellung des Prompts helfen lassen.
Anschließend wird der Text von der KI in Token umgewandelt, bei denen es sich im Wesentlichen um kleinere „Einheiten“ oder Wörter handelt, die vom Modell verstanden werden. Darauf basierend erzeugt die KI dann mehrere Bilder, die dem User im Anschluss präsentiert werden. Beachtet nur, dass ihr nicht unendlich viele Bilder am Tag generieren könnt. Irgendwann schiebt euch OpenAI einen Riegel vor und schickt euch für ein paar Minuten in einen Time-out.
Du generierst Bilder zu schnell. Um die beste Erfahrung für alle zu gewährleisten, haben wir Begrenzungen festgelegt. Bitte warte 7 Minuten, bevor du weitere Bilder generierst.
Fehlermeldung bei zu schneller Generierung
Falls ihr Dall-E über ChatGPT nutzt, könnt ihr den Bildprompt im Chat immer weiter verfeinern. Ihr könnt das Seitenverhältnis ändern, den Stil anpassen oder weitere Details hinzufügen lassen. Über dem Eingabefeld lassen sich sogar Vorschläge finden, die ihr auswählen könnt.
Eine etwas versteckte Funktion: Einzelne Bildbereiche anpassen
Auf Wunsch könnt ihr sogar einzelne Details im Bild anpassen. Hierfür müsst ihr nur eines der generierten Bilder auswählen und oben rechts auf das Pinsel-Symbol klicken. Hierüber könnt ihr bestimmte Bereiche im Bild markieren und Objekte entfernen oder hinzufügen. Ganz fehlerlos ist das Ganze natürlich nicht – die KI macht auch gerne mal das genaue Gegenteil eurer Aufforderung.😅
Dall-E, Stable Diffusion, Midjourney: Diese Bildgeneratoren gibt es
Natürlich gibt es neben Dall-E noch weitere KI-Tools, mit denen ihr Bilder generieren könnt. Hierzu zählt etwa Midjourney, das vor allem für seine realistischen Bilder bekannt ist. Erinnert ihr euch etwa an das Bild von Papst Franziskus in Daunenjacke? Das wurde tatsächlich mit Midjourney erstellt und wurde von vielen auf den ersten Blick als echt eingestuft. Im Folgenden findet ihr eine Auswahl an aktuellen KI-Generatoren:
- Midjourney: ab 10 US-Dollar/ Monat
- Stable Diffusion: kostenlose Open-Source-Anwendung mit lokaler Durchführung
- Canva AI: kostenloses Grund-Kontingent, sonst ab 14,99 US-Dollar/ Monat
- Adobe Firefly: in Adobe Creative Cloud enthalten
- NightCafe: kostenloser Basisplan, Abo ab 5,99 US-Dollar/ Monat
Warnung: KI-Bilder können leicht missbraucht werden
So cool die Möglichkeit auch ist, Bilder aus dem Nichts zu erschaffen, birgt die Technik auch Gefahren. Immerhin sind die Zeiten, in denen man ein künstliches Bild sofort erkannt hat, inzwischen vorbei. Das wird vor allem dann problematisch, wenn es um sogenannte Deepfakes geht. Entsprechende Bilder mit manipulierten oder frei erfundenen Inhalten können dazu genutzt werden, Falschinformationen und Propaganda zu verbreiten. Zudem besteht ein erhebliches Missbrauchspotenzial, da solche Bilder auch zur Erpressung von Personen genutzt werden können.
Was nach schlimmer Zukunftsmusik klingt, ist bereits ein Problem. Deepfakes untergraben teilweise schon heute die Glaubwürdigkeit von Fotografie und werden vermutlich in den nächsten Monaten und Jahren zu einem zunehmenden Problem. Entsprechend fordern bereits einige aus Wissenschaft und Politik, KI-Inhalte zu kennzeichnen. Alternativ wäre laut dem Künstler Boris Eldagsen ein Label für authentischen Content denkbar. An dieser Stelle also der Appell: Geht verantwortungsvoll mit solchen Tools um.
Mit * oder markierte Links sind „Affiliate-Links“. Mit dem Kauf über diesen Link erhalten wir eine Verkaufsprovision, ohne dass du mehr bezahlst.
Aus Gründen der besseren Lesbarkeit wird auf die gleichzeitige Verwendung männlicher, weiblicher und diverser Sprachformen (m/w/d) verzichtet. Alle Personenbezeichnungen gelten gleichermaßen für alle Geschlechter.
Kommentieren, Austauschen und Fragen...
Schreibe einen eigenen Kommentar