Mit ChatGPT Bilder erstellen: Prompts & Best Practices
Erfahre, wie du mit ChatGPT Bilder generierst und welche Prompts die besten Ergebnisse erzielen
- Update vom März 2025: Tschüss, DALL-E!
- Wie funktioniert die Bildgenerierung mit ChatGPT?
- Fünf Tipps für den perfekten Prompt zur Bildgenerierung mit ChatGPT
- Bild mit ChatGPT erstellen: Schritt-für-Schritt-Anleitung
- Herausforderungen bei der Bildgenerierung mit ChatGPT
- Alternativen zur Bild-KI von ChatGPT
- Fazit: Bildgenerierung war nie so zugänglich
Egal, ob für Social Media, Blogartikel oder für den kommerziellen Gebrauch – KI-Bilder pflastern die digitale Welt. Besonders gefragt ist die Bildgenerierung mit ChatGPT von OpenAI. Kein Wunder: Das Tool ist besonders einsteigerfreundlich und dazu auch noch kostenlos verfügbar.
In diesem Artikel erfährst du, wie du mit ChatGPT Bilder erstellst, den perfekten Prompt formulierst und welche alternativen KI-Bildgeneratoren es gibt.
Das Wichtigste in Kürze
- UPDATE: Ende März 2025 hat OpenAI die Bildgenerierung von DALL-E auf GPT-4o umgestellt.
- Das neue Modell verspricht deutlich bessere Ergebnisse, auch wenn es immer noch nicht ganz die Qualität der Konkurrenz erreicht.
- Für präzise KI-generierte Bilder ist nach wie vor eine klare, detaillierte Beschreibung des gewünschten Bildes entscheidend.
- Für marktreife Bilder sind spezialisierte Tools wie Midjourney oder Stable Diffusion zu bevorzugen, die mehr Anpassungsmöglichkeiten bieten.
Update vom März 2025: Tschüss, DALL-E!
DALL-E ist nicht mehr – Ende März 2025 hat OpenAI die Bildgenerierung in ChatGPT auf das multimodale Modell GPT-4o umgestellt. Dieses verspricht erhebliche Verbesserungen in Bereichen wie Texttreue, Bildkonsistenz und Bearbeitungsmöglichkeiten. Mit der neuen Version sollen Nutzer\*innen qualitativ deutlich hochwertigere Bilder erstellen können als früher. Der Vollständigkeit halber – und damit du einen Vorher-Nachher-Vergleich hast – findest du den ursprünglichen Artikel über die Bildgenerierung in ChatGPT via DALL-weiter unten.
Unser Eindruck nach dem Update
Wir haben die neue Bildfunktion natürlich sofort ausprobiert und können bestätigen: Die Bildqualität hat einen enormen Sprung nach vorne gemacht. Die neue Bild-KI erreicht zwar immer noch nicht das Niveau der Wettbewerber, liefert aber durchaus brauchbare Ergebnisse:
Das neue Bildmodell von OpenAI liefert deutlich bessere Ergebnisse – weiter unten im Artikel findest du ein Beispiel vom alten Modell DALL-E.
Ebenfalls eine nette Ergänzung: Anders als in der ursprünglichen DALL-E-Fassung unterstützt die Bildgenerierung in ChatGPT jetzt auch Inpainting. Einfach das Bild angeklickt und schon kannst du Bereiche im Bild markieren, die du verändert haben möchtest:
Via Inpainting weisen wir ChatGPT an, dem Reh eine Sonnenbrille aufzusetzen.
Ebenfalls eine Neuerung: Die Bildgenerierung behält jetzt bei Anpassungen die ursprüngliche Komposition bei – es wird also nicht mehr jedes Mal ein völlig neues Bild von 0 erstellt. In unserem Beispiel wurde Bambi auch direkt noch ein fetziger Hut spendiert.
Beim neuen Modell ist nur der markierte Bereich vom Inpainting betroffen – der Rest des Bildes bleibt weitestgehend identisch.
Unser (neues) Fazit
Machen wir es kurz: Auch trotz des Updates bleibt ChatGPT in puncto Bildgenerierung hinter der Konkurrenz zurück. Die Stärken des Tools liegen schlichtweg in anderen Bereichen. Dennoch hat OpenAI mit dem Update qualitativ einen großen Schritt nach vorne gemacht. Zumindest für Casual-Nutzer*innen ist die Bildgenerierung in ChatGPT deshalb endlich interessant geworden.
Die Funktionalität überzeugt jetzt im Alltag, ohne dass du hohe Erwartungen an künstlerische Meisterwerke stellen solltest. Du bekommst brauchbare Visualisierungen für deinen täglichen Bedarf – nicht mehr, aber auch nicht weniger. Für professionelle Anwendungen greifst du weiterhin besser zu spezialisierten Tools.
Achtung: Ab hier fängt jetzt der Artikel an, so wie er ursprünglich erschienen ist!
Wie funktioniert die Bildgenerierung mit ChatGPT?
Die Bildgenerierung mit ChatGPT erfolgt durch die KI-Plattform DALL-E 3. Diese nutzt neuronale Netze, um Bilder basierend auf deinen Textanweisungen zu erstellen. Oder vereinfacht ausgedrückt: Bei der Eingabe deines Prompts wird der Text analysiert, und die künstliche Intelligenz interpretiert die Inhalte, um ein passendes Bild zu generieren. Dabei sind die Ergebnisse stark von der Qualität und Klarheit der Eingaben abhängig.
Eines sei allerdings vorweg erwähnt: Generell schneidet DALL-E 3 im Vergleich zu anderen Plattformen eher mittelmäßig ab. ChatGPT eignet sich aus unserer Sicht vor allem für einen schnellen und kostenlosen Einstieg in die Welt der künstlichen Bildgeneratoren.
Bilder mit ChatGPT erstellen: Kostenlose vs. Plus-Version
Grundsätzlich lassen sich in jeder Version von ChatGPT Bilder erstellen. Der große Unterschied liegt vor allem in der Limitierung, die die Free-Version mit sich bringt. So kannst du in der kostenlosen Variante von ChatGPT gerade einmal zwei Bilder täglich generieren lassen. In der Plus-Version lassen sich dagegen 50 Bilder pro Tag erstellen. Die genaue Anzahl variiert allerdings – so konnten wir in unserem Test teilweise auch drei oder mehr Bilder kostenlos produzieren.
Fünf Tipps für den perfekten Prompt zur Bildgenerierung mit ChatGPT
Die Qualität der Bilder, die du mit ChatGPT generierst, hängt maßgeblich von der Präzision deiner Anweisungen (Prompts) ab, die du der KI gibst. Hier sind fünf essentielle Tipps:
1. Präzise Beschreibung
Eine präzise Beschreibung ist der Grundstein für eine erfolgreiche Bildgenerierung. Vermeide vage Begriffe und formuliere klare, spezifische Anweisungen. Anstatt beispielsweise nur „Landschaft“ zu schreiben, füge Details hinzu: „Eine sonnige Berglandschaft mit einem Wasserfall im Vordergrund und blühenden Wildblumen.“ Je mehr Informationen du bereitstellst, desto genauer kann die KI deine Vorstellungen umsetzen.
Tipp: Verwende Referenzen aus der Kunst, Literatur oder Popkultur, um komplexe Konzepte zu vermitteln. Statt „ein mysteriöser Wald“ könntest du „ein verwunschener Wald à la Herr der Ringe verwenden, um der KI einen spezifischen visuellen Stil zu signalisieren.
2. Stil und Atmosphäre definieren
Der Stil und die Atmosphäre eines Bildes tragen stark zu seiner Wirkung bei. Sei dir im Klaren darüber, welchen Stil du anstrebst – ob realistisch, künstlerisch, cartoonhaft, impressionistisch oder futuristisch – und beschreibe dies im Prompt.
Beispiel für einen Prompt: „Ein futuristisches Stadtbild bei Nacht im Cyberpunk-Stil, mit Neonlichtern und fliegenden Autos.“
Tipp: Nutze bekannte Künstler oder Kunstbewegungen als Bezug. Bezeichnungen wie „im Stil von Van Gogh“ oder „in der Tradition der Surrealisten“ helfen der KI, den gewünschten Stil besser zu erfassen.
3. Kontext und Umgebung
Der Kontext spielt eine entscheidende Rolle für den Bildgenerator. Überlege dir, welche Umgebung das Bild untermauern soll. Möchtest du, dass eine Figur in einem bestimmten Setting agiert? Beschreibe den Hintergrund: „Eine alte Frau, die auf einer Parkbank sitzt, umgeben von herbstlichen Bäumen.“
Tipp: Baue eine narrative Komponente ein. Wenn du den Hintergrund in eine Geschichte einbettest, hilft es nicht nur der KI, sondern macht das Ergebnis potenziell auch spannender und kreativer.
4. Verwendung von Adjektiven und spezifischen Begriffen
Ein Satz voller Adjektive kann das Bild, das du generieren willst, stark prägen. Überlege dir, welche Eigenschaften wichtig sind, und beschreibe sie. „Ein majestätischer, schneebedeckter Gipfel unter einem strahlend blauen Himmel“ vermittelt ein viel klareres Bild als nur „Berg“.
Tipp: Experimentiere mit weniger gängigen Adjektiven. Wörter wie „leuchtend“, „dramatisch“ oder „filigran“ können starke visuelle Assoziationen hervorrufen und die Ergebnisse interessanter machen.
5. Zusätzliche Parameter: Bildgröße, Ausschnitt usw.
Die Angabe von spezifischen Parametern kann ebenfalls entscheidend für das gewünschte Endresultat sein. Erkläre, wenn du ein bestimmtes Format oder einen speziellen Ausschnitt benötigst. Zum Beispiel: „Ein Porträt eines majestätischen Löwen im Querformat, der direkt in die Kamera blickt.“
Tipp: Achte darauf, dass die Größe und der Ausschnitt zur Nutzung des Bildes passen. Für Social-Media-Beiträge sind quadratische oder hochformatige Bilder oft vorteilhaft, während für Druckformate größere, hochauflösende Formate benötigt werden.
Bonustipp: Auf Englisch prompten
Auch wenn die hier genannten Prompt-Beispiele auf deutsch formuliert sind, empfehlen wir generell, beim Prompting für Bild-Generierung auf Englisch zu schreiben. Das hat gleich mehrere Gründe:
- Die meisten KI-Modelle, wie DALL-E oder Stable Diffusion, wurden primär mit englischsprachigen Daten trainiert. Dadurch sind sie in der Lage, englische Beschreibungen genauer und nuancierter zu verstehen als Eingaben in anderen Sprachen.
- Die englische Sprache hat tatsächlich eine größere Vielfalt an Wörtern als die deutsche Sprache. Je nach Quelle wird geschätzt, dass die englische Sprache doppelt so viele Wörter kennt wie die deutsche. Entsprechend kannst du viel präziser beschreiben, was du haben möchtest.
- Bei der Eingabe in anderen Sprachen übersetzen KI-Tools die Prompts intern ins Englische. Dieser Prozess kann zu Missverständnissen oder Verlust von Details führen, was die Qualität der Ergebnisse beeinträchtigt.
Bild mit ChatGPT erstellen: Schritt-für-Schritt-Anleitung
Die Erstellung beeindruckender Bilder mit ChatGPT kann ein spannender Prozess sein, der dir die Möglichkeit bietet, deiner Kreativität freien Lauf zu lassen. Um dir den Einstieg zu erleichtern, habe ich eine detaillierte Schritt-für-Schritt-Anleitung zusammengestellt, die den gesamten Prozess von der Ideenfindung bis zur Ergebnisoptimierung aufzeigt.
Schritt 1: Prompt vorbereiten
Bevor du mit der Generierung von Bildern beginnst, musst du eine klare und durchdachte Textbeschreibung formulieren. Achte darauf, beim Prompt Engineering die oben genannten Kriterien zu inkludieren – je detaillierter deine Eingabe, desto besser werden die Ergebnisse in der Regel.
Schritt 2: Prompt eingeben
Im zweiten Schritt gibst du der KI deine Anweisungen. ChatGPT beziehungsweise DALL-E 3 generiert dann auf Basis deines Prompts ein entsprechendes Bild:
Zunächst erstellt DALL-E unser Bild. Prompt: „Erstelle mir ein Bild eines Rehs.“
Schritt 3: Ergebnis optimieren und feinjustieren
Nachdem du deinen Prompt eingegeben hast, generiert die KI dein Bild. Dieses kannst du bei Bedarf weiter variieren. Klicke dazu einfach im Chat auf das Bild, woraufhin sich ein Fenster öffnet, mit dem du Änderungen am Resultat vornehmen kannst:
Bedenke allerdings: ChatGPT wird auch bei kleineren Änderungen jedes Mal ein völlig neues Bild entwerfen, das sich dem ursprünglichen Ergebnis nur annähert. Sogenanntes „Inpainting“, bei dem du nur bestimmte Aspekte des Bildes beeinflusst, ist mit dem Tool von OpenAI nicht möglich.
Fertig ist unser Meisterwerk.
Herausforderungen bei der Bildgenerierung mit ChatGPT
Die Verwendung von ChatGPT zur Bildgenerierung kann eine unterhaltsame und kreative Erfahrung sein, aber sie bringt auch einige Herausforderungen mit sich. Häufige Stolpersteine sind:
Unklare Prompts und Widersprüche
Ein häufiges Problem sind unklare oder widersprüchliche Anweisungen in deinem Prompt. Wenn verschiedene Teile deiner Beschreibung inhaltlich im Konflikt stehen, kann die KI Schwierigkeiten haben, den Auftrag korrekt zu interpretieren.
So löst du das Problem: Überprüfe deinen Prompt auf Widersprüche, bevor du ihn eingibst. Halte dich an ein einheitliches Thema oder eine spezifische Stimmung, um Verwirrung zu vermeiden.
Bias in den Bildern
KI-Modelle sind nicht perfekt und können unbeabsichtigte Vorurteile oder Stereotypen reproduzieren, die in den Daten vorhanden sind, mit denen sie trainiert wurden. Dies kann sich negativ auf die Qualität und die Repräsentation der generierten Bilder auswirken und kann besonders problematisch sein, wenn es um kulturelle Darstellungen geht.
So löst du das Problem: Achte auf die Vielfalt und Inklusion in deinen Prompts. Formuliere differenzierte und respektvolle Anfragen, um ungewollte Vorurteile zu vermeiden.
Iterativer Prozess
Die Bildgenerierung ist oft ein wiederholender Prozess, bei dem Geduld und Beharrlichkeit erforderlich sind. Es ist normal, dass du nicht beim ersten Versuch das perfekte Bild erhältst. Frustration kann aufkommen, wenn die Resultate nicht sofort deinen Vorstellungen entsprechen. Hier gilt es, am Ball zu bleiben.
So löst du das Problem: Sieh es als kreative Herausforderung an. Nutze jeden Versuch, um zu lernen und deine Prompts weiter zu verfeinern.
Falsche Erwartungshaltung
Ein häufiges Missverständnis ist die Annahme, dass die KI in der Lage ist, perfekte undfotorealistische Bilder zu erzeugen, insbesondere bei komplexen Anfragen wie Porträts oder emotionalen Szenen. Oft sind vor allem Texte, Gesichtszüge oder Hände weniger überzeugend gelungen und entsprechen nicht dem, was du dir erhoffst.
So löst du das Problem: Erkenne die Stärken und Schwächen von ChatGPT und anderen KI-Modellen und nutze sie als kreatives Werkzeug anstatt als perfekte Lösung.
Alternativen zur Bild-KI von ChatGPT
Wenn es um die Bildgenerierung geht, ist ChatGPT zwar ein leistungsstarkes Tool, aber es gibt auch zahlreiche Alternativen, die dir helfen können, deine kreativen Visionen umzusetzen.
Bei allen hier genannten Alternativen haben wir denselben, einfachen Prompt verwendet: „Middle-aged woman walking down the street.“ Interessant ist auch, wie unterschiedlich die einzelnen Bildgeneratoren den Begriff „middle-aged“ interpretieren.
Midjourney
Midjourney ist zweifellos der Platzhirsch unter den KI-Bildgeneratoren. Für viele Nutzer*innen gilt es als das Tool, das die besten Ergebnisse liefert, denn Detailtiefe und Ästhetik suchen ihresgleichen. Midjourney wurde ursprünglich über den Kommunikationskanal Discord betrieben, hat aber inzwischen auch eine zugänglichere Webversion für den Browser.
Was kostet Midjourney?
Midjourney bietet ein mehrstufiges Abonnement-Modell, das nicht auf der Anzahl der generierten Bilder, sondern vor allem auf der sogenannten GPU-Time abzielt. Damit gibt Midjourney an, wie viel Zeit man im Monat Zugriff auf die schnelle Bildgenerierungsfunktion hat. Die Preise beginnen bei $ 10 pro Monat für das Basis-Abo, das monatlich 200 Minuten mit GPU-Time bietet.
Das Ergebnis von Midjourney
Stable Diffusion
Stable Diffusion ist ein KI-basierter Open-Source-Bildgenerator, der von Stability AI entwickelt wurde. Er hat sich schnell einen Namen gemacht, vor allem durch die Flexibilität und die breit gefächerte Anpassbarkeit. Nutzer*innen können das Modell lokal auf ihren eigenen Rechnern installieren, was den Vorteil bietet, keine Einschränkungen hinsichtlich der Nutzung zu haben. Außerdem können sie Stable Diffusion mit verschiedenen „Checkpoints“ und Skripten anpassen, um aus unterschiedlichen Stilen und Effekten zu wählen.
Was kostet Stable Diffusion?
Stable Diffusion ist grundsätzlich kostenlos verfügbar. Allerdings solltest du eine einigermaßen leistungsstarke Hardware besitzen, wenn du das Tool auf deinem lokalen PC benutzen möchtest. Als Alternativen gibt es zahlreiche Anbieter von cloudbasierten Lösungen, die allerdings wieder kostenpflichtig sind.
Das Ergebnis von Stable Diffusion
Flux AI
Flux AI ist eine weitere vielversprechende Alternative zur Bilderstellung, die aus Deutschland stammt. Neben Midjourney gehört das Tool zu den KI-Bildgeneratoren, die aktuell die besten Ergebnisse erzielen. Es stehen dazu unterschiedliche Modelle zur Verfügung: Flux Pro für professionelle Anwender*innen, Flux Dev für Forschungs- und Entwicklungsanwendungen oder Flux Schnell für iterative Bildgenerierung. Mit dem Tool lassen sich zudem auch kurze Videos generieren.
Was kostet Flux AI?
Flux AI bietet verschiedene Preispläne, darunter eine kostenlose Basisversion, die dir Zugang zu grundlegenden Funktionen ermöglicht. In den kostenpflichtigen Versionen ab $ 9,99 kommen weitere Features und eine größere Menge Credits hinzu, die als digitale Währung für die Bildgenerierung dienen.
Das Ergebnis von Flux Dev
neuroflash
neuroflash ist eine KI-gestützte Plattform, die sich auf das Erstellen von Marketinginhalten, allen voran Texten, spezialisiert hat. Aber sie bietet auch eine Funktion zur Bilderstellung, die auf dem oben genannten Modell von Flux AI basiert. Besonders großen Wert legt die Plattform auf Benutzerfreundlichkeit und effiziente Prozesse. So kannst du deine Prompts beispielsweise direkt von der hauseigenen Text-KI umschreiben und optimieren lassen, um das gewünschte Ergebnis zu erzielen. Auch die Anzahl der gleichzeitig generierten Bilder und die Bildformate lassen sich bequem anpassen.
Was kostet neuroflash?
neuroflash bietet verschiedene Preispakete an. In der kostenlosen Variante kannst du monatlich fünf Bilder generieren lassen, in der Lite-Version für 9 € monatlich sind es zehn. Ab dem Starter-Paket für 30 € monatlich kannst du beliebig viele Bilder erstellen.
Das Ergebnis von neuroflash
Fazit: Bildgenerierung war nie so zugänglich
Die Bildgenerierung mit ChatGPT bietet vor allem Anfänger*innen einen spannenden Einblick in die Welt der KI-Bilder. Für erste Sketches oder eine grobe Visualisierung von Ideen ist das Tool von OpenAI in jedem Fall geeignet.
Wer dagegen eine Lösung sucht, mit der sich marktreife Bilder generieren lassen, sollte sich lieber bei der Konkurrenz umschauen: Tools wie Midjourney oder Stable Diffusion bieten deutlich mehr Anpassungsmöglichkeiten, Stile und generell eine deutlich bessere Bildqualität. Dafür sind sie aber in der Bedienung komplexer und/oder kostenpflichtig.
Doch das sollte dich nicht abschrecken: Die meisten KIs bieten dir die Möglichkeit, sie kostenlos zu testen, bevor du eine Entscheidung triffst. Es lohnt sich, verschiedene Optionen auszuprobieren und neugierig auf die Entwicklungen der Bildgenerierung zu bleiben.