ChatGPT Images 2.0: Was der neue Bildgenerator wirklich kann
- vor 6 Tagen
- 2 Min. Lesezeit
Aktualisiert: vor 6 Stunden
Wer bisher KI-generierte Bilder mit Text brauchte, kennt das Problem: Die Buchstaben sahen aus wie von einem Kleinkind geschrieben. OpenAI verspricht, genau das gelöst zu haben. Seit dem 21. April 2026 steht ChatGPT Images 2.0 bereit – und bringt gleich mehrere Funktionen mit, die aufhorchen lassen.
Erst nachgedacht, dann gemalt
Das auffälligste neue Feature trägt den Namen „Thinking-Modus". Dahinter steckt Folgendes: Bevor das Modell ein Bild erzeugt, strukturiert es die Aufgabe in mehreren Schritten. Es zerlegt komplexe Eingaben, prüft Details und bezieht bei Bedarf sogar aktuelle Informationen aus dem Internet ein.
Ein konkretes Beispiel: Wer eine Grafik zu den aktuellen Quartalszahlen eines DAX-Unternehmens anfordert, erhält ein Bild, das auf recherchierten Daten basiert – nicht auf veralteten Trainingsdaten. Das Modell sucht aktiv im Web, bevor es den ersten Pixel setzt.
Text, der endlich lesbar ist
KI-Bildgeneratoren scheiterten bisher verlässlich an Schrift im Bild. Buchstaben fehlten, Wörter waren verdreht, und Speisekarten sahen aus wie Geheimschriften. ChatGPT Images 2.0 stellt Text jetzt deutlich präziser dar – auch in kleinen Schriftgrößen und auf komplexen Layouts. Laut TechCrunch gelingt dem Modell sogar saubere Typografie auf Magazin-Covern und Marketing-Materialien.
OpenAI hat außerdem die Sprachunterstützung erweitert. Das Modell verarbeitet nicht-lateinische Schriften wie Japanisch, Koreanisch, Hindi und Bengalisch besser als sein Vorgänger.
Acht Bilder aus einem einzigen Prompt
Wer bisher für jede Variante einen eigenen Prompt schreiben musste, spart ab sofort Zeit. ChatGPT Images 2.0 erzeugt bis zu acht konsistente Bilder aus einer einzigen Eingabe. Das macht das Modell besonders nützlich für mehrteilige Projekte: Social-Media-Kampagnen in verschiedenen Formaten, Storyboards oder Bildserien für Präsentationen.
Die Auflösung reicht jetzt bis 2K, und verschiedene Seitenverhältnisse stehen zur Wahl. Stilistisch deckt das Modell ein breites Spektrum ab – von fotorealistischen Aufnahmen über Pixel Art bis hin zu Manga und Filmstills.
Was Mittelständler damit anfangen können
Gerade für Unternehmen, die regelmäßig visuelle Inhalte brauchen, wird es spannend. Social-Media-Grafiken mit korrektem Text, Produktbilder mit Beschriftungen, Schulungsmaterialien mit Diagrammen – all das lässt sich nun direkt per Texteingabe erzeugen. Ohne Grafikdesigner, ohne Bildbearbeitungssoftware.
Und ehrlich gesagt macht es auch richtig Spaß!
Hier ein paar Beispiele im Selbstversuch:
Apfel im Retro-Design
Meine Texteingabe: „Erstelle ein Bild von einem Apfel im 70er Jahre Design.“

Dackel mit Kürbissen, stilecht mit Strickpullunder
Meine Texteingabe: „Erstelle ein Bild von einem Dackel in einer Kürbis-Installation.“

Skateboardfahrer, der der Schwerkraft trotzt
Meine Texteingabe: „Skateboardfahrer, der an einem Hochhaus hochfährt.“

Die gute Nachricht: ChatGPT Images 2.0 ist jetzt auch in Nexus verfügbar!
Glossar
Thinking-Modus: Eine Funktion, bei der das KI-Modell eine Aufgabe in mehrere Schritte zerlegt und dabei auch im Internet recherchiert, bevor es ein Ergebnis liefert.
2K-Auflösung: Eine Bildauflösung von etwa 2.000 Pixeln in der Breite – deutlich schärfer als Standard-HD.
Quellen
ComputerBase: „ChatGPT Images 2.0: Neuer Bildgenerator setzt vor allem auf besseres Verständnis"
heise online: „ChatGPT erhält neue Bild-KI, die mitdenkt und im Web recherchiert"
OpenAI: „Einführung von ChatGPT Bilder 2.0"
TechCrunch: „ChatGPT's new Images 2.0 model is surprisingly good at generating text"
The Decoder: „OpenAIs ChatGPT Images 2.0 könnte die gesamte Grafikwelt auf den Kopf stellen"



