OpenAIs neuestes Bildmodell · jetzt auf aigazou

GPT Image 2: Text, der wirklich stimmt; Edits, die lokal bleiben; Details, die standhalten

KI-Bildmodelle scheitern seit Langem an drei Dingen: zerfetzter Text auf Postern, das Neuzeichnen des ganzen Bildes, nur um einen kleinen Bereich zu ändern, und Hände mit zu vielen Fingern. GPT Image 2 löst alle drei — rund 99 % Textgenauigkeit beim Rendering in lateinischen und ostasiatischen Schriften (OpenAIs offizieller Benchmark), echte lokale Edits, die nur den von dir markierten Bereich anfassen, und weltwissensbasiertes Grounding, damit Physik und Anatomie auch beim Hineinzoomen glaubwürdig bleiben.

Was ist GPT Image 2

GPT Image 2 ist OpenAIs natives Bildmodell der zweiten Generation, veröffentlicht im April 2026 als Nachfolger von gpt-image-1. Es ist OpenAIs erstes Bildmodell mit einem eingebauten Reasoning-Schritt: Bevor ein Pixel entsteht, plant das Modell die Komposition, entscheidet, wo jedes Element hingehört, und arbeitet das Layout des Bildtextes aus. Der Output ist ein einzelnes, gerendertes Bild aus einem natürlichsprachlichen Prompt — ohne separaten Editor, ohne manuellen Layout-Pass. Auf aigazou läuft GPT Image 2 über den Standard-Generierungs-Flow auf der Startseite: im Modell-Dropdown auswählen, Prompt schreiben, Bild erhalten.

Der direkteste Weg zu verstehen, wofür GPT Image 2 gemacht ist, führt über das, woran ältere Modelle verlässlich scheiterten. Poster mit lesbarer Tagline, Menüs mit Preisen und Gerichten, Infografiken mit Achsenbeschriftung, Comic-Panels mit Sprechblasen, mobile UI-Mockups mit realistischer Interface-Copy — jede dieser Kompositionen macht Text zum Teil des Bildes. Frühere Diffusionsmodelle verstümmelten Glyphen oder halluzinierten plausibel aussehenden Text, der beim zweiten Blick zerfiel. Die Lösung ist keine höhere Auflösung, sondern der Reasoning-Schritt: Das Modell behandelt „Text und Layout“ zuerst als Planungs-, dann als Rendering-Problem. OpenAI nennt eine Textgenauigkeit von rund 99 % über die unterstützten Schriften — Chinesisch (Kurz- und Langzeichen), Japanisch und Koreanisch —, also jene ostasiatischen Schriften, die die Vorgängergeneration als Zierformen abtat. Neben Text bringt GPT Image 2 pixelgenaue Bearbeitung für präzise Retuschen an bestehenden Bildern sowie weltwissensbasierten Realismus, der Physik, Materialien und Anatomie glaubwürdig hält.

GPT Image 2 hält außerdem Figuren und Stile über Generierungen aus demselben Prompt hinweg stabil — gleiche Gesichtsform, gleiches Kostüm, gleiche Farbpalette. Über verschiedene Prompts hinweg trägt das Modell das Subjekt nicht automatisch weiter: Das Arbeitsmuster ist, die Charakterbeschreibung einmal als Absatz zu schreiben und diesen Absatz als Casting-Brief in jeden Szenen-Prompt einzufügen. Dieser „Absatz-als-Anker“-Workflow macht das Modell für Arbeit nutzbar, die mehr als ein Bild braucht — Storyboards, Comic-Sequenzen, markenkonforme Marketing-Assets, Charakterbögen — ohne ein eigenes LoRA trainieren zu müssen. GPT Image 2 ist nicht für jedes Bild das richtige Werkzeug; für weichen Aquarell-Anime-Stil, ein poliertes Selfie oder eine Feiertagskarte mit Stickern sind die spezialisierten Tools auf aigazou schneller. Die Ergebnisse sind für persönliche und kommerzielle Projekte nutzbar, gemäß OpenAIs Content Policy.

Was GPT Image 2 ändert

Sieben Dinge, die ältere Bildmodelle falsch gemacht haben — und wie dieses sie behebt.

99 % Textrendering-Genauigkeit

Frühere Bildmodelle konnten ein Plakat zeichnen, aber nicht die Schlagzeile darauf. Buchstabenformen verzogen sich, Kerning brach zusammen, Zeilen drifteten, und jeder Glyph außerhalb des lateinischen Alphabets wurde zu dekorativem Rauschen. Die übliche Umgehung war, den Hintergrund in einem Werkzeug zu generieren, eine saubere Fläche freizustellen und den Text dann von Hand wieder einzufügen. Es funktionierte, aber es war keine Generierung; es war Compositing im Generierungsgewand.

GPT Image 2 schließt diese Lücke. Laut OpenAIs eigenem Benchmark liegt die Textgenauigkeit beim Rendering bei rund 99 % auf druckbarem Text — Absätze, Preise, Bildunterschriften, Labels. Buchstaben behalten ihre Proportionen, Wörter sitzen auf einer konsistenten Grundlinie, und kurzer Text liest sich als absichtliche Typografie statt als ungefähre Form.

Praktisch heißt das: Grafik und Worte kommen aus demselben Durchlauf. Sie können ein Filmplakat, eine Café-Speisekarte, einen App-Screen oder eine Infografik so iterieren, wie ein Texter Entwürfe iteriert ― Prompt ändern, neu generieren, Ergebnis lesen. Text ist jetzt Teil des Bildes, keine Schicht, die man später hinzufügt.

Plant das Layout vor dem Zeichnen

GPT Image 2 bringt einen nativen Reasoning-Schritt mit. Bevor ein Pixel erzeugt wird, zerlegt das Modell den Prompt in einen strukturierten Plan: Was steht wo, welche Elemente sind im Vordergrund, wie verhalten sich Panels zueinander, wo liegt der Negativraum. Erst nachdem dieser Plan steht, fängt das Modell an, die Pixel hineinzuzeichnen. Das Reasoning ist für Sie unsichtbar, leistet aber den Großteil der strukturellen Arbeit, die ältere Modelle auf Pixel-Ebene zu fingieren versuchten.

Dieser zusätzliche Durchlauf ist der Grund, weshalb dichte Kompositionen endlich zusammenhalten. Mehrteilige Comics halten Sprechblasen am richtigen Charakter. Infografiken legen Beschriftungen auf die richtigen Balken und Titel in die richtige Hierarchie. UI-Mockups gruppieren Bedienelemente in erkennbare Muster, statt Buttons und Beschriftungen gleichmäßig über die Leinwand zu streuen. Die Ausgabe liest sich wie etwas, das ein Designer durchdacht hat, nicht wie ein Mittelwert, den ein Modell zusammengewürfelt hat.

Das ändert auch, wie man Prompts schreibt. Bei älteren Modellen erzeugten komplexe Prompts kompromittierte Bilder, daher war der Arbeitsstil, Prompts schmal zu halten und Generierungen zu stapeln, um Komplexität aufzubauen. Mit GPT Image 2 kann das Modell ein längeres Briefing aufnehmen und trotzdem ein kohärentes Layout produzieren, sodass Sie die gesamte Komposition in einem Prompt beschreiben und ihm die Planung der Teile überlassen können.

Mehrsprachig im Design

Die Text-Rendering-Qualität hält über CJK-Schriften (Chinesisch Kurz- und Langzeichen, Japanisch, Koreanisch) genauso wie bei lateinischen Alphabetsprachen. Es gibt kein anderes Modell zum Umschalten, kein Sprach-Flag zum Setzen. Schreibe den Prompt in der Sprache, in der der Text im Bild erscheinen soll, und das Modell behandelt diese Schrift als erstklassigen Bürger.

Frühere Bildmodelle wurden faktisch mit der stillen Annahme ausgeliefert, dass Text im Bild auf Englisch sei. Alles andere zerfiel zu vage buchstabenförmigen Strichen. Teams in CJK-Märkten reagierten, indem sie Text-im-Bild-Generierung ganz vermieden, zu Overlay-Workflows zurückkehrten oder für regionale Fine-Tunes bezahlten. All das ist hier nicht nötig.

Wer lokalisierte Inhalte für ostasiatische Märkte liefert — Ladenschilder, Verpackungsgrafiken, Social Posts, Rezeptkarten, Restaurantmenüs — kennt den praktischen Unterschied zwischen „Generat direkt verwenden“ und „Textlayer in Photoshop oder Figma neu bauen“. In einer Pipeline, die pro Woche Dutzende Lokalisierungsvarianten ausgibt, summiert sich diese Zeit schnell auf.

Konsistente Charaktere über separate Durchläufe hinweg

Führe denselben Prompt erneut aus, und die Figur kommt von Generierung zu Generierung erkennbar zurück — gleiche Gesichtsform, gleiches Haar, gleiche Palette, gleiche Kostüm-Details. Über verschiedene Prompts hinweg trägt das Modell das Subjekt aber nicht automatisch weiter: Kopiere den Charakterbeschreibungs-Absatz als Casting-Brief in jeden Szenen-Prompt, und das Modell hält sich daran. Kein eigenes LoRA, kein Fine-Tune, kein Seed-Bild nötig.

Für Storyboards, Markenmaskottchen, Lehrsequenzen, Kinderbuch-Illustrationen, Social-Comic-Serien und jede Erzählarbeit, in der ein Charakter mehr als einmal auftauchen muss, entfernt das den Hin-und-her-Aufwand, ein eigenes Modell oder LoRA nur zu trainieren, um ein Gesicht stabil zu halten. Sie schreiben einmal eine sorgfältige Charakterbeschreibung und verwenden diesen Absatz dann als Charakter-Anker in jedem Szenen-Prompt und überlassen die Konsistenzarbeit dem Modell.

Es gibt Grenzen, die man kennen sollte. Konsistenz ist am stärksten, wenn die Charakterbeschreibung detailliert und konkret ist: spezifische Haarfarbe und -länge, Brille, erkennbare Kleidung, markante Accessoires. Sie ist am schwächsten, wenn der Charakter vage beschrieben wird, wenn die Szene Beleuchtung oder Renderingstil radikal ändert, oder wenn die Charakterhinweise am Ende des Prompts vergraben sind. Behandeln Sie die Beschreibung als Casting-Briefing, nicht als weiche Anregung.

Dichte Kompositionen, die wirklich halten

Die Kombination aus nativem Reasoning und verbessertem Textrendering bedeutet, dass GPT Image 2 Kompositionen handhabt, in denen ältere Systeme leise verfielen: datengetriebene Infografiken mit mehreren beschrifteten Werten, mobile UI-Mockups mit Toolbars, Tabs und Posteingangslisten, mehrelementige Marketingplakate mit Hierarchie, Verpackungsmockups mit mehreren SKUs im selben Frame. Das waren die Kompositionen, die KI-Generierung sich offensichtlich „assistiv“ statt „nutzbar“ anfühlen ließen.

Wo DALL·E 3 oder gpt-image-1 Komplexität in einen vagen Eindruck komprimierten ― „infografikartiges Bild mit zahlartig aussehenden Markierungen“ ― behandelt GPT Image 2 Dichte als Vorgabe und versucht sie einzuhalten. Balken bekommen Beschriftungen. Tabs bekommen Namen. Toolbar-Icons bekommen unterscheidbare Formen. Das Ergebnis ist etwas, worauf ein Designer reagieren und es verfeinern kann, statt etwas, das er wegwerfen und mit manuellem Layout von vorne beginnen muss.

Der ehrliche Vorbehalt ist, dass sehr dichte Layouts ― ganzseitige Magazinaufmacher, komplexe Dashboards mit zwanzig unterschiedlichen Widgets, überfüllte Szenen mit einem Dutzend beschrifteter Requisiten ― weiterhin davon profitieren, das Briefing in kleinere Durchgänge aufzuteilen. Erzeugen Sie das Diagramm, dann den umgebenden Kontext, und komponieren Sie die Schichten in einem Werkzeug, das pixelgenaue Kontrolle bietet. Die Schwelle, an der manuelles Compositing gewinnt, ist deutlich nach oben gerückt, existiert aber am oberen Ende der Komplexität noch.

Kommerzielle Nutzung, mit den üblichen Einschränkungen

Bilder, die Sie mit GPT Image 2 erzeugen, gehören Ihnen zur Nutzung in persönlichen und kommerziellen Projekten, vorbehaltlich der Inhaltsrichtlinie von OpenAI und geltenden Gesetzes. Es gibt keine separate Lizenzstufe, in die Sie upgraden müssten, kein Royalty-Modell, das Sie durchlesen müssten, keine Nutzungsgebühr zusätzlich zu den Generierungskosten. Die Ausgabe gehört Ihnen ab dem Moment, in dem sie in Ihrem Konto landet, und aigazou erhebt keine nachgelagerten Rechte an dem, was Sie produzieren.

Praktischer Umfang: Marketing-Assets, Blog-Illustrationen, Produktmockups, Verpackungskonzepte, Social-Media-Inhalte, In-App-Grafiken, Kursmaterialien, interne Dokumente, Video-Thumbnails, Präsentationsfolien. Wo Sie einen Illustrator engagiert oder Stock gekauft hätten, können Sie stattdessen ein generiertes Bild verwenden, mit derselben Sorgfaltspflicht, die Sie auf jedes visuelle Asset Dritter anwenden würden.

Die üblichen Einschränkungen gelten weiterhin — keine Abbilder realer Personen ohne Zustimmung, keine Verletzung von Marken oder urheberrechtlich geschützten Figuren, keine irreführenden Darstellungen öffentlicher Personen. Behandle OpenAIs Content Policy als Vertrag, und du arbeitest in einer sauberen Lizenz für den alltäglichen kommerziellen Gebrauch.

Pixelgenaue Edits ohne Re-Render

Frühere Modelle behandelten jeden Edit als vollständige Neugenerierung. Ein Wort auf einem Poster ändern, und das ganze Bild wird neu gewürfelt — der Hintergrund verschiebt sich, die Farben driften, die Details, die dir eben noch gefielen, verschwinden. Iteration wurde zum Glücksspiel.

GPT Image 2 unterstützt lokale Edits, die nur die von dir bezeichnete Region betreffen: Headline austauschen, Jacke umfärben, ein falsch gesetztes Balken-Label korrigieren, eine Hand neu zeichnen. Der Rest des Bildes bleibt pixelgenau identisch, sodass Iteration additiv wird — fixiere eine Komposition, die dir gefällt, und korrigiere dann das eine Detail, das nicht stimmt, ohne alles andere mit aufs Spiel zu setzen.

In der Praxis ersetzt das den Photoshop-Umweg für kleine Korrekturen. Zusammen mit dem Reasoning-Schritt wird Bildgenerierung so zu einem Entwurfs- und Revisions-Workflow: Erzeuge ein Layout, mit dem du zufrieden bist, und bearbeite dann die Details an Ort und Stelle, bis sie zum Brief passen — statt in jedem Durchgang das ganze Bild neu zu würfeln.

GPT Image 2 auf aigazou nutzen

GPT Image 2 lebt im Standard-Generierungsfluss auf der Startseite. Kein separater Editor, keine Warteliste, keine zusätzliche Einrichtung ― drei Schritte vom leeren Prompt zum fertigen Bild.

  1. Startseite mit vorausgewähltem GPT Image 2 öffnen

    Verwenden Sie den Link unten, dann ist der Modellauswähler auf der Startseite bereits auf GPT Image 2 gesetzt. Sie können es auch manuell aus dem Modell-Dropdown wählen, wenn Sie über einen anderen Einstiegspunkt kamen.

    Startseite öffnen
  2. Klaren, deklarativen Prompt schreiben

    Kurz und spezifisch schlägt lang und ornamental. Benennen Sie das Subjekt, den Stil und jeden Text, der im Bild erscheinen soll (in Anführungszeichen). Bei textlastigen Prompts schreiben Sie den Bildtext genau so aus, wie er gerendert werden soll, einschließlich Interpunktion und Groß-/Kleinschreibung. Das Modell behandelt zitierte Strings als wörtliche Kopie.

  3. Generieren und verfeinern

    Wenn das Gesamt-Layout falsch ist, schreibe den Prompt um und generiere neu — der Reasoning-Schritt arbeitet am besten mit einem klaren Brief. Für kleine Korrekturen (ein falsch geschriebenes Wort, eine falsche Farbe, ein einzelnes Element) nutze den pixelgenauen Edit auf dem Ergebnis, statt das ganze Bild neu zu würfeln.

Beispielausgaben

Sechs Prompts, die durch GPT Image 2 gelaufen sind, ohne Retusche. Der Text unter jedem Bild ist genau der Prompt, der es erzeugt hat.

Beispiel-Filmplakat, erzeugt von GPT Image 2 mit dem Titel 'Midnight in Tokyo'

Filmplakat, gesetzte Typografie

A vertical movie poster for a Tokyo neo-noir film. Title 'MIDNIGHT IN TOKYO' set large in modern serif at the top. Subtitle 'A film by Yuki Tanaka' beneath. Bottom strip reads 'IN THEATERS · APRIL 2026'. Cool blue night palette.

Hauptzeile, Unterzeile und Metadatenzeile rendern alle beim ersten Versuch lesbar ― der Textrendering-Benchmark in seiner direktesten Form.

Beispiel-Café-Karte, erzeugt von GPT Image 2, mit gut lesbaren japanischen und koreanischen Artikelnamen und Preisen

Zweisprachige Café-Karte auf Japanisch und Koreanisch

Eine Café-Karte in Japanisch und Koreanisch. Kopfzeile lautet 'メニュー / 메뉴'. Zwei Menüzeilen: '抹茶ラテ · ¥580' und '아메리카노 · ₩4,500'. Cremefarbener Hintergrund, handgezeichneter Rahmen.

Zwei ostasiatische Schriften in derselben Komposition, beide sauber gerendert, ohne in ornamentale Formen abzugleiten.

Beispiel-Infografik, erzeugt von GPT Image 2, mit beschrifteten Quartalswachstumsbalken

Quartalswachstum-Infografik

A clean infographic titled '2026 Q1 Growth'. Three horizontal bars labeled 'JAN +12%', 'FEB +24%', 'MAR +38%'. Off-white background, single blue accent. Helvetica-style sans-serif.

Natives Reasoning hält jede Beschriftung am richtigen Balken ― der Fehlermodus, der traditionell KI-generierte Infografiken zerstört hat.

Beispiel-Zwei-Panel-Comic, erzeugt von GPT Image 2 mit konsistentem Charakter und Dialog

Zwei-Panel-Büroszene

A two-panel comic strip. Panel 1: a tired office worker at a desk, speech bubble reading 'Did you finish the report?'. Panel 2: same character, slightly slumped, bubble reading '...Almost.' Black-and-white ink style.

Derselbe Charakter hält über beide Panels, und jede Sprechblase bleibt am richtigen Sprecher.

Beispiel-Mobile-UI-Mockup, erzeugt von GPT Image 2 mit realistischem Interface-Text

Mobiles Mail-App-Mockup

A realistic mobile UI mockup of a mail app inbox. Status bar reads '9:41' and '100%'. Title 'Inbox'. Two list rows: 'Sarah Chen · 2m', 'Design Review · 14m'. Bottom tab bar: 'Mail · Calendar · Settings'.

Realistischer Interface-Text, kein dekoratives Kauderwelsch ― der Unterschied zwischen einem KI-Mockup und einer brauchbaren Designreferenz.

Drei Beispielbilder, erzeugt von GPT Image 2 über separate Durchläufe, jedes bewahrt denselben Charakter

Derselbe Charakter, drei Szenen

Three separate runs of the same character: a young illustrator with short black hair, round glasses, and a forest-green sweater. Run 1 in a quiet bookshop. Run 2 on a city rooftop at dusk. Run 3 in a sunny park with a sketchbook.

Drei Läufe von drei unterschiedlichen Prompts, die denselben Charakterbeschreibungs-Absatz teilen. Das Modell nutzt diesen Absatz als Casting-Brief, sodass die Person erkennbar bleibt, während die Szene wechselt.

Echte Renderings werden gerade eingespielt — die Panels oben zeigen vorerst nur die Absicht jedes Prompts, nicht die finalen Pixel. Deine eigenen Ergebnisse variieren je nach Prompt-Detail und aktueller Modellkapazität.

Wie GPT Image 2 sich vergleicht

Wo GPT Image 2 neben Midjourney v7, dem eigenen Vorgänger und DALL·E 3 steht.

FähigkeitGPT Image 2Midjourney v7gpt-image-1DALL·E 3
Textrendering im BildEtwa 99 % Genauigkeit auf unterstützten SchriftenBesser als v6, aber bei längerem Text und strukturierten Layouts weiterhin unzuverlässigHäufig lesbar bei kurzen lateinischen Strings, weniger zuverlässig bei längeren TextenHäufig verstümmelt, besonders bei längeren Texten oder nicht-lateinischen Schriften
Nicht-lateinische Schriften (CJK)Zuverlässig in Chinesisch, Japanisch und KoreanischBegrenzt; CJK-Text degradiert häufig zu dekorativen FormenBegrenzt; nicht-lateinische Glyphen brechen häufigBegrenzt; häufiger als dekorative Formen behandelt denn als Text
Layout-Reasoning vor dem ZeichnenNativ ― plant Komposition vor dem ersten PixelKein expliziter Planungsschritt; starker stilistischer PriorKein expliziter PlanungsschrittKein expliziter Planungsschritt
Charakterkonsistenz über separate DurchläufeStark über Durchläufe desselben PromptsCharacter Reference hält Ähnlichkeit über Läufe hinweg, benötigt aber Seed-BilderSchwach ― jeder Durchlauf interpretiert das Subjekt unabhängigSchwach ― jeder Durchlauf interpretiert das Subjekt unabhängig
Am besten geeignet fürPlakate, Speisekarten, Infografiken, UI-Mockups und Comics, bei denen Bildtext und Struktur zählenStilisierte, stimmungsvolle Illustration und Art Direction, bei der Text auf dem Bild zweitrangig istAllgemeine Illustration, bei der Textgenauigkeit nicht Priorität istAllgemeine künstlerische Illustration; stilistische Flexibilität über Textgenauigkeit

Wo es seinen Wert beweist

Sechs Stellen, an denen die spezifischen Stärken von GPT Image 2 ― Text, Planung, Mehrsprachigkeit ― ändern, was aus einem Prompt möglich ist.

Marketingplakate mit gesetzter Typografie

Produkteinführungen, Veranstaltungsflyer, Stellenanzeigen. Hauptzeile, Unterzeile und Metadatenzeile rendern beim ersten Versuch lesbar, sodass Designteams Prompts so iterieren können, wie ein Texter Entwürfe iteriert ― kein Compositing-Schritt nötig.

A recruitment poster for a design studio. Headline 'WE'RE HIRING' in heavy black sans-serif at the top. Three role names below in lighter weight: 'Senior Designer', 'Product Manager', 'Brand Strategist'. Footer strip: 'APPLY BY MAY 15 · [email protected]'. Paper-grain off-white background.
A festival poster for a summer jazz event. Headline 'BLUE NOTE FEST 2026' in heavy condensed sans. Three artist names below in smaller weight. Warm amber and ink palette.

Produktmockups und Verpackung

Kaffeebeutel, Kosmetiktuben, App-Icons auf Geräten, Getränkedosen. Das Modell kann einen Markennamen über mehrere SKUs in derselben Szene halten, ohne ihn zu unsinnigen Glyphen zu verwischen ― der Fehlermodus, der traditionell KI-generierte Verpackung zerstört hat.

Three coffee bags side by side on a marble counter. Each labeled 'AOI', 'KAEDE', 'YUKI'. Minimalist matte packaging in cream, sage, and slate. Studio lighting.
A skincare bottle on a bathroom shelf. Label reads 'ATELIER NO. 4 · Hydrating Serum · 30ml'. Soft natural light from the left.

Bildinhalte mit Text

Social-Media-Grafiken, Zitatkarten, Lyrik-Typografie, Motivationsplakate, Meme-Vorlagen. Überall, wo die Botschaft das Werk ist. Das ist der kanonische Anwendungsfall, den das neue Textrendering freischaltet, und den schwächere Modelle nicht fälschen können.

A square Instagram quote card. Centered text in elegant script: 'The best time to plant a tree was twenty years ago. The second best time is now.' Soft sage background, off-white border.
A vertical lyric card. Text reads '夜の街は静かに歌う' in vertical Japanese typesetting on the right side. Ink-wash background, restrained palette.

Infografiken und Datenvisualisierung

Stat-Hervorhebungen, Vorher/Nachher-Vergleiche, einfache Balkendiagramme, Prozessdiagramme. Der Reasoning-Schritt hält Beschriftungen an den richtigen Balken und Titel in der richtigen Hierarchie, was das ewige Verräter-Tic der KI-Infografik ― falsch platzierte Zahlen ― entfernt.

A single-page onboarding flow titled 'From sign-up to first image'. Four labeled boxes connected by arrows: '1. Sign in', '2. Pick a model', '3. Write a prompt', '4. Generate'. Muted grey connectors, one warm accent on the final box.
A two-column comparison graphic titled 'Before vs After'. Left column header 'Before', right column header 'After'. Three bullet rows of short labels under each.

Comicpanels und Storyboards

Zwei- und Drei-Panel-Szenen, Storyboard-Frames, manga-artige Sequenzen. Natives Reasoning hält denselben Charakter über Panels und Sprechblasen am richtigen Sprecher ― die zwei Fehlermodi, die KI-Comics vorher unmöglich machten.

A two-panel comic strip. Panel 1: a tired office worker at a desk, speech bubble reading 'Did you finish the report?'. Panel 2: same character, slightly slumped, bubble reading '...Almost.' Black-and-white ink style.
A three-panel storyboard for a coffee commercial. Panel 1: hand pouring espresso into a cup. Panel 2: cup steaming on a wooden table. Panel 3: silhouette of a person taking a sip. Cinematic lighting, no dialogue.

Mehrsprachige Layouts

Zweisprachige Beschilderung, zweisprachige Verpackung, mehrsprachige UI-Mockups, übersetzte Marketingassets. Das Modell hält zwei Schriften in derselben Komposition, ohne dass eine zu dekorativen Formen verfällt ― deshalb verdient dieser Abschnitt eine eigene Klasse.

A bilingual coffee shop receipt in Japanese and English. Header 'TOKYO ROASTERS'. Line items: 'ドリップコーヒー / Drip Coffee · ¥550', 'クロワッサン / Croissant · ¥380'. Footer: 'ありがとうございました · Thank you'. Cream paper with a faint grid.
A bilingual storefront sign. Left side reads 'TOKYO BAGEL' in English. Right side reads '東京ベーグル' in Japanese, same weight and visual size. Wooden plank background.

Häufige Fragen

Was ist GPT Image 2?

GPT Image 2 ist OpenAIs neuestes Bilderzeugungsmodell. Es verbessert den Vorgänger in drei Bereichen: lesbarer Text innerhalb von Bildern, pixelgenaue Bearbeitung bestehender Bilder und weltwissensbasierter Realismus bei Physik, Materialien und Anatomie. Wir stellen es hier als Credits-basierten Online-Generator bereit.

Ist GPT Image 2 kostenlos?

Jede Generierung kostet 8 Credits. Es gibt kein separates Abo, um das Modell freizuschalten — du kannst jederzeit über dein Konto aufladen.

Wie unterscheidet sich GPT Image 2 von gpt-image-1 oder DALL·E 3?

GPT Image 2 plant die Komposition vor dem Zeichnen, deshalb halten dichte Kompositionen und Infografiken besser zusammen. Text im Bild — besonders in CJK-Schriften — ist deutlich schärfer als bei früheren Modellen, und es unterstützt pixelgenaue Edits an bestehenden Bildern, ohne das ganze Bild neu zu rendern.

Kann ich GPT-Image-2-Bilder kommerziell nutzen?

Ja. Erzeugte Bilder gehören Ihnen zur Nutzung in persönlichen und kommerziellen Projekten, vorbehaltlich der Inhaltsrichtlinie von OpenAI und geltenden Gesetzes. Wir erheben keine Rechte an Ihren Ausgaben.

Welche Sprachen rendert GPT Image 2 gut innerhalb der Bilder?

Chinesisch (Kurz- und Langzeichen), Japanisch, Koreanisch und alle lateinisch geschriebenen Sprachen werden sauber gerendert. Lange Absätze profitieren in jeder Sprache weiterhin von kurzen, klaren Prompts.

Probieren Sie GPT Image 2 heute

Der Link unten öffnet die Startseite mit GPT Image 2 bereits ausgewählt, sodass der nächste Klick das Schreiben deines ersten Prompts ist.