Model gambar terbaru dari OpenAI · tersedia di aigazou

GPT Image 2: teks keluar benar, edit hanya menyentuh area yang kamu pilih, detail tetap utuh saat di-zoom

Model gambar AI sudah lama tersandung di tiga hal: teks di poster jadi acak-acakan, mengubah satu bagian kecil berarti menggambar ulang seluruh bingkai, dan tangan tiba-tiba punya jari tambahan. GPT Image 2 menjawab ketiganya — akurasi rendering teks sekitar 99% pada aksara Latin dan Asia Timur (benchmark resmi OpenAI), edit lokal sungguhan yang hanya menyentuh area yang kamu pilih, serta landasan pengetahuan dunia agar fisika dan anatomi tetap meyakinkan bahkan saat diperbesar penuh.

Apa itu GPT Image 2

GPT Image 2 adalah model gambar native generasi kedua dari OpenAI, dirilis April 2026 sebagai penerus gpt-image-1. Ia adalah model gambar pertama OpenAI yang memiliki langkah reasoning bawaan: sebelum piksel dibuat, model menyusun komposisi, menentukan posisi tiap elemen, dan memikirkan bagaimana teks di dalam gambar harus ditata. Outputnya adalah satu gambar yang sudah dirender dari prompt berbahasa alami — tidak butuh editor terpisah, tidak ada langkah tata letak manual. Di aigazou, GPT Image 2 berjalan di alur pembuatan gambar standar di halaman beranda: pilih dari dropdown model, tulis prompt, dapatkan gambar.

Cara paling gamblang memahami untuk apa GPT Image 2 adalah dengan melihat kasus-kasus di mana model lama konsisten gagal. Poster dengan tagline terbaca, menu dengan harga dan nama hidangan, infografik dengan label sumbu, panel komik dengan balon dialog, mockup mobile dengan teks antarmuka realistis — semuanya komposisi di mana teks adalah bagian dari gambar. Model berbasis diffusion sebelumnya mengaduk-aduk glyph atau berhalusinasi teks yang kelihatan masuk akal tapi ambruk saat dibaca ulang. Jawabannya bukan resolusi lebih tinggi, melainkan langkah reasoning: model memperlakukan “teks dan tata letak” pertama-tama sebagai masalah perencanaan, lalu baru sebagai masalah rendering. OpenAI melaporkan akurasi teks sekitar 99% pada aksara yang didukung, termasuk Mandarin (sederhana dan tradisional), Jepang, dan Korea — aksara Asia Timur yang oleh generasi sebelumnya diperlakukan sebagai bentuk dekoratif. Selain teks, GPT Image 2 juga menghadirkan pengeditan level piksel untuk retouch presisi pada gambar yang sudah ada dan realisme berbasis pengetahuan dunia yang menjaga fisika, material, dan anatomi tetap meyakinkan.

GPT Image 2 juga menjaga karakter dan gaya tetap stabil di antara generasi dari prompt yang sama — bentuk wajah yang sama, kostum yang sama, palet yang sama. Pada prompt yang berbeda, model tidak otomatis membawa subjek: pola kerjanya adalah menulis deskripsi karakter sekali sebagai paragraf lalu menempelkan paragraf itu ke setiap prompt adegan sebagai casting brief. Alur «paragraf sebagai jangkar» inilah yang membuat model ini dapat dipakai untuk pekerjaan yang butuh lebih dari satu gambar — storyboard, seri komik, aset pemasaran berbrand konsisten, character sheet — tanpa melatih LoRA khusus. GPT Image 2 bukan alat yang tepat untuk setiap gambar; untuk gaya anime cat air yang lembut, selfie yang dipoles, atau kartu liburan berstiker, tool khusus di aigazou akan lebih cepat. Hasilnya menjadi milikmu untuk proyek pribadi maupun komersial, mengikuti kebijakan konten OpenAI.

Apa yang diubah GPT Image 2

Tujuh hal yang sering dilakukan salah oleh model gambar lama, dan bagaimana model ini memperbaikinya.

Akurasi rendering teks 99%

Model gambar sebelumnya bisa menggambar poster tetapi tidak judul di atasnya. Bentuk huruf terdistorsi, kerning runtuh, garis melenceng, dan semua glif di luar alfabet Latin berubah menjadi kebisingan dekoratif. Solusi standar adalah menghasilkan latar belakang di satu alat, memblok area bersih, lalu menyisipkan teks kembali dengan tangan. Berhasil, tapi itu bukan generasi; itu compositing berbalut generasi.

GPT Image 2 menutup celah itu. Benchmark milik OpenAI sendiri melaporkan akurasi rendering teks di kisaran 99 % pada teks yang dapat dicetak — paragraf, harga, keterangan, dan label. Huruf-huruf menjaga proporsinya, kata-kata duduk pada garis dasar yang konsisten, dan teks pendek terbaca sebagai tipografi yang disengaja, bukan bentuk yang sekadar mirip huruf.

Secara praktis, karya dan kata keluar dari pass yang sama. Kamu bisa iterasi pada poster film, menu kafe, layar aplikasi, atau infografis seperti copywriter iterasi pada draft ― ubah prompt, regenerate, baca hasil. Teks sekarang bagian dari gambar, bukan lapisan yang kamu tambahkan setelahnya.

Merencanakan tata letak sebelum menggambar

GPT Image 2 hadir dengan langkah reasoning native. Sebelum ada piksel yang dihasilkan, model memecah prompt menjadi rencana terstruktur: apa yang pergi ke mana, elemen mana di latar depan, bagaimana panel berhubungan satu sama lain, di mana menaruh ruang negatif. Baru setelah rencana itu ditetapkan model mulai menggambar piksel ke dalamnya. Reasoning tak terlihat olehmu, tetapi ia melakukan sebagian besar kerja struktural yang model lama coba pura-purakan di level piksel.

Pass ekstra itulah alasan komposisi padat akhirnya kokoh. Komik multi-panel menjaga balon ucapan tetap terpasang ke karakter yang tepat. Infografis menempatkan label pada batang yang benar dan judul pada hierarki yang benar. Mockup UI mengelompokkan kontrol ke dalam pola yang dapat dikenali alih-alih menyebarkan tombol dan label secara merata di kanvas. Keluaran terbaca sebagai sesuatu yang dipikirkan desainer dengan matang, bukan rata-rata yang digabungkan model.

Ini juga mengubah cara menulis prompt. Dengan model lama, prompt kompleks menghasilkan gambar kompromi, jadi gaya kerja adalah menjaga prompt sempit dan menumpuk generasi untuk merakit kompleksitas. Dengan GPT Image 2, model dapat menyerap brief yang lebih panjang dan tetap menghasilkan tata letak koheren, jadi kamu bisa menjelaskan seluruh komposisi dalam satu prompt dan percaya bahwa ia merencanakan bagian-bagiannya.

Multibahasa sejak rancangan

Kualitas rendering teks bertahan di aksara CJK (Mandarin sederhana dan tradisional, Jepang, Korea) maupun bahasa beralfabet Latin. Tidak ada model lain yang perlu digonta-ganti, tidak ada flag bahasa yang perlu diatur. Tulis prompt dalam bahasa yang ingin muncul di gambar, dan model memperlakukan aksara itu sebagai warga kelas satu.

Model gambar sebelumnya praktis dirilis dengan asumsi tersembunyi bahwa teks di dalam gambar akan berbahasa Inggris. Apa pun di luar itu meluruh jadi coretan berbentuk mirip huruf. Tim di pasar CJK merespons dengan menghindari pembuatan teks dalam gambar sepenuhnya, kembali ke alur overlay, atau membayar fine-tuning khusus region. Di sini semua itu tidak diperlukan.

Kalau kamu memproduksi konten yang dilokalkan untuk pasar Asia Timur — papan toko, artwork kemasan, unggahan sosial, kartu resep, menu restoran — inilah beda praktisnya antara memakai output generatif langsung dan membangun ulang layer teks di Photoshop atau Figma. Dalam pipeline yang mencetak puluhan varian lokal per minggu, selisih jam itu cepat menumpuk.

Karakter konsisten melintasi eksekusi terpisah

Jalankan ulang prompt yang sama dan karakter akan kembali dikenali dari generasi ke generasi — bentuk wajah yang sama, rambut yang sama, palet warna yang sama, detail kostum yang sama. Namun pada prompt yang berbeda, model tidak membawa subjek secara otomatis: salin paragraf deskripsi karakter ke setiap prompt adegan sebagai casting brief, dan model akan berpegang padanya. Tidak perlu LoRA khusus, tidak perlu fine-tune, tidak perlu gambar referensi.

Untuk storyboard, maskot brand, urutan instruksional, ilustrasi buku anak, seri komik sosial, dan setiap pekerjaan naratif di mana karakter perlu muncul lebih dari sekali, ini menghapus pulang-pergi melatih model kustom atau LoRA hanya untuk menstabilkan satu wajah. Tulis deskripsi karakter yang cermat sekali, lalu gunakan kembali paragraf itu sebagai jangkar karakter di setiap prompt adegan dan biarkan model mengerjakan konsistensinya.

Ada batas yang patut diketahui. Konsistensi paling kuat ketika deskripsi karakter rinci dan konkret: warna dan panjang rambut spesifik, kacamata, pakaian yang dapat dikenali, aksesori khas. Paling lemah saat karakter dideskripsikan samar, saat adegan mengubah pencahayaan atau gaya rendering secara drastis, atau saat petunjuk karakter terkubur di akhir prompt. Perlakukan deskripsi sebagai brief casting, bukan saran lunak.

Komposisi padat yang benar-benar bertahan

Kombinasi reasoning native dan rendering teks yang membaik berarti GPT Image 2 menangani komposisi yang diam-diam diturunkan oleh sistem lama: infografis berbasis data dengan banyak nilai berlabel, mockup UI seluler dengan toolbar, tab, dan daftar inbox, poster pemasaran multi-elemen dengan hierarki, mockup pengemasan dengan beberapa SKU dalam bingkai yang sama. Inilah komposisi yang membuat generasi AI terasa jelas asistif alih-alih dapat dipakai.

Di mana DALL·E 3 atau gpt-image-1 memampatkan kompleksitas menjadi kesan samar ― «gambar berbentuk infografis dengan tanda berbentuk angka» ― GPT Image 2 memperlakukan kepadatan sebagai spesifikasi dan berusaha menghormatinya. Batang mendapat label. Tab mendapat nama. Ikon toolbar mendapat bentuk yang dapat dibedakan. Hasilnya adalah sesuatu yang bisa direspons dan disempurnakan desainer, bukan sesuatu yang harus dibuang dan dimulai lagi dengan tata letak manual.

Peringatan jujur adalah bahwa tata letak sangat padat ― spread majalah satu halaman, dasbor kompleks dengan dua puluh widget berbeda, adegan padat dengan selusin prop berlabel ― tetap diuntungkan dari memecah brief menjadi pass yang lebih kecil. Generate grafiknya, lalu konteks sekitarnya, lalu komposisikan layer di alat yang memberimu kontrol level piksel. Ambang di mana compositing manual menang sudah bergerak naik banyak, tapi masih ada di ujung atas kompleksitas.

Penggunaan komersial, dengan catatan yang biasa

Gambar yang kamu buat dengan GPT Image 2 adalah milikmu untuk digunakan dalam proyek pribadi dan komersial, tunduk pada kebijakan konten OpenAI dan hukum yang berlaku. Tidak ada tingkat lisensi terpisah untuk di-upgrade, tidak ada model royalti untuk dibaca, tidak ada biaya pemakaian di atas biaya generasi. Keluaran milikmu sejak saat ia mendarat di akunmu, dan aigazou tidak mengklaim hak hilir atas apa yang kamu hasilkan.

Cakupan praktis: aset pemasaran, ilustrasi blog, mockup produk, konsep pengemasan, konten media sosial, karya dalam aplikasi, materi kursus, dokumen internal, thumbnail video, slide presentasi. Di mana kamu akan mempekerjakan ilustrator atau membayar stok, kamu dapat menggunakan gambar yang dibuat sebagai gantinya, dengan jenis due diligence yang sama yang akan kamu terapkan pada aset visual pihak ketiga mana pun.

Catatan yang biasa tetap berlaku — tidak boleh memakai kemiripan orang nyata tanpa izin, tidak boleh melanggar merek dagang atau karakter berhak cipta, tidak boleh membuat gambar menyesatkan tentang tokoh publik. Anggap kebijakan konten OpenAI sebagai kontrak, dan kamu sedang bekerja di dalam lisensi yang bersih untuk penggunaan komersial sehari-hari.

Edit tingkat piksel tanpa render ulang

Model sebelumnya memperlakukan setiap edit sebagai regenerasi utuh. Ubah satu kata pada poster dan seluruh gambar diundi ulang — latar bergeser, warna melenceng, detail yang tadi kamu suka hilang. Iterasi jadi seperti judi.

GPT Image 2 mendukung edit lokal yang hanya menyentuh area yang kamu tunjuk: mengganti judul, mengubah warna jaket, membetulkan label batang yang salah tempat, menggambar ulang sebuah tangan. Sisa gambar tetap identik per piksel, jadi iterasi menjadi tambahan — kunci komposisi yang kamu suka, lalu perbaiki satu detail yang mengganggu tanpa mempertaruhkan semua yang lain.

Dalam praktiknya ini menggantikan perjalanan bolak-balik ke Photoshop untuk koreksi kecil. Digabung dengan langkah penalaran, pembuatan gambar menjadi lebih mirip alur draft-dan-revisi: hasilkan tata letak yang kamu sukai, lalu edit detail di tempat sampai cocok dengan brief, alih-alih mengundi ulang seluruh bingkai tiap putaran.

Cara menggunakan GPT Image 2 di aigazou

GPT Image 2 hidup di dalam alur generasi standar di beranda. Tanpa editor terpisah, tanpa daftar tunggu, tanpa pengaturan tambahan ― tiga langkah dari prompt kosong ke gambar jadi.

  1. Buka beranda dengan GPT Image 2 terpilih awal

    Gunakan tautan di bawah dan pemilih model di beranda sudah disetel ke GPT Image 2. Kamu juga dapat memilihnya secara manual dari dropdown model jika kamu tiba melalui titik masuk yang berbeda.

    Buka beranda
  2. Tulis prompt yang jelas dan deklaratif

    Singkat dan spesifik mengalahkan panjang dan ornamental. Sebutkan subjek, gaya, dan teks apa pun yang harus muncul di dalam gambar (dalam tanda kutip). Untuk prompt yang padat teks, tulis teks di gambar persis seperti yang harus dirender, termasuk tanda baca dan huruf besar-kecil. Model memperlakukan string di dalam kutipan sebagai copy harfiah.

  3. Buat dan sempurnakan

    Jika tata letak keseluruhan salah, tulis ulang prompt dan generasi ulang — langkah penalaran paling baik bekerja dengan brief yang jelas. Untuk koreksi kecil (salah ketik satu kata, warna keliru, satu elemen), gunakan edit tingkat piksel pada hasil alih-alih mengundi ulang seluruh gambar.

Keluaran contoh

Enam prompt yang dijalankan melalui GPT Image 2 tanpa sentuhan. Teks di bawah setiap gambar adalah prompt persis yang menghasilkannya.

Poster film contoh yang dibuat GPT Image 2 dengan judul 'Midnight in Tokyo'

Poster film, tipografi tersusun

A vertical movie poster for a Tokyo neo-noir film. Title 'MIDNIGHT IN TOKYO' set large in modern serif at the top. Subtitle 'A film by Yuki Tanaka' beneath. Bottom strip reads 'IN THEATERS · APRIL 2026'. Cool blue night palette.

Judul utama, subjudul, dan baris metadata semuanya terbaca sejak percobaan pertama ― benchmark rendering teks dalam bentuknya yang paling langsung.

Contoh menu kafe yang dihasilkan GPT Image 2 dengan nama item dan harga dalam bahasa Jepang dan Korea yang terbaca

Menu kafe bilingual dalam bahasa Jepang dan Korea

Menu kafe dalam bahasa Jepang dan Korea. Header tertulis 'メニュー / 메뉴'. Dua baris menu: '抹茶ラテ · ¥580' dan '아메리카노 · ₩4,500'. Latar krem, bingkai gaya sketsa tangan.

Dua aksara Asia Timur dalam satu komposisi, keduanya dirender rapi tanpa terjatuh jadi bentuk ornamental.

Infografis contoh yang dibuat GPT Image 2 menunjukkan batang pertumbuhan kuartalan berlabel

Infografis pertumbuhan kuartalan

A clean infographic titled '2026 Q1 Growth'. Three horizontal bars labeled 'JAN +12%', 'FEB +24%', 'MAR +38%'. Off-white background, single blue accent. Helvetica-style sans-serif.

Reasoning native menjaga setiap label terpasang pada batang yang benar ― mode kegagalan yang secara tradisional mematikan infografis buatan AI.

Komik contoh dua panel yang dibuat GPT Image 2 dengan karakter dan dialog konsisten

Adegan kantor dua panel

A two-panel comic strip. Panel 1: a tired office worker at a desk, speech bubble reading 'Did you finish the report?'. Panel 2: same character, slightly slumped, bubble reading '...Almost.' Black-and-white ink style.

Karakter yang sama bertahan di kedua panel, dan setiap balon ucapan tetap terpasang ke pembicara yang tepat.

Mockup UI seluler contoh yang dibuat GPT Image 2 dengan copy antarmuka realistis

Mockup aplikasi email seluler

A realistic mobile UI mockup of a mail app inbox. Status bar reads '9:41' and '100%'. Title 'Inbox'. Two list rows: 'Sarah Chen · 2m', 'Design Review · 14m'. Bottom tab bar: 'Mail · Calendar · Settings'.

Copy antarmuka realistis, bukan omong kosong dekoratif ― beda antara mockup AI dan referensi desain yang dapat dipakai.

Tiga gambar contoh yang dibuat GPT Image 2 lintas eksekusi terpisah, masing-masing mempertahankan karakter yang sama

Karakter yang sama, tiga adegan

Three separate runs of the same character: a young illustrator with short black hair, round glasses, and a forest-green sweater. Run 1 in a quiet bookshop. Run 2 on a city rooftop at dusk. Run 3 in a sunny park with a sketchbook.

Tiga kali generasi dari tiga prompt berbeda yang memakai paragraf deskripsi karakter yang sama. Model menggunakan paragraf itu sebagai casting brief, sehingga sosok tetap dapat dikenali meski adegannya berubah.

Render aslinya sedang dipasang secara bertahap — untuk sementara panel di atas hanya memperlihatkan maksud setiap prompt, bukan piksel final. Hasilmu sendiri akan berbeda-beda tergantung detail prompt dan kapasitas model saat ini.

Bagaimana GPT Image 2 dibandingkan

Di mana posisi GPT Image 2 di antara Midjourney v7, pendahulunya sendiri, dan DALL·E 3.

KapabilitasGPT Image 2Midjourney v7gpt-image-1DALL·E 3
Rendering teks di dalam gambarSekitar 99% akurasi pada aksara yang didukungLebih baik dari v6 tapi masih belum dapat diandalkan untuk teks panjang dan tata letak terstrukturSering terbaca untuk string Latin pendek, kurang andal untuk copy panjangSering rusak, terutama pada copy panjang atau aksara non-Latin
Dukungan aksara non-Latin (CJK)Andal untuk bahasa Mandarin, Jepang, dan KoreaTerbatas; teks CJK cenderung memburuk menjadi bentuk dekoratifTerbatas; glif non-Latin sering patahTerbatas; lebih sering diperlakukan sebagai bentuk dekoratif ketimbang teks
Reasoning tata letak sebelum menggambarNative ― merencanakan komposisi sebelum piksel pertamaTidak ada langkah perencanaan eksplisit; kecenderungan stilistik yang kuatTidak ada langkah perencanaan eksplisitTidak ada langkah perencanaan eksplisit
Konsistensi karakter lintas eksekusi terpisahKuat lintas eksekusi dari prompt yang samaCharacter Reference menjaga kemiripan antar-jalan, tapi perlu gambar seedLemah ― tiap eksekusi menafsirkan subjek secara mandiriLemah ― tiap eksekusi menafsirkan subjek secara mandiri
Cocok paling untukPoster, menu, infografis, mockup UI, dan komik di mana teks di gambar dan struktur pentingIlustrasi dan pengarahan seni yang stilistik dan beratmosfer, di mana teks di gambar bersifat sekunderIlustrasi umum di mana akurasi teks bukan prioritasIlustrasi artistik umum; fleksibilitas gaya di atas akurasi teks

Di mana ia membuktikan kegunaannya

Enam tempat di mana kekuatan spesifik GPT Image 2 ― teks, perencanaan, multibahasa ― mengubah apa yang mungkin dari sebuah prompt.

Poster pemasaran dengan tipografi tersusun

Peluncuran produk, flyer acara, iklan rekrutmen. Judul utama, subjudul, dan baris metadata semuanya keluar terbaca sejak percobaan pertama, jadi tim desain dapat iterasi prompt seperti copywriter iterasi draft ― tanpa langkah compositing.

A recruitment poster for a design studio. Headline 'WE'RE HIRING' in heavy black sans-serif at the top. Three role names below in lighter weight: 'Senior Designer', 'Product Manager', 'Brand Strategist'. Footer strip: 'APPLY BY MAY 15 · [email protected]'. Paper-grain off-white background.
A festival poster for a summer jazz event. Headline 'BLUE NOTE FEST 2026' in heavy condensed sans. Three artist names below in smaller weight. Warm amber and ink palette.

Mockup produk dan pengemasan

Kantong kopi, tabung kosmetik, ikon aplikasi di perangkat, kaleng minuman. Model dapat mempertahankan nama merek lintas beberapa SKU dalam adegan yang sama tanpa memburaikannya ke glif tak bermakna ― mode kegagalan yang secara tradisional mematikan pengemasan buatan AI.

Three coffee bags side by side on a marble counter. Each labeled 'AOI', 'KAEDE', 'YUKI'. Minimalist matte packaging in cream, sage, and slate. Studio lighting.
A skincare bottle on a bathroom shelf. Label reads 'ATELIER NO. 4 · Hydrating Serum · 30ml'. Soft natural light from the left.

Konten gambar dengan teks

Grafik media sosial, kartu kutipan, tipografi lirik, poster motivasi, template meme. Di mana pesan adalah karyanya. Ini adalah use case kanonik yang dibuka rendering teks baru, dan yang tak bisa dipalsukan model lebih lemah.

A square Instagram quote card. Centered text in elegant script: 'The best time to plant a tree was twenty years ago. The second best time is now.' Soft sage background, off-white border.
A vertical lyric card. Text reads '夜の街は静かに歌う' in vertical Japanese typesetting on the right side. Ink-wash background, restrained palette.

Infografis dan visual data

Sorotan stat, perbandingan sebelum/sesudah, grafik batang sederhana, diagram proses. Langkah reasoning menjaga label terpasang pada batang yang benar dan judul pada hierarki yang benar, yang menghapus jejak abadi infografis AI ― angka salah posisi.

A single-page onboarding flow titled 'From sign-up to first image'. Four labeled boxes connected by arrows: '1. Sign in', '2. Pick a model', '3. Write a prompt', '4. Generate'. Muted grey connectors, one warm accent on the final box.
A two-column comparison graphic titled 'Before vs After'. Left column header 'Before', right column header 'After'. Three bullet rows of short labels under each.

Panel komik dan storyboard

Adegan dua dan tiga panel, frame storyboard, urutan gaya manga. Reasoning native menjaga karakter yang sama lintas panel dan balon ucapan terpasang ke pembicara yang benar ― dua mode kegagalan yang membuat komik AI mustahil sebelumnya.

A two-panel comic strip. Panel 1: a tired office worker at a desk, speech bubble reading 'Did you finish the report?'. Panel 2: same character, slightly slumped, bubble reading '...Almost.' Black-and-white ink style.
A three-panel storyboard for a coffee commercial. Panel 1: hand pouring espresso into a cup. Panel 2: cup steaming on a wooden table. Panel 3: silhouette of a person taking a sip. Cinematic lighting, no dialogue.

Tata letak multibahasa

Papan dwibahasa, pengemasan dwibahasa, mockup UI multibahasa, aset pemasaran terjemahan. Model mempertahankan dua aksara dalam komposisi yang sama tanpa salah satunya terdegradasi menjadi bentuk dekoratif ― itulah sebabnya bagian ini layak menjadi kelasnya sendiri.

A bilingual coffee shop receipt in Japanese and English. Header 'TOKYO ROASTERS'. Line items: 'ドリップコーヒー / Drip Coffee · ¥550', 'クロワッサン / Croissant · ¥380'. Footer: 'ありがとうございました · Thank you'. Cream paper with a faint grid.
A bilingual storefront sign. Left side reads 'TOKYO BAGEL' in English. Right side reads '東京ベーグル' in Japanese, same weight and visual size. Wooden plank background.

Pertanyaan yang sering diajukan

Apa itu GPT Image 2?

GPT Image 2 adalah model pembuatan gambar terbaru dari OpenAI. Ia mengungguli pendahulunya pada tiga aspek: merender teks yang terbaca di dalam gambar, pengeditan level piksel pada gambar yang sudah ada, dan realisme berbasis pengetahuan dunia untuk fisika, material, dan anatomi. Di sini ia kami sajikan sebagai generator daring bertenaga Credits.

Apakah GPT Image 2 gratis?

Setiap generasi memakai 8 kredit. Tidak ada langganan terpisah untuk membuka model — kamu bisa top-up kapan saja dari akunmu.

Apa beda GPT Image 2 dari gpt-image-1 atau DALL·E 3?

GPT Image 2 merencanakan tata letak sebelum menggambar, sehingga komposisi padat dan infografis lebih utuh. Teks di dalam gambar — terutama pada aksara CJK — jauh lebih tajam daripada model sebelumnya, dan ia mendukung edit tingkat piksel pada gambar yang sudah ada tanpa perlu merender ulang seluruh bingkai.

Bisakah saya menggunakan gambar GPT Image 2 secara komersial?

Ya. Gambar yang kamu hasilkan adalah milikmu untuk digunakan dalam proyek pribadi dan komersial, tunduk pada kebijakan konten OpenAI dan hukum yang berlaku. Kami tidak mengklaim hak atas keluaranmu.

Bahasa apa yang GPT Image 2 render dengan baik di dalam gambar?

Bahasa Mandarin (sederhana dan tradisional), Jepang, Korea, serta bahasa beralfabet Latin semuanya dirender dengan bersih. Paragraf panjang di bahasa apa pun tetap lebih baik dengan prompt yang ringkas dan deklaratif.

Coba GPT Image 2 hari ini

Tautan di bawah membuka halaman depan dengan GPT Image 2 sudah terpilih, dan klik berikutnya adalah menulis prompt pertamamu.