Mô hình hình ảnh mới nhất của OpenAI · đã có trên aigazou

GPT Image 2: chữ ra đúng, chỉnh sửa chỉ chạm vùng bạn chọn, chi tiết trụ được khi phóng to

Các mô hình ảnh AI từ lâu vướng ở ba chỗ: chữ trên poster bị loạn, đổi một vùng nhỏ thì phải vẽ lại cả khung, và bàn tay mọc thừa ngón. GPT Image 2 giải cả ba — khoảng 99% độ chính xác dựng chữ trên chữ Latin và chữ Đông Á (benchmark chính thức của OpenAI), chỉnh sửa cục bộ thật sự chỉ tác động đến vùng bạn chọn, và nền tảng tri thức thế giới giúp vật lý, chất liệu và giải phẫu vẫn đáng tin khi phóng to hết cỡ.

GPT Image 2 là gì

GPT Image 2 là mô hình hình ảnh gốc thế hệ thứ hai của OpenAI, ra mắt tháng 4 năm 2026 với tư cách là kế nhiệm của gpt-image-1. Đây là mô hình hình ảnh đầu tiên của OpenAI có bước suy luận tích hợp sẵn: trước khi tạo ra bất kỳ pixel nào, mô hình lên bố cục, quyết định mỗi phần tử nằm ở đâu và tính xem chữ trên ảnh nên được bố trí như thế nào. Đầu ra là một ảnh đã dựng hoàn chỉnh, sinh ra từ prompt bằng ngôn ngữ tự nhiên — không cần trình chỉnh sửa riêng, không cần bước dàn trang thủ công. Trên aigazou, GPT Image 2 chạy qua luồng sinh ảnh chuẩn ở trang chủ: chọn nó trong menu mô hình, viết prompt, nhận ảnh.

Cách trực tiếp nhất để hiểu GPT Image 2 dùng để làm gì là nhìn vào những tình huống mà các mô hình trước luôn thất bại. Poster có tagline dễ đọc, thực đơn có giá và tên món, infographic có nhãn trục, các khung truyện tranh có bong bóng thoại, mockup mobile có chữ giao diện thực tế — mọi bố cục trong đó chữ là một phần của hình. Các mô hình khuếch tán trước đây hoặc làm méo glyph, hoặc dựng lên một đoạn chữ có vẻ hợp lý nhưng vỡ vụn khi đọc lại. Lời giải không phải là độ phân giải cao hơn, mà là bước suy luận: mô hình coi «chữ và bố cục» trước hết là bài toán lập kế hoạch, rồi mới là bài toán dựng ảnh. OpenAI cho biết độ chính xác văn bản vào khoảng 99% trên các hệ chữ được hỗ trợ, bao gồm tiếng Trung (Giản thể và Phồn thể), tiếng Nhật và tiếng Hàn — những hệ chữ Đông Á mà thế hệ trước coi gần như hình trang trí. Bên cạnh chữ, GPT Image 2 còn mang đến chỉnh sửa ở mức pixel để tinh chỉnh chính xác trên ảnh có sẵn và tính hiện thực dựa trên tri thức thế giới giúp vật lý, chất liệu và giải phẫu luôn đáng tin.

GPT Image 2 cũng giữ cho nhân vật và phong cách ổn định giữa các lần tạo từ cùng một prompt — cùng khuôn mặt, cùng trang phục, cùng bảng màu. Ở các prompt khác nhau, mô hình không tự động kéo nhân vật theo: cách làm là viết đoạn mô tả nhân vật một lần thành một đoạn văn, rồi dán đoạn đó vào mỗi prompt cảnh như một casting brief. Chính quy trình «đoạn văn làm neo» này khiến mô hình đủ dùng cho công việc cần hơn một ảnh — storyboard, chuỗi truyện tranh, tài sản tiếp thị có tông thương hiệu nhất quán, character sheet — mà không phải huấn luyện LoRA tuỳ chỉnh. GPT Image 2 không phải công cụ phù hợp cho mọi loại ảnh; với phong cách anime màu nước mềm mại, ảnh selfie được chỉnh chuốt, hay thiệp lễ có nhãn dán thì các công cụ chuyên biệt khác trên aigazou sẽ đưa bạn tới đích nhanh hơn. Ảnh đầu ra thuộc về bạn cho cả dự án cá nhân và thương mại, tuân theo chính sách nội dung của OpenAI.

Những gì GPT Image 2 thay đổi

Bảy điều các mô hình ảnh cũ làm sai, và mô hình này sửa chúng thế nào.

Độ chính xác render văn bản 99%

Các mô hình hình ảnh trước có thể vẽ áp phích nhưng không vẽ được tiêu đề trên đó. Hình dạng chữ vặn vẹo, kerning sụp đổ, các dòng trôi đi, và bất kỳ glyph nào ngoài bảng chữ La-tinh đều biến thành tiếng ồn trang trí. Cách giải quyết tiêu chuẩn là tạo nền trong một công cụ, mặt nạ một vùng sạch, rồi chèn lại văn bản bằng tay. Nó hoạt động, nhưng đó không phải là tạo; đó là composit khoác áo tạo.

GPT Image 2 lấp đầy khoảng cách đó. Chính benchmark của OpenAI báo cáo độ chính xác dựng chữ khoảng 99 % trên văn bản in được — đoạn văn, giá, chú thích và nhãn. Các chữ giữ đúng tỷ lệ, các từ nằm trên đường cơ bản nhất quán, và đoạn ngắn đọc như typography có chủ đích thay vì các hình gần đúng.

Thực tế, tác phẩm và lời nói ra cùng một lượt. Bạn có thể lặp trên áp phích phim, thực đơn quán cà phê, màn hình ứng dụng hoặc infographic theo cách một copywriter lặp trên các bản nháp ― đổi prompt, tạo lại, đọc kết quả. Văn bản giờ là một phần của ảnh, không phải lớp bạn thêm vào sau.

Lập kế hoạch bố cục trước khi vẽ

GPT Image 2 đi kèm bước lập luận thuần. Trước khi pixel nào được tạo, mô hình tách prompt thành một kế hoạch có cấu trúc: cái gì đặt ở đâu, các yếu tố nào ở tiền cảnh, các panel liên hệ với nhau ra sao, không gian âm đặt ở đâu. Chỉ sau khi kế hoạch đó được chốt, mô hình mới bắt đầu vẽ pixel vào. Lập luận không hiển thị với bạn nhưng đảm nhận phần lớn công việc cấu trúc mà các mô hình cũ cố gắng giả mạo ở mức pixel.

Lượt phụ đó là lý do các bố cục dày đặc cuối cùng cũng giữ vững. Truyện tranh nhiều panel giữ bóng thoại bám vào đúng nhân vật. Infographic đặt nhãn lên đúng cột và tiêu đề ở đúng cấp bậc. Mockup giao diện nhóm các điều khiển thành các mẫu nhận biết được thay vì rải đều nút và nhãn khắp canvas. Đầu ra đọc ra như thứ một nhà thiết kế đã suy nghĩ kỹ, không phải trung bình mà mô hình ghép lại.

Nó cũng thay đổi cách viết prompt. Với các mô hình cũ, prompt phức tạp tạo ra ảnh thỏa hiệp, nên cách làm là giữ prompt hẹp và xếp nhiều lần tạo để lắp ghép độ phức tạp. Với GPT Image 2, mô hình có thể hấp thụ một brief dài hơn mà vẫn tạo ra bố cục mạch lạc, nên bạn có thể mô tả toàn bộ bố cục trong một prompt và tin tưởng nó lập kế hoạch các phần.

Đa ngôn ngữ từ thiết kế

Chất lượng dựng chữ vẫn ổn định trên các chữ CJK (Trung giản thể và phồn thể, Nhật, Hàn) bên cạnh các ngôn ngữ bảng chữ Latin. Không có mô hình khác để chuyển qua, không có cờ ngôn ngữ phải bật. Hãy viết prompt bằng thứ tiếng mà bạn muốn xuất hiện trong ảnh — mô hình sẽ coi hệ chữ đó như công dân hạng nhất.

Các mô hình hình ảnh trước đây thực chất ra đời với mặc định ngầm rằng chữ trong ảnh sẽ là tiếng Anh. Bất cứ thứ gì khác đều xuống cấp thành những nét mơ hồ trông giống chữ. Các đội ở thị trường CJK phản ứng bằng cách tránh hẳn việc sinh chữ trong ảnh, quay về luồng chồng lớp chữ hoặc trả tiền cho các bản fine-tune riêng theo khu vực. Ở đây không cần đến những việc đó.

Nếu bạn sản xuất nội dung bản địa hóa cho thị trường Đông Á — biển hiệu cửa hàng, hình ảnh bao bì, bài đăng mạng xã hội, thẻ công thức, thực đơn nhà hàng — đây chính là khác biệt thực tế giữa việc dùng đầu ra được sinh ra trực tiếp và việc dựng lại lớp chữ trong Photoshop hay Figma. Trên một dây chuyền xuất ra hàng chục biến thể bản địa hóa mỗi tuần, khoảng cách về thời gian tích lũy rất nhanh.

Nhân vật nhất quán qua các lần chạy riêng biệt

Chạy lại cùng một prompt và nhân vật quay lại ở dạng dễ nhận ra qua từng lần tạo — cùng khuôn mặt, cùng mái tóc, cùng bảng màu, cùng chi tiết phục trang. Ở các prompt khác nhau, mô hình không tự động kéo nhân vật theo: hãy chép đoạn mô tả nhân vật vào mỗi prompt cảnh như một casting brief, mô hình sẽ bám chặt vào đoạn đó. Không cần LoRA tuỳ chỉnh, không cần fine-tune, không cần ảnh mẫu.

Đối với storyboard, linh vật thương hiệu, chuỗi hướng dẫn, minh họa sách thiếu nhi, chuỗi truyện tranh xã hội và mọi công việc tự sự nơi nhân vật phải xuất hiện hơn một lần, điều này loại bỏ chuyến đi-về của việc đào tạo mô hình tùy chỉnh hoặc LoRA chỉ để giữ một khuôn mặt ổn định. Bạn viết một mô tả nhân vật cẩn thận một lần, sau đó tái sử dụng đoạn đó làm neo nhân vật trong mỗi prompt cảnh và để mô hình làm phần việc nhất quán thay bạn.

Có những giới hạn đáng biết. Tính nhất quán mạnh nhất khi mô tả nhân vật chi tiết và cụ thể: màu và độ dài tóc cụ thể, kính, quần áo nhận biết được, phụ kiện đặc trưng. Yếu nhất khi nhân vật được mô tả mơ hồ, khi cảnh thay đổi mạnh ánh sáng hoặc phong cách render, hoặc khi các dấu hiệu nhân vật bị chôn ở cuối prompt. Hãy đối xử với mô tả như một brief casting chứ không phải gợi ý mềm.

Bố cục dày đặc thật sự đứng vững

Sự kết hợp giữa lập luận thuần và render văn bản cải thiện có nghĩa GPT Image 2 xử lý các bố cục mà các hệ thống cũ lặng lẽ suy thoái: infographic dựa trên dữ liệu với nhiều giá trị có nhãn, mockup giao diện di động với thanh công cụ, tab và danh sách hộp thư, áp phích tiếp thị nhiều yếu tố có cấp bậc, mockup bao bì với nhiều SKU trong cùng khung. Đây chính là những bố cục khiến việc tạo bằng AI cảm thấy rõ ràng là hỗ trợ thay vì có thể dùng được.

Ở chỗ DALL·E 3 hoặc gpt-image-1 nén độ phức tạp thành một ấn tượng mơ hồ ― «ảnh kiểu infographic với các dấu hình con số» ― GPT Image 2 đối xử với mật độ như đặc tả và cố gắng tôn trọng nó. Cột nhận nhãn. Tab nhận tên. Biểu tượng thanh công cụ nhận hình dạng phân biệt được. Kết quả là thứ nhà thiết kế có thể phản ứng và tinh chỉnh chứ không phải thứ phải vứt đi và bắt đầu lại từ đầu với bố cục thủ công.

Lưu ý trung thực là các bố cục rất dày đặc ― một trang đôi tạp chí đầy đủ, dashboard phức tạp với hai mươi widget khác nhau, các cảnh đông đúc với hàng chục đạo cụ có nhãn ― vẫn được lợi từ việc chia brief thành các lượt nhỏ hơn. Tạo biểu đồ, rồi bối cảnh xung quanh, rồi tổng hợp các lớp trong công cụ cho phép kiểm soát ở mức pixel. Ngưỡng mà composit thủ công thắng đã dịch lên đáng kể, nhưng vẫn tồn tại ở đầu cao của độ phức tạp.

Dùng thương mại, kèm những lưu ý quen thuộc

Hình ảnh bạn tạo bằng GPT Image 2 là của bạn để dùng trong dự án cá nhân và thương mại, tuân theo chính sách nội dung của OpenAI và luật áp dụng. Không có cấp giấy phép riêng nào bạn cần nâng cấp, không có mô hình bản quyền nào để đọc, không có phí sử dụng nào trên chi phí tạo. Đầu ra là của bạn từ thời điểm nó đến tài khoản bạn, và aigazou không yêu sách quyền hạ nguồn đối với những gì bạn tạo.

Phạm vi thực tế: tài sản tiếp thị, minh họa blog, mockup sản phẩm, ý tưởng bao bì, nội dung mạng xã hội, tác phẩm trong ứng dụng, tài liệu khóa học, tài liệu nội bộ, hình thu nhỏ video, slide thuyết trình. Ở chỗ bạn lẽ ra thuê họa sĩ minh họa hoặc trả tiền stock, bạn có thể dùng ảnh đã tạo thay vào đó, với cùng mức độ thẩm định bạn áp dụng cho bất kỳ tài sản thị giác bên thứ ba nào.

Những lưu ý quen thuộc vẫn áp dụng — không dùng hình dáng người thật khi chưa được đồng ý, không xâm phạm nhãn hiệu hay nhân vật có bản quyền, không tạo ảnh đánh lừa về người của công chúng. Coi chính sách nội dung của OpenAI như bản hợp đồng và bạn đang làm việc trong một giấy phép sạch cho sử dụng thương mại hằng ngày.

Chỉnh sửa cấp pixel không cần render lại

Các mô hình trước coi mọi lần chỉnh sửa là một lần tạo lại toàn bộ. Đổi một chữ trên poster thì cả ảnh bị xóc lại — nền trôi đi, màu lệch đi, những chi tiết bạn vừa ưng biến mất. Việc lặp lại giống như cá cược.

GPT Image 2 hỗ trợ chỉnh sửa cục bộ chỉ chạm đến vùng bạn chỉ ra: thay tiêu đề, đổi màu chiếc áo khoác, sửa một nhãn cột đặt sai, vẽ lại một bàn tay. Phần còn lại của ảnh vẫn y hệt từng pixel, nên việc lặp trở thành tích luỹ — khoá lại một bố cục bạn thích rồi chỉ sửa mỗi chi tiết chệch, khỏi cần đặt cược toàn bộ những thứ khác một lần nữa.

Trong thực tế điều này thay chỗ cho hành trình vòng đi vòng lại sang Photoshop cho những chỉnh sửa nhỏ. Kết hợp với bước suy luận, việc tạo ảnh xích lại gần quy trình phác-rồi-sửa: tạo một bố cục bạn hài lòng, rồi sửa chi tiết ngay tại chỗ cho khớp brief, thay vì xóc lại cả khung trong mỗi lượt.

Cách dùng GPT Image 2 trên aigazou

GPT Image 2 sống bên trong luồng tạo chuẩn ở trang chủ. Không có trình chỉnh sửa riêng, không có danh sách chờ, không có cài đặt thêm ― ba bước từ prompt rỗng đến ảnh hoàn thành.

  1. Mở trang chủ với GPT Image 2 đã được chọn sẵn

    Dùng liên kết bên dưới và bộ chọn mô hình ở trang chủ đã được đặt sẵn về GPT Image 2. Bạn cũng có thể chọn nó thủ công từ menu thả mô hình nếu bạn đến từ điểm vào khác.

    Mở trang chủ
  2. Viết prompt rõ ràng và mang tính khẳng định

    Ngắn và cụ thể vượt trội dài và trang trí. Đặt tên chủ thể, phong cách và bất kỳ văn bản nào phải xuất hiện trong ảnh (trong dấu nháy). Với prompt nhiều văn bản, viết văn bản trên ảnh chính xác như bạn muốn nó được render, bao gồm dấu câu và viết hoa. Mô hình đối xử với chuỗi trong dấu nháy như văn bản nguyên bản.

  3. Tạo và tinh chỉnh

    Nếu toàn bộ bố cục sai thì hãy viết lại prompt rồi tạo lại — bước suy luận hoạt động tốt nhất khi có brief rõ ràng. Với các sửa nhỏ (một từ sai chính tả, một màu sai, một yếu tố đơn lẻ), hãy dùng chỉnh sửa cấp pixel trên kết quả thay vì xóc lại cả ảnh.

Đầu ra mẫu

Sáu prompt được chạy qua GPT Image 2 không chỉnh sửa. Văn bản dưới mỗi ảnh là prompt chính xác đã tạo ra nó.

Áp phích phim mẫu do GPT Image 2 tạo với tiêu đề 'Midnight in Tokyo'

Áp phích phim, typography đã sắp đặt

A vertical movie poster for a Tokyo neo-noir film. Title 'MIDNIGHT IN TOKYO' set large in modern serif at the top. Subtitle 'A film by Yuki Tanaka' beneath. Bottom strip reads 'IN THEATERS · APRIL 2026'. Cool blue night palette.

Tiêu đề chính, phụ đề và dòng metadata đều render đọc được ngay lần đầu ― benchmark render văn bản ở dạng trực tiếp nhất.

Menu quán cà phê mẫu do GPT Image 2 tạo, tên món và giá bằng tiếng Nhật và tiếng Hàn đều dễ đọc

Menu quán cà phê song ngữ tiếng Nhật và tiếng Hàn

Menu quán cà phê viết bằng tiếng Nhật và tiếng Hàn. Tiêu đề ghi 'メニュー / 메뉴'. Hai dòng menu: '抹茶ラテ · ¥580' và '아메리카노 · ₩4,500'. Nền màu kem, viền vẽ tay.

Hai hệ chữ Đông Á trong cùng một bố cục, cả hai đều được dựng rõ ràng mà không biến thành các nét trang trí.

Infographic mẫu do GPT Image 2 tạo cho thấy các cột tăng trưởng theo quý có nhãn

Infographic tăng trưởng theo quý

A clean infographic titled '2026 Q1 Growth'. Three horizontal bars labeled 'JAN +12%', 'FEB +24%', 'MAR +38%'. Off-white background, single blue accent. Helvetica-style sans-serif.

Lập luận thuần giữ mỗi nhãn gắn vào đúng cột ― chế độ thất bại đã làm hỏng infographic do AI tạo theo cách truyền thống.

Truyện tranh hai khung mẫu do GPT Image 2 tạo với nhân vật và đối thoại nhất quán

Cảnh văn phòng hai khung

A two-panel comic strip. Panel 1: a tired office worker at a desk, speech bubble reading 'Did you finish the report?'. Panel 2: same character, slightly slumped, bubble reading '...Almost.' Black-and-white ink style.

Cùng một nhân vật giữ vững qua cả hai khung, và mỗi bóng thoại vẫn gắn vào đúng người nói.

Mockup giao diện di động mẫu do GPT Image 2 tạo với văn bản giao diện thực tế

Mockup ứng dụng email di động

A realistic mobile UI mockup of a mail app inbox. Status bar reads '9:41' and '100%'. Title 'Inbox'. Two list rows: 'Sarah Chen · 2m', 'Design Review · 14m'. Bottom tab bar: 'Mail · Calendar · Settings'.

Văn bản giao diện thực tế, không phải chữ vô nghĩa trang trí ― khác biệt giữa mockup AI và tham khảo thiết kế dùng được.

Ba ảnh mẫu do GPT Image 2 tạo qua các lần chạy riêng biệt, mỗi cái giữ cùng một nhân vật

Cùng nhân vật, ba cảnh

Three separate runs of the same character: a young illustrator with short black hair, round glasses, and a forest-green sweater. Run 1 in a quiet bookshop. Run 2 on a city rooftop at dusk. Run 3 in a sunny park with a sketchbook.

Ba lượt chạy của ba prompt khác nhau cùng dùng chung một đoạn mô tả nhân vật. Mô hình coi đoạn mô tả đó như một casting brief, nên nhân vật vẫn dễ nhận ra dù bối cảnh thay đổi.

Ảnh render thật đang được thay thế dần — hiện tại các bảng bên trên chỉ minh hoạ ý đồ của từng prompt, không phải pixel cuối cùng. Kết quả thật của bạn sẽ thay đổi tuỳ theo mức độ chi tiết của prompt và khả năng hiện tại của mô hình.

GPT Image 2 so sánh thế nào

GPT Image 2 đứng ở đâu giữa Midjourney v7, phiên bản tiền nhiệm của chính nó và DALL·E 3.

Khả năngGPT Image 2Midjourney v7gpt-image-1DALL·E 3
Render văn bản bên trong ảnhKhoảng 99% chính xác trên các hệ chữ được hỗ trợTốt hơn v6 nhưng vẫn không đáng tin cậy với văn bản dài và bố cục có cấu trúcThường đọc được với chuỗi La-tinh ngắn, kém tin cậy với văn bản dài hơnThường xuyên hỏng, đặc biệt với văn bản dài hoặc hệ chữ phi La-tinh
Hỗ trợ chữ không Latin (CJK)Ổn định với tiếng Trung, tiếng Nhật và tiếng HànHạn chế; chữ CJK thường suy biến thành hình trang tríHạn chế; glyph phi La-tinh thường xuyên vỡHạn chế; được đối xử như hình dạng trang trí nhiều hơn là văn bản
Lập luận bố cục trước khi vẽThuần ― lập kế hoạch bố cục trước pixel đầu tiênKhông có bước lập kế hoạch rõ ràng; thiên kiến phong cách mạnhKhông có bước lập kế hoạch rõ ràngKhông có bước lập kế hoạch rõ ràng
Tính nhất quán nhân vật qua các lần chạy riêng biệtMạnh qua các lần chạy của cùng promptCharacter Reference giữ được sự tương đồng giữa các lần chạy, nhưng cần ảnh mẫuYếu ― mỗi lần chạy diễn giải chủ thể độc lậpYếu ― mỗi lần chạy diễn giải chủ thể độc lập
Phù hợp nhất choÁp phích, thực đơn, infographic, mockup giao diện và truyện tranh nơi văn bản trên ảnh và cấu trúc quan trọngMinh hoạ có phong cách, đậm tâm trạng và chỉ đạo nghệ thuật, nơi chữ trên ảnh là thứ yếuMinh họa tổng quát nơi độ chính xác văn bản không phải ưu tiênMinh họa nghệ thuật tổng quát; linh hoạt phong cách hơn độ chính xác văn bản

Nơi nó phát huy giá trị

Sáu nơi mà sức mạnh đặc thù của GPT Image 2 ― văn bản, lập kế hoạch, đa ngôn ngữ ― thay đổi điều có thể từ một prompt.

Áp phích tiếp thị với typography đã sắp đặt

Ra mắt sản phẩm, tờ rơi sự kiện, quảng cáo tuyển dụng. Tiêu đề chính, phụ đề và dòng metadata đều ra đọc được ngay lần đầu, vì vậy đội thiết kế có thể lặp trên prompt theo cách copywriter lặp trên bản nháp ― không cần bước composit.

A recruitment poster for a design studio. Headline 'WE'RE HIRING' in heavy black sans-serif at the top. Three role names below in lighter weight: 'Senior Designer', 'Product Manager', 'Brand Strategist'. Footer strip: 'APPLY BY MAY 15 · [email protected]'. Paper-grain off-white background.
A festival poster for a summer jazz event. Headline 'BLUE NOTE FEST 2026' in heavy condensed sans. Three artist names below in smaller weight. Warm amber and ink palette.

Mockup sản phẩm và bao bì

Túi cà phê, ống mỹ phẩm, biểu tượng ứng dụng trên thiết bị, lon đồ uống. Mô hình có thể giữ tên thương hiệu xuyên nhiều SKU trong cùng cảnh mà không bôi nó thành glyph vô nghĩa ― chế độ thất bại đã làm hỏng bao bì do AI tạo theo cách truyền thống.

Three coffee bags side by side on a marble counter. Each labeled 'AOI', 'KAEDE', 'YUKI'. Minimalist matte packaging in cream, sage, and slate. Studio lighting.
A skincare bottle on a bathroom shelf. Label reads 'ATELIER NO. 4 · Hydrating Serum · 30ml'. Soft natural light from the left.

Nội dung ảnh có văn bản

Đồ họa mạng xã hội, thẻ trích dẫn, typography lời nhạc, áp phích động lực, mẫu meme. Bất cứ nơi nào thông điệp là tác phẩm. Đây là trường hợp dùng kinh điển mà render văn bản mới mở khóa, và mô hình yếu hơn không thể giả mạo.

A square Instagram quote card. Centered text in elegant script: 'The best time to plant a tree was twenty years ago. The second best time is now.' Soft sage background, off-white border.
A vertical lyric card. Text reads '夜の街は静かに歌う' in vertical Japanese typesetting on the right side. Ink-wash background, restrained palette.

Infographic và hình ảnh dữ liệu

Làm nổi bật số liệu, so sánh trước/sau, biểu đồ thanh đơn giản, sơ đồ quy trình. Bước lập luận giữ nhãn gắn vào đúng cột và tiêu đề ở đúng cấp bậc, loại bỏ dấu hiệu nhận biết muôn thuở của infographic AI ― số đặt sai chỗ.

A single-page onboarding flow titled 'From sign-up to first image'. Four labeled boxes connected by arrows: '1. Sign in', '2. Pick a model', '3. Write a prompt', '4. Generate'. Muted grey connectors, one warm accent on the final box.
A two-column comparison graphic titled 'Before vs After'. Left column header 'Before', right column header 'After'. Three bullet rows of short labels under each.

Khung truyện tranh và storyboard

Cảnh hai và ba khung, khung storyboard, chuỗi phong cách manga. Lập luận thuần giữ cùng nhân vật qua các khung và bóng thoại gắn vào đúng người nói ― hai chế độ thất bại từng làm truyện tranh AI bất khả thi trước đây.

A two-panel comic strip. Panel 1: a tired office worker at a desk, speech bubble reading 'Did you finish the report?'. Panel 2: same character, slightly slumped, bubble reading '...Almost.' Black-and-white ink style.
A three-panel storyboard for a coffee commercial. Panel 1: hand pouring espresso into a cup. Panel 2: cup steaming on a wooden table. Panel 3: silhouette of a person taking a sip. Cinematic lighting, no dialogue.

Bố cục đa ngôn ngữ

Biển hiệu song ngữ, bao bì song ngữ, mockup giao diện đa ngôn ngữ, tài sản tiếp thị đã dịch. Mô hình giữ hai hệ chữ trong cùng bố cục mà không cái nào suy thoái thành hình dạng trang trí ― đó là lý do phần này xứng có một hạng riêng.

A bilingual coffee shop receipt in Japanese and English. Header 'TOKYO ROASTERS'. Line items: 'ドリップコーヒー / Drip Coffee · ¥550', 'クロワッサン / Croissant · ¥380'. Footer: 'ありがとうございました · Thank you'. Cream paper with a faint grid.
A bilingual storefront sign. Left side reads 'TOKYO BAGEL' in English. Right side reads '東京ベーグル' in Japanese, same weight and visual size. Wooden plank background.

Câu hỏi thường gặp

GPT Image 2 là gì?

GPT Image 2 là mô hình sinh ảnh mới nhất của OpenAI. Nó cải thiện thế hệ trước ở ba điểm: dựng chữ dễ đọc ngay trong ảnh, chỉnh sửa ảnh có sẵn ở mức pixel, và tính hiện thực dựa trên tri thức thế giới trải khắp vật lý, chất liệu và giải phẫu. Tại đây chúng tôi cung cấp nó dưới dạng trình sinh ảnh trực tuyến chạy bằng Credits.

GPT Image 2 có miễn phí không?

Mỗi lượt tạo tốn 8 Credits. Không có gói đăng ký riêng để mở khoá mô hình — bạn có thể nạp bất cứ lúc nào từ tài khoản của mình.

GPT Image 2 khác gì gpt-image-1 hay DALL·E 3?

GPT Image 2 lập kế hoạch bố cục trước khi vẽ, nên các bố cục dày và infographic giữ hình tốt hơn. Chữ trong ảnh — đặc biệt ở các chữ CJK — sắc nét hơn hẳn so với các mô hình trước đó, và nó hỗ trợ chỉnh sửa cấp pixel trên ảnh có sẵn mà không cần render lại toàn bộ khung.

Tôi có thể dùng ảnh GPT Image 2 cho mục đích thương mại không?

Có. Các ảnh bạn tạo là của bạn để dùng trong dự án cá nhân và thương mại, tuân theo chính sách nội dung của OpenAI và luật áp dụng. Chúng tôi không yêu sách quyền với đầu ra của bạn.

GPT Image 2 render tốt những ngôn ngữ nào trong ảnh?

Tiếng Trung (Giản thể và Phồn thể), tiếng Nhật, tiếng Hàn và các ngôn ngữ dùng bảng chữ cái Latin đều dựng chữ rõ ràng. Với mọi ngôn ngữ, các đoạn dài vẫn được lợi hơn từ prompt ngắn, trực diện.

Thử GPT Image 2 hôm nay

Liên kết bên dưới mở trang chủ với GPT Image 2 đã được chọn sẵn, cú bấm tiếp theo là viết prompt đầu tiên của bạn.