OpenAI의 최신 이미지 모델 · aigazou에서 이용 가능

GPT Image 2: 글자가 제대로 찍히고, 편집은 고른 부분에만 가며, 디테일은 확대해도 무너지지 않는다

AI 이미지 모델은 오래도록 세 가지에서 막혀 있었습니다. 포스터의 글자가 뭉개지고, 한 부분만 고치려는데 전체가 다시 그려지고, 손에 손가락이 하나 더 생기는 일. GPT Image 2는 이 세 가지에 정면으로 답합니다 — 라틴 문자와 동아시아 문자 전반에서 약 99%의 텍스트 렌더링 정확도(OpenAI 공식 벤치마크), 선택한 영역만 실제로 바꾸는 진짜 로컬 편집, 그리고 확대해도 물리와 인체 구조가 설득력을 잃지 않는 세계 지식 기반 그라운딩.

GPT Image 2란

GPT Image 2는 OpenAI의 2세대 네이티브 이미지 모델로, 2026년 4월 gpt-image-1의 후속 모델로 공개되었습니다. 추론 단계를 내장한 OpenAI의 첫 이미지 모델이기도 합니다: 픽셀을 만들어 내기 전에 모델은 구도를 설계하고, 각 요소의 위치를 결정하며, 이미지 안 텍스트의 레이아웃을 먼저 풀어냅니다. 결과물은 자연어 프롬프트로부터 만들어지는 한 장의 완성 이미지——별도 에디터나 수작업 레이아웃이 필요 없습니다. aigazou에서는 GPT Image 2가 홈페이지의 표준 생성 플로우에서 동작합니다: 모델 드롭다운에서 선택하고, 프롬프트를 쓰고, 이미지를 받으면 됩니다.

GPT Image 2가 어떤 일에 쓰이는지 가장 빠르게 이해하려면, 과거 모델들이 일관되게 실패했던 장면들을 보면 됩니다. 읽히는 태그라인이 들어간 포스터, 가격과 메뉴명이 있는 식당 메뉴, 축 라벨이 있는 인포그래픽, 말풍선이 달린 만화 컷, 실제처럼 보이는 UI 카피가 들어간 모바일 목업——모두 글자가 구도의 일부인 구성입니다. 이전의 디퓨전 모델들은 글자를 뭉개거나, 그럴듯해 보이지만 다시 보면 무너지는 텍스트를 환각처럼 만들어 냈습니다. 해답은 더 높은 해상도가 아니라 추론 단계에 있습니다: 모델은 '텍스트와 레이아웃'을 먼저 계획 문제로, 그 다음 렌더링 문제로 다룹니다. OpenAI는 지원하는 문자 체계——중국어(간체·번체), 일본어, 한국어——전반에서 텍스트 정확도가 약 99%라고 보고합니다. 이전 세대가 장식 모양 취급했던 동아시아 문자들입니다. 텍스트에 더해 GPT Image 2는 기존 이미지를 세밀하게 손보는 픽셀 단위 편집, 그리고 물리·재질·인체 구조의 설득력을 지키는 세계 지식 기반 사실감도 함께 제공합니다.

GPT Image 2는 같은 프롬프트에서 나온 별도의 생성들 사이에서도 캐릭터와 스타일을 꾸준히 유지합니다——같은 얼굴형, 같은 의상, 같은 색 팔레트. 다만 프롬프트가 달라지면 모델이 알아서 인물을 이어 주지는 않습니다: 실무 패턴은 캐릭터 설명을 한 번 문단으로 써 두고, 그 문단을 모든 장면 프롬프트에 캐스팅 브리프로 붙여 넣는 것입니다. 이 「문단을 앵커로 삼는」 워크플로 덕분에 이 모델은 한 장으로 끝나지 않는 작업——스토리보드, 연속 컷 만화, 브랜드 톤이 일관된 마케팅 자산, 캐릭터 시트——에도 커스텀 LoRA 훈련 없이 충분히 쓸 만합니다. GPT Image 2가 모든 이미지에 최적은 아닙니다——부드러운 수채 애니메 풍, 매끄러운 셀피, 스티커를 붙인 홀리데이 카드 같은 작업은 aigazou의 전용 도구가 더 빠릅니다. 결과물은 OpenAI의 콘텐츠 정책을 따르는 한 개인과 상업 프로젝트에 모두 사용할 수 있습니다.

GPT Image 2가 바꾸는 것

예전 이미지 모델이 틀렸던 일곱 가지, 그리고 이번 세대가 이를 어떻게 해결하는지.

99% 텍스트 렌더링 정확도

이전 이미지 모델들은 포스터는 그릴 수 있었지만 그 위의 헤드라인은 그릴 수 없었습니다. 자형은 왜곡되고, 커닝은 무너지고, 줄은 흐트러졌으며, 라틴 알파벳 외의 글자는 장식적인 노이즈가 되었습니다. 표준적인 우회 방법은 한 도구에서 배경을 생성하고, 깨끗한 영역을 마스킹한 다음, 손으로 문자를 다시 끼워넣는 것이었습니다. 동작은 했지만, 그것은 생성이 아니라 생성의 외피를 쓴 합성이었습니다.

GPT Image 2는 그 간극을 메웁니다. OpenAI 자체 벤치마크에 따르면, 인쇄 가능한 텍스트——문단, 가격, 캡션, 라벨——전반에서 텍스트 렌더링 정확도는 약 99%입니다. 글자는 비율을 유지하고, 단어는 일관된 베이스라인 위에 놓이며, 짧은 카피는 「글자처럼 보이는 근사 형태」가 아니라 의도된 타이포그래피로 읽힙니다.

실용적인 의미는 아트워크와 단어가 같은 패스에서 나온다는 것입니다. 영화 포스터, 카페 메뉴, 앱 화면, 인포그래픽을 카피라이터가 초고를 다듬듯 반복할 수 있습니다 ― prompt를 바꾸고, 다시 생성하고, 결과를 읽습니다. 텍스트는 이제 이미지의 일부이며, 나중에 덧붙이는 레이어가 아닙니다.

그리기 전에 레이아웃을 계획

GPT Image 2에는 네이티브 추론 단계가 내장되어 있습니다. 픽셀이 생성되기 전에 모델은 prompt를 구조화된 계획으로 분해합니다. 무엇을 어디에 둘지, 어떤 요소가 전경인지, 패널들이 어떻게 관련되는지, 네거티브 스페이스를 어디에 둘지. 그 계획이 확정되어야만 모델이 픽셀을 그리기 시작합니다. 추론은 당신에게 보이지 않지만, 이전의 모델들이 픽셀 수준에서 흉내내려 했던 구조적 작업의 대부분을 수행합니다.

이 추가 패스가 있기 때문에 밀도 높은 구도가 마침내 깨지지 않고 유지됩니다. 다중 패널 만화는 말풍선을 올바른 화자에게 계속 연결합니다. 인포그래픽은 라벨을 올바른 막대에 두고 제목을 올바른 계층에 둡니다. UI 목업은 컨트롤을 인식 가능한 패턴으로 그룹화하며, 캔버스 전체에 버튼과 라벨을 균일하게 흩뿌리지 않습니다. 출력은 디자이너가 깊이 생각한 것처럼 읽히고, 모델이 평균화한 것처럼 읽히지 않습니다.

이는 prompt를 쓰는 방식도 바꿉니다. 이전 모델들에서 복잡한 prompt는 타협된 이미지를 만들었기 때문에, 작업 방식은 prompt를 좁게 유지하고 생성을 쌓아 복잡성을 조립하는 것이었습니다. GPT Image 2에서는 모델이 더 긴 브리프를 소화하고도 일관된 레이아웃을 만들 수 있으므로, 한 prompt로 전체 구도를 기술하고 부분의 계획은 모델에 맡길 수 있습니다.

설계부터 다국어

텍스트 렌더링 품질은 CJK(중국어 간체·번체, 일본어, 한국어) 문자와 라틴 알파벳 언어 전반에서 안정적으로 유지됩니다. 바꿔 탈 별도 모델도, 설정할 언어 플래그도 없습니다. 이미지 안에 나타내고 싶은 언어로 프롬프트를 그대로 쓰면, 모델은 그 문자 체계를 1급 시민으로 다룹니다.

이전 이미지 모델들은 이미지 속 글자가 사실상 영어라는 숨은 전제로 출시되었습니다. 그 외 언어는 대충 글자 모양을 흉내 낸 흔적으로 무너졌죠. CJK 시장의 팀들은 이미지 내 텍스트 생성을 아예 포기하거나, 오버레이 합성 워크플로로 되돌아가거나, 지역 특화 파인튜닝에 비용을 들이는 방식으로 대응해 왔습니다. 여기서는 그 어떤 것도 필요하지 않습니다.

동아시아 시장을 위한 현지화 콘텐츠——매장 사이니지, 패키지 비주얼, 소셜 포스트, 레시피 카드, 레스토랑 메뉴——를 납품하는 입장에서, 이것은 '생성 결과를 바로 쓰는 것'과 'Photoshop이나 Figma에서 텍스트 레이어를 다시 만드는 것' 사이의 실무적 차이입니다. 주당 수십 개의 현지화 버전을 돌리는 파이프라인에서는 그 시간 차이가 빠르게 누적됩니다.

별도의 생성에 걸친 캐릭터 일관성

같은 프롬프트를 다시 돌리면 캐릭터는 반복해서 알아볼 수 있는 모습으로 돌아옵니다 ——같은 얼굴형, 같은 머리, 같은 팔레트, 같은 의상 포인트. 다만 프롬프트가 달라지면 모델이 알아서 인물을 이어 주지는 않습니다: 캐릭터 설명 문단을 모든 장면 프롬프트에 캐스팅 브리프로 복사해 넣으세요. 모델은 그 문단을 고수합니다. 커스텀 LoRA도, 파인튜닝도, 시드 이미지도 필요 없습니다.

스토리보드, 브랜드 마스코트, 설명 시퀀스, 동화책 일러스트, 소셜 만화 시리즈 등 캐릭터가 한 번 이상 등장해야 하는 모든 내러티브 작업에서, 이는 얼굴을 안정시키기 위해 커스텀 모델이나 LoRA를 훈련하는 왕복 작업을 제거합니다. 신중한 캐릭터 기술을 한 번 작성한 다음, 그 단락을 모든 장면 prompt의 캐릭터 앵커로 재사용하고 일관성 작업은 모델에 맡기세요.

알아둘 만한 한계도 있습니다. 일관성은 캐릭터 기술이 상세하고 구체적일 때 가장 강합니다. 구체적인 머리색과 길이, 안경, 알아볼 수 있는 의상, 특징적인 액세서리. 캐릭터가 모호하게 기술되거나, 장면이 조명이나 렌더링 스타일을 크게 바꾸거나, prompt 끝에 캐릭터 단서가 묻혀 있을 때 가장 약합니다. 기술을 부드러운 제안이 아니라 캐스팅 브리프로 다루세요.

밀도 높은 구성도 제대로 버텨냅니다

네이티브 추론과 개선된 텍스트 렌더링의 조합은 GPT Image 2가 이전 시스템들이 조용히 열화하던 구도를 다룰 수 있다는 것을 의미합니다: 여러 라벨 값을 가진 데이터 기반 인포그래픽, 툴바·탭·받은편지함 목록을 포함한 모바일 UI 목업, 계층을 가진 다요소 마케팅 포스터, 같은 프레임 내에 여러 SKU를 포함한 패키지 목업 등입니다. 이것들은 AI 생성을 「사용 가능」보다는 「명백히 보조적」이라고 느끼게 하던 구도들이었습니다.

DALL·E 3나 gpt-image-1이 복잡성을 모호한 인상 ― 「숫자처럼 보이는 자국이 있는 인포그래픽 풍의 이미지」 ― 으로 압축하던 곳에서, GPT Image 2는 밀도를 사양으로 다루고 그것을 존중하려고 합니다. 막대에 라벨이 붙습니다. 탭에 이름이 붙습니다. 툴바 아이콘에 구별 가능한 모양이 생깁니다. 결과는 디자이너가 반응하고 다듬을 수 있는 것이지, 버리고 수동 레이아웃을 처음부터 다시 시작해야 하는 것이 아닙니다.

솔직한 단서는 매우 밀도 높은 레이아웃 ― 한 페이지 잡지 펼침면, 20개의 별개 위젯을 가진 복잡한 대시보드, 십수 개의 라벨 붙은 소품을 가진 어수선한 장면 ― 은 여전히 브리프를 더 작은 패스로 나누는 것이 효과적이라는 것입니다. 차트를 생성하고, 주변 컨텍스트를 생성하고, 픽셀 수준의 제어를 제공하는 도구에서 레이어를 합성하세요. 수동 합성이 이기는 임계값은 상당히 위로 이동했지만, 복잡성의 상한에서는 여전히 존재합니다.

상업적 사용 가능, 일반적인 주의사항은 그대로

GPT Image 2로 생성한 이미지는 OpenAI의 콘텐츠 정책과 적용 법률의 범위 내에서 개인 및 상업 프로젝트에 자유롭게 사용할 수 있습니다. 업그레이드해야 할 별도의 라이선스 계층, 읽어야 할 로열티 모델, 생성 비용 위에 추가되는 사용료가 없습니다. 출력은 당신의 계정에 도착하는 순간부터 당신의 것이며, aigazou는 당신의 제작물에 대한 다운스트림 권리를 주장하지 않습니다.

실용적 범위: 마케팅 자산, 블로그 일러스트, 제품 목업, 패키지 콘셉트, 소셜 미디어 콘텐츠, 앱 내 아트워크, 코스 자료, 내부 문서, 비디오 썸네일, 프레젠테이션 슬라이드. 일러스트레이터를 고용하거나 스톡을 구입했을 곳에 생성된 이미지를 대신 사용할 수 있으며, 제3자 시각 자산에 적용할 동일한 종류의 실사 단계를 적용하면 됩니다.

일반적인 주의사항은 그대로 적용됩니다 ——동의 없는 실존 인물 초상화 금지, 상표나 저작권이 있는 캐릭터 침해 금지, 공인을 속이는 이미지 금지 등. OpenAI의 콘텐츠 정책을 계약으로 간주하면, 일상적인 상업적 사용에 깨끗한 라이선스 안에서 작업하는 셈입니다.

전체 재렌더링 없이 픽셀 단위 편집

이전 모델들은 모든 수정을 전체 재생성으로 처리했습니다. 포스터에서 단어 하나만 바꿔도 이미지 전체가 다시 굴려져——배경이 흔들리고, 색이 어긋나고, 방금 마음에 들었던 디테일이 사라집니다. 반복 작업은 곧 도박이었습니다.

GPT Image 2는 지정한 영역만 건드리는 국소 편집을 지원합니다: 헤드라인 교체, 재킷 색 변경, 잘못 붙은 막대 라벨 수정, 손 다시 그리기. 그 외 영역은 픽셀 단위로 동일하게 유지되므로, 반복은 「쌓아 올리기」가 됩니다——마음에 드는 구성을 잠그고, 어긋난 한 가지 디테일만 고치면 됩니다. 다른 것까지 새로 굴릴 필요가 없습니다.

실제로 이는 작은 수정을 위한 Photoshop 왕복을 대체합니다. 추론 단계와 결합하면, 이미지 생성은 「초안 후 수정」 워크플로에 가까워집니다: 마음에 드는 레이아웃을 먼저 만들어 두고, 세부 사항이 브리프에 맞을 때까지 그 자리에서 수정하는 식입니다. 매 패스마다 프레임 전체를 다시 굴리지 않아도 됩니다.

aigazou에서 GPT Image 2 사용하기

GPT Image 2는 홈페이지의 표준 생성 흐름 안에 있습니다. 별도의 에디터, 대기자 명단, 추가 설정이 없습니다 ― 빈 prompt에서 완성된 이미지까지 3단계입니다.

  1. GPT Image 2가 미리 선택된 홈페이지 열기

    아래 링크를 사용하면 홈페이지의 모델 피커가 이미 GPT Image 2로 설정되어 있습니다. 다른 진입점을 통해 도착했다면 모델 드롭다운에서 수동으로 선택할 수도 있습니다.

    홈페이지 열기
  2. 명확하고 단정적인 prompt 작성하기

    짧고 구체적인 것이 길고 장식적인 것보다 잘 작동합니다. 피사체, 스타일, 그리고 이미지 안에 나타나기를 원하는 텍스트(따옴표로 감싸기)를 명시하세요. 텍스트가 많은 prompt에서는 이미지 내 텍스트를 구두점과 대소문자를 포함하여 렌더링하기를 원하는 그대로 정확히 적어주세요. 모델은 따옴표 안의 문자열을 문자 그대로의 카피로 다룹니다.

  3. 생성하고 다듬기

    전체 레이아웃이 잘못됐다면 프롬프트를 다시 써서 생성하세요——추론 단계는 명확한 브리프가 있을 때 가장 잘 작동합니다. 작은 수정(맞춤법 오류 하나, 색 하나, 요소 하나)이라면 결과 이미지에 픽셀 단위 편집을 적용하세요. 이미지 전체를 다시 굴릴 필요가 없습니다.

샘플 출력

GPT Image 2로 실행한 6개의 prompt, 보정 없음. 각 이미지 아래의 텍스트가 그것을 만들어낸 정확한 prompt입니다.

GPT Image 2가 생성한, 제목이 'Midnight in Tokyo'인 샘플 영화 포스터

영화 포스터, 짜인 타이포그래피

A vertical movie poster for a Tokyo neo-noir film. Title 'MIDNIGHT IN TOKYO' set large in modern serif at the top. Subtitle 'A film by Yuki Tanaka' beneath. Bottom strip reads 'IN THEATERS · APRIL 2026'. Cool blue night palette.

헤드라인, 서브헤드, 메타데이터 라인 모두 첫 번째에 읽기 쉽게 나옵니다 ― 텍스트 렌더링 벤치마크의 가장 직접적인 형태입니다.

GPT Image 2로 생성한 카페 메뉴 예시. 일본어와 한국어 메뉴명과 가격이 또렷하게 읽힘

일본어와 한국어 이중 언어 카페 메뉴

일본어와 한국어로 표기된 카페 메뉴. 헤더는 'メニュー / 메뉴'. 메뉴 2줄: '抹茶ラテ · ¥580' 및 '아메리카노 · ₩4,500'. 크림색 배경, 손그림 스타일 테두리.

같은 구도 안에 동아시아의 두 문자가 나란히 있으며, 어느 쪽도 장식 형태로 무너지지 않고 깔끔하게 렌더링됩니다.

GPT Image 2가 생성한, 라벨이 붙은 분기 성장 막대를 보여주는 샘플 인포그래픽

분기 성장 인포그래픽

A clean infographic titled '2026 Q1 Growth'. Three horizontal bars labeled 'JAN +12%', 'FEB +24%', 'MAR +38%'. Off-white background, single blue accent. Helvetica-style sans-serif.

네이티브 추론이 각 라벨을 올바른 막대에 유지합니다 ― 이는 전통적으로 AI 생성 인포그래픽을 망쳤던 실패 모드입니다.

GPT Image 2가 생성한, 캐릭터와 대사가 일관된 샘플 두 컷 만화

두 컷 사무실 장면

A two-panel comic strip. Panel 1: a tired office worker at a desk, speech bubble reading 'Did you finish the report?'. Panel 2: same character, slightly slumped, bubble reading '...Almost.' Black-and-white ink style.

같은 캐릭터가 두 컷에 걸쳐 유지되며, 각 말풍선이 올바른 화자에게 연결됩니다.

GPT Image 2가 생성한, 현실적인 인터페이스 카피가 들어간 샘플 모바일 UI 목업

모바일 메일 앱 목업

A realistic mobile UI mockup of a mail app inbox. Status bar reads '9:41' and '100%'. Title 'Inbox'. Two list rows: 'Sarah Chen · 2m', 'Design Review · 14m'. Bottom tab bar: 'Mail · Calendar · Settings'.

장식적인 의미 불명 문자가 아닌, 현실적인 인터페이스 카피입니다 ― AI 목업과 사용 가능한 디자인 참조의 차이입니다.

GPT Image 2가 별도의 생성에 걸쳐 같은 캐릭터를 유지한 세 장의 샘플 이미지

같은 캐릭터, 세 장면

Three separate runs of the same character: a young illustrator with short black hair, round glasses, and a forest-green sweater. Run 1 in a quiet bookshop. Run 2 on a city rooftop at dusk. Run 3 in a sunny park with a sketchbook.

같은 캐릭터 설명 문단을 공유하는 서로 다른 세 개의 프롬프트를 각각 1회씩 실행한 결과입니다. 모델은 그 문단을 캐스팅 브리프로 삼기 때문에, 장면이 달라져도 인물은 알아볼 수 있는 상태로 유지됩니다.

실제 렌더링 이미지는 순차적으로 교체 중입니다——지금 위 패널은 각 프롬프트의 의도를 보여주는 모크업이며, 최종 픽셀이 아닙니다. 실제 결과는 프롬프트의 구체성과 모델의 현재 역량에 따라 달라집니다.

GPT Image 2의 위치

GPT Image 2가 Midjourney v7, 자체 전세대 모델, DALL·E 3 사이에서 어디에 위치하는지.

능력GPT Image 2Midjourney v7gpt-image-1DALL·E 3
이미지 내 텍스트 렌더링지원 스크립트에서 약 99% 정확도v6보다 개선됐지만 긴 카피나 구조화된 레이아웃에서는 여전히 불안정짧은 라틴 문자열에서는 자주 읽을 수 있지만 긴 카피에서는 신뢰성이 떨어짐자주 깨짐, 특히 긴 카피와 비라틴 스크립트에서
비라틴 문자 지원 (CJK)중국어·일본어·한국어에서 안정적제한적; CJK 텍스트는 장식적인 형태로 퇴화하기 쉬움제한적, 비라틴 자형이 자주 깨짐제한적, 텍스트로보다 장식 형태로 다뤄지는 경우가 많음
그리기 전의 레이아웃 추론네이티브 ― 첫 픽셀 전에 구도 계획명시적 계획 단계 없음; 강한 스타일 프라이어명시적인 계획 단계 없음명시적인 계획 단계 없음
별도의 생성에 걸친 캐릭터 일관성같은 prompt의 별도의 생성마다 안정Character Reference로 생성 간 유사성을 유지할 수 있지만 시드 이미지가 필요약함 ― 각 생성이 피사체를 독립적으로 해석약함 ― 각 생성이 피사체를 독립적으로 해석
적합한 용도이미지 내 텍스트와 구조가 중요한 포스터, 메뉴, 인포그래픽, UI 목업, 만화스타일화되고 분위기 있는 일러스트·아트 디렉션, 이미지 안의 텍스트는 부차적텍스트 정확도가 우선순위가 아닌 일반 일러스트레이션일반 예술적 일러스트레이션; 텍스트 정확도보다 스타일 유연성

진가를 발휘하는 곳

GPT Image 2의 특정한 강점 ― 텍스트, 계획, 다국어 ― 이 prompt에서 가능한 것을 바꾸는 6가지 장소.

짜인 타이포그래피의 마케팅 포스터

제품 출시, 이벤트 전단, 채용 광고. 헤드라인, 서브헤드, 메타데이터 라인 모두 첫 번째에 읽을 수 있게 출력되므로, 디자인 팀은 카피라이터가 초고를 다듬듯 prompt를 반복할 수 있습니다 ― 합성 단계가 필요 없습니다.

A recruitment poster for a design studio. Headline 'WE'RE HIRING' in heavy black sans-serif at the top. Three role names below in lighter weight: 'Senior Designer', 'Product Manager', 'Brand Strategist'. Footer strip: 'APPLY BY MAY 15 · [email protected]'. Paper-grain off-white background.
A festival poster for a summer jazz event. Headline 'BLUE NOTE FEST 2026' in heavy condensed sans. Three artist names below in smaller weight. Warm amber and ink palette.

제품 목업과 패키지

커피 봉지, 화장품 튜브, 디바이스의 앱 아이콘, 음료 캔. 모델은 같은 장면 내의 여러 SKU에 걸쳐 브랜드 이름을 의미 불명 자형으로 무너뜨리지 않고 유지할 수 있습니다 ― 이는 전통적으로 AI 생성 패키지를 망쳤던 실패 모드입니다.

Three coffee bags side by side on a marble counter. Each labeled 'AOI', 'KAEDE', 'YUKI'. Minimalist matte packaging in cream, sage, and slate. Studio lighting.
A skincare bottle on a bathroom shelf. Label reads 'ATELIER NO. 4 · Hydrating Serum · 30ml'. Soft natural light from the left.

텍스트가 들어간 이미지 콘텐츠

소셜 미디어 그래픽, 인용 카드, 가사 타이포그래피, 동기부여 포스터, 밈 템플릿. 메시지가 곧 아트워크인 모든 곳. 이는 새로운 텍스트 렌더링이 풀어주는 표준 사용 사례이며, 약한 모델로는 흉내낼 수 없습니다.

A square Instagram quote card. Centered text in elegant script: 'The best time to plant a tree was twenty years ago. The second best time is now.' Soft sage background, off-white border.
A vertical lyric card. Text reads '夜の街は静かに歌う' in vertical Japanese typesetting on the right side. Ink-wash background, restrained palette.

인포그래픽과 데이터 비주얼

수치 강조, Before/After 비교, 단순 막대 차트, 프로세스 다이어그램. 추론 단계가 라벨을 올바른 막대에 연결하고 제목을 올바른 계층에 배치하므로, AI 인포그래픽의 영원한 발각 표시인 잘못된 숫자 위치를 제거합니다.

A single-page onboarding flow titled 'From sign-up to first image'. Four labeled boxes connected by arrows: '1. Sign in', '2. Pick a model', '3. Write a prompt', '4. Generate'. Muted grey connectors, one warm accent on the final box.
A two-column comparison graphic titled 'Before vs After'. Left column header 'Before', right column header 'After'. Three bullet rows of short labels under each.

만화 컷과 스토리보드

두 컷, 세 컷 장면, 스토리보드 프레임, 만화 풍 시퀀스. 네이티브 추론이 같은 캐릭터를 컷에 걸쳐 유지하고 말풍선을 올바른 화자에게 연결하므로, 이전에 AI 만화를 불가능하게 만들었던 두 가지 실패 모드를 해결합니다.

A two-panel comic strip. Panel 1: a tired office worker at a desk, speech bubble reading 'Did you finish the report?'. Panel 2: same character, slightly slumped, bubble reading '...Almost.' Black-and-white ink style.
A three-panel storyboard for a coffee commercial. Panel 1: hand pouring espresso into a cup. Panel 2: cup steaming on a wooden table. Panel 3: silhouette of a person taking a sip. Cinematic lighting, no dialogue.

다국어 레이아웃

이중 언어 간판, 이중 언어 패키지, 다국어 UI 목업, 번역된 마케팅 자산. 모델은 같은 구도에 두 스크립트를 유지하며 한쪽이 장식 형태로 열화되지 않습니다 ― 그래서 이 섹션이 독립된 카테고리로 자리를 얻는 이유입니다.

A bilingual coffee shop receipt in Japanese and English. Header 'TOKYO ROASTERS'. Line items: 'ドリップコーヒー / Drip Coffee · ¥550', 'クロワッサン / Croissant · ¥380'. Footer: 'ありがとうございました · Thank you'. Cream paper with a faint grid.
A bilingual storefront sign. Left side reads 'TOKYO BAGEL' in English. Right side reads '東京ベーグル' in Japanese, same weight and visual size. Wooden plank background.

자주 묻는 질문

GPT Image 2란 무엇인가요?

GPT Image 2는 OpenAI의 최신 이미지 생성 모델입니다. 이전 세대 대비 세 가지 축에서 발전했습니다: 이미지 안에 읽히는 글자를 그리고, 기존 이미지를 픽셀 단위로 편집하며, 물리·재질·인체 구조 전반에 걸쳐 세계 지식 기반 사실감을 구현합니다. 이 페이지에서는 Credits로 구동되는 온라인 생성기 형태로 제공합니다.

GPT Image 2는 무료로 사용할 수 있나요?

1회 생성에 8 Credits이 소모됩니다. 모델을 여는 별도 구독은 없습니다 — 계정에서 언제든 충전할 수 있습니다.

GPT Image 2는 gpt-image-1이나 DALL·E 3와 어떻게 다른가요?

GPT Image 2는 그리기 전에 레이아웃을 먼저 계획하기 때문에 정보량이 많은 구성과 인포그래픽이 더 깔끔하게 정리됩니다. 이미지 안의 텍스트—— 특히 CJK 문자——는 이전 세대보다 눈에 띄게 선명하며, 기존 이미지에 대해서는 화면 전체를 다시 그리지 않고도 픽셀 단위 편집을 지원합니다.

생성한 이미지를 상업적으로 사용할 수 있나요?

예. 생성한 이미지는 OpenAI의 콘텐츠 정책과 적용 법률의 범위 내에서 개인 및 상업 프로젝트에 자유롭게 사용할 수 있습니다. 우리는 당신의 출력에 대한 권리를 주장하지 않습니다.

GPT Image 2는 이미지 안에서 어떤 언어를 잘 렌더링하나요?

중국어(간체·번체), 일본어, 한국어 그리고 라틴 알파벳 언어는 모두 깔끔하게 렌더링됩니다. 어떤 언어든 긴 문단보다는 짧고 단정한 프롬프트가 더 유리합니다.

오늘 GPT Image 2를 시도해보세요

아래 링크를 열면 홈페이지 모델이 이미 GPT Image 2로 선택되어 있고, 다음 클릭은 첫 프롬프트를 쓰는 일입니다.