99% 的文字渲染准确率
以前的图像模型能画出海报,但画不出海报上的标题。字形扭曲、字距塌陷,任何拉丁字母以外的字符都变成装饰性噪声。标准做法是:先生成背景、遮罩干净区域、再手动把文字补回去 —— 披着生成外衣的合成。
GPT Image 2 把这道鸿沟补上了。根据 OpenAI 自家基准,在可印刷文本上——包括段落、价格、说明与标签——文字渲染准确率约为 99%。字母保持比例、单词稳坐在一致的基线上,短句读起来像真正的排版,而不是近似的字形轮廓。
实际意义是:图像和文字从同一道流程出来。你可以像文案撰稿人改稿那样反复迭代海报、咖啡店菜单、App 界面、信息图 —— 改 prompt、重新生成、阅读结果。
先规划版式再绘制
GPT Image 2 自带原生推理步骤。在任何像素生成之前,模型会把 prompt 拆成结构化计划:什么放在哪里、哪些是前景元素、负空间放在哪里。计划落定之后,模型才开始绘制。
这一步额外推理,正是密集构图终于能撑住的原因。多分镜漫画把对白气泡正确连到对应角色。信息图把标签放到正确的柱子上。UI 草稿把控件分组成可识别的模式,而不是把按钮均匀撒在画布上。
这也改变了写 prompt 的方式。以前的模型在复杂 prompt 上会妥协。GPT Image 2 能消化一段较长的描述并仍生成连贯版式,因此你可以用一条 prompt 描述整张构图,把分件规划交给模型。
天生多语言
文字渲染质量在 CJK(中文简体、中文繁体、日文、韩文)以及拉丁字母语言上都稳定。不需要切换模型,也不需要设置语言标志。用你希望画面里出现的那种语言直接写 prompt,模型会把那套文字体系视为一等公民。
过去的图像模型实际上默认画面里的文字就是英文,其他语言一旦出现就只会退化成约略呈字母形的笔画。CJK 市场的团队要么直接放弃在图中生成文字,要么退回到叠加文字层的工作流,要么花钱做区域专用微调。在这里都不需要。
如果你要为东亚市场生产本地化内容——门店招牌、包装视觉、社交贴文、食谱卡、餐厅菜单——这就是「直接用生成结果」与「在 Photoshop 或 Figma 里重做文字层」之间的实际差别。一个每周产出几十个本地化变体的流水线,节省下来的时间会被迅速放大。
跨多次生成的角色一致性
用同一个 prompt 重新生成,人物会一次又一次以可识别的样子回来——同样的脸型、同样的发型、同样的配色、同样的服装细节。但如果换了 prompt,模型不会自动把人物延续下来:把那段角色描述复制到每个场景 prompt 里,当作选角简报用,模型就会严格照着它做。不需要自训 LoRA,不需要微调,也不需要参考图。
对故事板、品牌吉祥物、教学序列、绘本插图以及任何角色需要多次出现的叙事工作,这去掉了「为了让一张脸稳定而专门训练自定义 LoRA」的来回。你只写一遍详细的角色描述,然后把那段描述作为角色锚点在每个场景 prompt 里复用。
一致性在角色描述详细而具体时最强:明确的发色与发长、眼镜、可识别的服装、有特征的配饰。在角色描述含糊、或者场景把灯光或渲染风格大幅改变时最弱。把角色描述当作选角说明书来写。
密度高的版面也能真正撑住
原生推理与改进的文字渲染相结合,意味着 GPT Image 2 能处理以前的系统会悄悄退化的构图:数据驱动信息图、含工具栏与收件箱列表的移动端 UI 草稿、有层级的多元素营销海报、同一画面里多个 SKU 的包装草稿。
在 DALL·E 3 或 gpt-image-1 会把复杂度压缩成模糊印象的地方,GPT Image 2 把密度当作要求来对待。柱子带标签、标签页有名称、工具栏图标有可分辨的形状。结果是设计师可以在此基础上反应、修改的素材。
极高密度的版式 —— 整页杂志跨页、带二十个独立 widget 的复杂仪表盘、十几个带标签道具的杂乱场景 —— 仍然受益于把任务拆成更小的几步。「手动合成更划算」的临界点已经显著上移,但在复杂度的高端仍然存在。
可商用,附常见注意事项
用 GPT Image 2 生成的图像归你所有,可用于个人与商业项目,遵循 OpenAI 内容政策与适用法律。没有需要升级的另一档授权、没有版税模型、没有叠加在生成成本之上的使用费。输出从落到你的账户那一刻起就是你的。
实际涵盖范围:营销素材、博客插图、产品草稿、包装概念、社媒内容、应用内素材、课件、视频缩略图、演示幻灯片。任何原本会请插画师或买素材库的场景,都可以改用生成图像。
常见的注意事项仍然适用——未经同意不得使用真人肖像、不得侵犯商标或受版权保护的角色、不得用于对公众人物的欺骗性图像。把 OpenAI 的内容政策当作合约来看,你就是在一个干净的、日常可商用的授权框架里工作。
像素级编辑,无需整图重渲染
此前的模型把每一次编辑都当作整图重生成。海报上改一个字,整张图就被重新掷骰——背景飘了,颜色偏了,你刚才还满意的细节也一并消失。迭代变成了赌博。
GPT Image 2 支持只作用在你指定区域的局部编辑:替换标题、重新上色、修正一个标错的柱状图标签、重画一只手。画面其他部分在像素级别保持不变,迭代于是变成累加——锁定你满意的构图,然后单独修掉那一处不对劲的细节,不必把其他东西也重新冒险。
在实际使用中,这替代掉了为了小改动而往 Photoshop 来回跑的流程。和推理步骤结合起来,图像生成就更接近「起草—修订」的工作流:先生成一个你满意的版面,然后就地改细节直到对齐 brief,不再每一轮都把整张图从头掷一遍。