
- 博客
- 全新 ChatGPT Images 正式发布
全新 ChatGPT Images 正式发布
OpenAI 正式推出全新的 ChatGPT Images 体验,并将最新图像生成模型以 GPT‑Image‑1.5 的形式开放至 API。此次升级的重点是:在“只改你想改”的前提下保留光线、构图与人物相貌等关键信息;更具表现力的风格变换;更强的指令跟随;以及更清晰的文本渲染。同时,图像生成速度最高提升至 4 倍。

目录
精准编辑与创造性变换
新模型的设计目标明确:严格遵循你的修改意图,并在多轮编辑中保持光线、构图和人物相貌的一致性。这使 ChatGPT 既能胜任实用型修图,也能完成富有想象力的再创作。
编辑:只改意图,不伤“本味”
- 支持添加、删除、组合、融合与位置转换等多种编辑操作。
- 在试穿服饰、发型更换等场景中,保持人物相貌与场景连续性。
- 在局部调整的同时,保持整体光线与构图稳定。
创造性变换:重构叙事,保留关键
- 将照片转化为海报、广告、绘画或装饰风格,同时保留核心识别特征。
- 可调整版式并插入文字元素,兼顾美观与可读性。
- 可直接在全新的 Images 功能中使用预设风格与主题,无需手写提示词。
指令跟随:更稳定的结构与关系
- 更好地执行复杂、多元素的排布任务(如网格、多行多列布局)。
- 更精确地保持元素之间的空间与关系约束。
文本渲染:更密集也清晰
- 更好地呈现小字号与高密度文本。
- 适用于报纸版面、信息图与界面样机等高文本密度场景。

全新 Images 体验与 API
OpenAI 在 ChatGPT 侧边栏(移动与网页)提供了专属的 Images 创作空间,让探索更快更直观。该空间内置预设滤镜与趋势提示,并支持一次性人像相似度上传,后续可重复调用,无需反复翻相册。
为迭代而生的创作流程
- 生成速度最高提升至 4×,且可在前一批图像仍在渲染时继续生成新图。
- 通过预设风格快速启发灵感,降低提示词门槛。
GPT‑Image‑1.5 API 能力
- 与 ChatGPT Images 同步提供保真与编辑能力提升。
- 相比 GPT Image 1,图像输入与输出费用均下降约 20%,同等预算可完成更多迭代。
- 在品牌与 Logo 保真方面更稳定,适合营销物料、电商图集与设计工作流。
- 可在 Playground 试用、浏览案例库,并参考提示词指南优化请求。
上线与可用性
- 新模型已向所有 ChatGPT 用户陆续开放;多数用户当下即可体验新的 Images 入口,企业版与商业版将稍后开放。
- 早期版本仍将以自定义 GPT 的形式保留,便于平滑过渡。

常见问题
本次 ChatGPT Images 有哪些关键升级?
搭载 GPT‑Image‑1.5:精准编辑、更强指令跟随、更清晰文本渲染、更具表现力的风格转换,并带来最高 4× 的生成速度提升。
能否在多轮编辑中保持人物相貌与构图一致?
相较初版有显著提升。对人像、试穿与品牌素材尤为关键。
文本渲染是否更清晰?
是的。对高密度、小字号文本的可读性更强,适合海报、信息图与文档风格内容。
仍存在哪些限制?
尽管在多个案例中表现更好,但在部分风格、多语种与多脸场景上仍有不足,后续版本将继续改进。
企业可用性如何?
新 Images 体验已面向多数用户开放,商业版与企业版将稍后开放。
速度如何?
最高可达 4 倍加速,且支持并行生成,减少等待时间。
API 成本与适用场景?
相比 GPT Image 1,输入/输出费用约降 20%。适用于电商多角度/多场景产品图、营销图形与保持 Logo 一致性的品牌设计。
结语
搭载 GPT‑Image‑1.5 的 ChatGPT Images 在可控性、表现力、文本清晰度与迭代效率上实现全面提升:既能“精准改动不伤全局”,也能“大胆重塑不丢本质”。随着 API 成本下降与品牌保真度加强,其在电商、营销与创意工具领域的落地空间将进一步拓展。
