OpenAI 本周推出 ChatGPT Images 2.0 模型,引入思考能力并优化文本渲染技术。该模型支持多语言渲染、实时Web搜索及8图像生成,并采用2K分辨率输出。

核心功能升级:思考能力与图像生成
新版本支持复杂视觉任务处理,包括精确物体布局、精细细节保留及密集结构渲染。
- 思考能力模型:具备图像视觉构图优化能力,减少AI生成痕迹。
- 多语言文字渲染:支持日语、朝鲜语、中文、印地语及孟加拉文字符的准确输出。
- 实时交互:支持Web搜索获取最新信息,单提示生成最多8张图像,并自动校验输出质量。
技术参数与输出规格
图像分辨率最高达 2K 标准,支持多画幅比例生成。
- 分辨率支持:最高 2K 分辨率输出,适用于跨平台内容需求。
- 生成能力:单提示词生成 8 图像,支持 Prompt 2.0 指令复杂度处理。
- 多语言支持:强化非拉丁字符渲染精度,覆盖主流亚洲及南亚语言体系。
该版本标志着生成式图像模型向可解释性架构演进,OpenAI 通过功能整合提升跨语言场景适配性。ChatGPT、Codex及API用户可立即访问该功能。
via MacRumors