0

OpenAI 发布 ChatGPT Images 2.0:思考能力增强与文本渲染优化

OpenAI 本周推出 ChatGPT Images 2.0 模型,引入思考能力并优化文本渲染技术。该模型支持多语言渲染、实时Web搜索及8图像生成,并采用2K分辨率输出。

ChatGPT Images 2.0 界面示意图

核心功能升级:思考能力与图像生成

新版本支持复杂视觉任务处理,包括精确物体布局、精细细节保留及密集结构渲染。

  • 思考能力模型:具备图像视觉构图优化能力,减少AI生成痕迹。
  • 多语言文字渲染:支持日语、朝鲜语、中文、印地语及孟加拉文字符的准确输出。
  • 实时交互:支持Web搜索获取最新信息,单提示生成最多8张图像,并自动校验输出质量。

技术参数与输出规格

图像分辨率最高达 2K 标准,支持多画幅比例生成。

  • 分辨率支持:最高 2K 分辨率输出,适用于跨平台内容需求。
  • 生成能力:单提示词生成 8 图像,支持 Prompt 2.0 指令复杂度处理。
  • 多语言支持:强化非拉丁字符渲染精度,覆盖主流亚洲及南亚语言体系。

该版本标志着生成式图像模型向可解释性架构演进,OpenAI 通过功能整合提升跨语言场景适配性。ChatGPT、Codex及API用户可立即访问该功能。
via MacRumors

分享:
订阅评论
提醒
guest
0 评论
最旧
最新 最多投票
内联反馈
查看所有评论
0
希望看到您的想法,请您发表评论x