news 2026/4/18 13:59:42

OpenAI 急了?GPT Image 1.5 强行发布,实测惨遭「大香蕉」吊打

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
OpenAI 急了?GPT Image 1.5 强行发布,实测惨遭「大香蕉」吊打

OpenAI 急了。

上周刚发布GPT-5.2,这周就来了图像模型。

几小时前,OpenAI 发布了GPT Image 1.5GPT Image 1的升级版。

借用官方的说法,新模型速度提升 4 倍,编辑更精准,API 价格还降了 20%。

但是,先别高兴太早。

从新模型的命名就能看出,它大概率还是个过渡模型。

如果真的提升很大,那何不直接叫GPT Image 2

谷歌从小香蕉(Nano Banana)到大香蕉,那可是直接升级成了Nano Banana Pro

而我后面的实测也证实了这个推测。


01|更新了什么?

核心改进:「精准编辑」。

你让它改哪里,它就改哪里,其他地方保持不变。

这是之前 AI 编辑图片最头疼的问题。

GPT Image 1.5号称解决了它。

光线、构图、人脸特征,都能在多轮编辑中保持一致。

速度也快了不少。

官方说是 4 倍。

实测确实如此,主要是那个旧版模型太慢了,动不动就 1 分钟才画出来。

文字渲染也有明显进步。

GPT Image 1的文字能力只能说是一般。

今天的GPT Image 1.5好了不少。

来自 OpenAI 官方的一个案例。

让模型生成一份报纸版式,里面是完整的 Markdown 表格和多段落文章。

字是清晰可读的。


02|怎么用这个新模型?

打开 ChatGPT,现在侧边栏多了一个「Images」入口。

点进去就是专门的画图空间,有预设滤镜和热门提示词,不用自己想提示词。

产品力这一块,OpenAI 没得说。

模型已经在全量推送,免费用户也能用。

不需要切换,系统默认就是GPT Image 1.5


03|和大香蕉比怎么样?

这是你们最关心的问题。

GPT Image 1.5Nano Banana Pro,到底谁更强?

先说结论:Nano Banana Pro,YYDS。

尤其是中文文字渲染,差距明显。

但 OpenAI 这次在精准编辑和指令遵循上确实追上来了。

文字渲染也还可以,仅限英文。

来实测。

A seamless, high-definition editorial quote card. Subject: A hyper-realistic portrait of {argument name="author" default="Steve Jobs"} on the left. The image is rendered in flawless native 4k resolution, with razor-sharp focus on the eyes and facial textures. His figure and black turtleneck smoothly fade into the dark brown background using a soft gradient. Atmosphere: Sophisticated deep espresso brown texture, warm premium lighting. Text Layout: On the open negative space to the right, display the quote "{argument name="famous_quote" default="Stay Hungry, Stay Foolish"}" in an elegant Light-Gold Serif font. Place the signature "—{argument name="author" default="Steve Jobs"}" below it. Decor: A single, massive, semi-transparent opening quotation mark ( “ ) is placed artistically in the background behind the text. It has low opacity, appearing as a subtle watermark that blends into the brown background.

GPT Image 1.5生成的效果如下。

整体还不错,背景质感挺好。

作为对比,这是我之前用 Lovart 里的Nano Banana Pro生成的。

接下来测试编辑能力。

把图中的 “Stay Hungry, Stay Foolish” 改成“求知若饥,虚心若愚”。

差距这就来了。

GPT Image 1.5的指令遵循没有太大问题。

但中文文字的渲染,一塌糊涂。

除了前面 3 个字,后面全是乱码。

Nano Banana Pro的结果。

继续。

把乔帮主的头偏移一个合适的角度,不需要正对。

GPT Image 1.5画的,只能说,略显僵硬。

来看Nano Banana Pro的。

你更喜欢哪个?


04|年底大战

最近是 AI 圈的密集发布期,堪比过年。

谷歌率先推出Gemini 3 ProNano Banana Pro

OpenAI 立即反击,发布GPT-5.2GPT Image 1.5

Anthropic 也没闲着,据说圣诞节前会推出Claude Sonnet 4.7

另外,本周应该还有个小惊喜,谷歌的Gemini 3 Flash

代言人 Logan Kilpatrick 昨天已经开始预热:⚡️⚡️⚡️。

期待一波。


我是木易,一个专注 AI 领域的技术产品经理,国内 Top2 本科 + 美国 Top10 CS 硕士。

相信 AI 是普通人的“外挂”,致力于分享 AI 全维度知识。这里有最新的 AI 科普、工具测评、效率秘籍与行业洞察。

欢迎关注“AI信息Gap”,用 AI 为你的未来加速。


精选推荐

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/18 7:54:46

EmotiVoice语音合成在老年陪伴机器人中的温情表达实践

EmotiVoice语音合成在老年陪伴机器人中的温情表达实践 情感化语音:让机器“说话”也懂人心 在一间安静的客厅里,一位独居老人轻声说:“我有点睡不着。” 片刻后,一个熟悉的声音响起——那是她已成家的女儿的声音,温柔…

作者头像 李华
网站建设 2026/4/18 8:09:35

企业级语音系统搭建首选:EmotiVoice高可用架构设计

企业级语音系统搭建首选:EmotiVoice高可用架构设计 在虚拟偶像能开演唱会、AI主播24小时直播带货的今天,机器语音早已不再是单调冰冷的“电子音”。用户期待的是有情绪起伏、有角色个性、能与内容情境共鸣的声音体验。而传统TTS系统面对这些需求时&#…

作者头像 李华
网站建设 2026/4/18 7:05:17

EmotiVoice语音能量与基频调控原理剖析

EmotiVoice语音能量与基频调控原理剖析 在虚拟助手、游戏NPC、有声书乃至虚拟偶像日益普及的今天,用户早已不再满足于“能说话”的语音合成系统。他们期待的是会表达、有情绪、像真人的声音——一句话是“平静地说”还是“愤怒地吼出”,背后不仅是语义的…

作者头像 李华
网站建设 2026/4/18 0:47:22

19、深入了解WRT54G路由器:CFE创建、故障排除与NVRAM命令指南

深入了解WRT54G路由器:CFE创建、故障排除与NVRAM命令指南 1. 创建CFE文件 在为设备创建通用闪存环境(CFE)之前,需要更新CFE镜像。具体步骤如下: - 选择“在线更新”按钮,然后在弹出的在线更新窗口中点击“开始”。 - 更新完成后,使用下拉菜单“选择设备”来挑选目标…

作者头像 李华
网站建设 2026/4/16 18:04:38

49、Unix 技术综合指南:从基础符号到安全实践

Unix 技术综合指南:从基础符号到安全实践 1. 特殊符号与运算符 在 Unix 系统及相关脚本编程中,众多特殊符号和运算符发挥着关键作用。 - 符号功能概述 | 符号 | 功能 | | — | — | | & | 作为逻辑与运算符( && )用于逻辑判断,作为按位与运算符(…

作者头像 李华