news 2026/6/9 15:57:57

OpenAI推出GPT Image 1.5模型加速图像生成竞争

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
OpenAI推出GPT Image 1.5模型加速图像生成竞争

OpenAI正在推出新版本的ChatGPT图像生成功能,承诺提供更好的指令遵循能力、更精确的编辑功能,以及高达4倍的图像生成速度提升。

这个名为GPT Image 1.5的新模型从周二开始向所有ChatGPT用户和API用户提供服务。这是与谷歌Gemini竞争的最新升级,此前OpenAI首席执行官萨姆·奥特曼在上个月泄露的内部备忘录中宣布进入"红色警戒"状态。该备忘录详细说明了OpenAI重新夺回AI领导地位的计划,此前谷歌发布了其最新旗舰模型Gemini 3和最新版本的病毒式图像生成器Nano Banana Pro后开始抢占市场份额,这两个模型在LMArena排行榜的多个基准测试中都名列前茅。

即使在OpenAI上周推出GPT-5.2作为回应后,谷歌仍保持领先地位,OpenAI将其定位为面向开发者和日常专业使用的最先进模型。据报道,OpenAI原本计划在1月初发布新的图像生成器,但加速了计划并在本周宣布。其上一个图像模型GPT Image 1是在4月发布的。

GPT Image 1.5的推出正值图像和视频生成器超越原型阶段,获得更多生产就绪能力的时期。与Nano Banana Pro类似,ChatGPT图像提供后期制作功能,提供更精细的编辑控制来保持视觉一致性,如面部相似度、光照、构图和色调在编辑过程中的一致性。

大多数生成式AI图像工具在迭代方面表现不佳,所以这将是一个巨大的进步。当被要求进行特定更改时,如"调整面部表情"或"让光线更冷",模型往往会重新解释整个图像,导致缺乏一致性。

这次更新不仅仅是新功能。ChatGPT图像现在还可以通过ChatGPT侧边栏中的专用入口访问,该入口"更像一个创意工作室",OpenAI应用程序首席执行官菲吉·西莫在周二的博客文章中写道。

"新的图像查看和编辑界面让创建符合你愿景的图像变得更容易,或者从热门提示和预设滤镜中获得灵感,"西莫写道。

除了新的图像生成器,OpenAI还引入了新的方式来改善ChatGPT体验,增加更多视觉元素。计划是让搜索查询显示更多带有明确来源的视觉内容,这对于转换测量单位或查看体育比分等任务可能很有帮助,西莫表示。

"当你在创作时,你应该能够看到并塑造你正在制作的东西。当视觉效果比单纯的文字更能讲述故事时,ChatGPT应该包含它们,"西莫写道。"当你需要快速答案或下一步操作在另一个工具中时,它应该就在那里。通过这样做,我们可以继续缩短你心中所想与你实现它的能力之间的距离。"

Q&A

Q1:GPT Image 1.5相比之前的版本有什么改进?

A:GPT Image 1.5提供了更好的指令遵循能力、更精确的编辑功能,以及高达4倍的图像生成速度提升。它还提供后期制作功能,能够在编辑过程中保持面部相似度、光照、构图和色调的视觉一致性,解决了大多数生成式AI图像工具在迭代编辑时缺乏一致性的问题。

Q2:为什么OpenAI要加速推出GPT Image 1.5?

A:OpenAI加速推出是为了应对与谷歌Gemini的激烈竞争。谷歌发布了Gemini 3和Nano Banana Pro后开始抢占市场份额,这两个模型在多个基准测试中都名列前茅,促使OpenAI首席执行官宣布进入"红色警戒"状态,原本计划1月初发布的产品被提前到本周发布。

Q3:GPT Image 1.5如何改善用户的创作体验?

A:GPT Image 1.5通过ChatGPT侧边栏中的专用入口提供"更像创意工作室"的体验,新的图像查看和编辑界面让用户更容易创建符合愿景的图像,还能从热门提示和预设滤镜中获得灵感。同时增加了更多视觉元素,让搜索查询显示带有明确来源的视觉内容。


版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/10 0:34:28

45、Pthreads 多线程编程基础

Pthreads 多线程编程基础 1. 限时等待线程结束 在多线程编程中,有时我们希望等待目标线程结束,但不想无限期地等待,即设置一个最大等待时间。这可以通过 pthread_timedjoin_np(3) 这个 API 来实现。 该 API 的前两个参数与 pthread_join 相同,第三个参数则以绝对时间…

作者头像 李华
网站建设 2026/6/4 12:53:58

英伟达推出开源权重模型填补美国AI市场空白

对于许多企业来说,AI技术的采用很大程度上依赖于高质量开源权重模型的可用性。将敏感的客户数据或来之不易的知识产权暴露给API以使用ChatGPT等封闭模型是不可接受的。除了中国AI实验室之外,目前可用的少数开源权重模型与OpenAI或Anthropic等公司的专有模…

作者头像 李华
网站建设 2026/6/8 15:43:37

50、多线程同步:锁与条件变量的深入解析

多线程同步:锁与条件变量的深入解析 1. 读写锁(Reader-Writer Locks) 读写锁提供了一种特殊的锁机制,适用于读操作频繁而写操作较少的场景。相关的 API 包括 pthread_rwlock_timedwrlock(3P) 、 pthread_rwlock_trywrlock(3P) 和 pthread_rwlock_wrlock(3P) 。 使…

作者头像 李华
网站建设 2026/6/9 19:38:56

60、Linux系统的高级文件I/O、故障排除与最佳实践

Linux系统的高级文件I/O、故障排除与最佳实践 1. 高级文件I/O相关工具与技术 在处理文件时,I/O性能是关键因素,许多实际工作负载中,I/O往往是性能瓶颈。以下是一些用于I/O监控、分析和带宽控制的工具和技术: | 工具名称 | 功能描述 | | — | — | | iostat(1) | 监控I…

作者头像 李华
网站建设 2026/6/7 22:06:10

android 13.0 系统设置默认中文为默认语言,settings 语言列表显示不可作为系统语言使用问题解决

1.前言 在13.0的系统rom定制化开发中,在开发国内项目的时候,需要设置默认语言为中文,然后再设置默认语言项为zh-CN 时,这是系统设置语言列表下方显示不可作为系统语言使用,为了解决这个问题,就需要相关的分析,然后 看怎么处理这个问题 2.系统设置默认中文为默认语言,…

作者头像 李华
网站建设 2026/6/5 21:50:13

如何用Kotaemon构建可追溯的智能问答系统?

如何用Kotaemon构建可追溯的智能问答系统? 在企业知识管理日益复杂的今天,一个看似简单的员工提问——“我该怎么申请新的笔记本电脑?”——背后却可能隐藏着巨大的风险。如果系统随口编造一个错误的邮箱地址或流程步骤,轻则耽误工…

作者头像 李华