news 2026/5/8 4:55:43

GPT-5.5 Instant发布:人人免费,幻觉暴降52.5%

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
GPT-5.5 Instant发布:人人免费,幻觉暴降52.5%

OpenAI正式发布更聪明且懂你的GPT-5.5 Instant,全面替代老版本成为默认选择。

新模型大幅降低了高风险领域的幻觉比例,回答更精简紧凑,同时能深度调用过往聊天记录和关联邮箱,为你提供量身定制的专属反馈。

回答更准更精简

GPT-5.5 Instant承担着上亿用户的日常问答需求。

新模型在各类学科领域给出的答案更严密,交流语气更自然。

在事实准确度方面,新版本有了显著提升,在要求最为严格的专业领域进步最大。

内部评估数据显示,在涵盖医学、法律、金融的高风险提示词测试中,GPT-5.5 Instant产生的幻觉声明比老版本GPT-5.3 Instant减少了52.5%。

在用户之前标记过事实错误的挑战性对话中,新模型将不准确声明的比例降低了37.3%。

新版本在应对日常任务时表现出更全面的能力。在视觉推理、数学和科学方面的评估上全面提升。

无论是分析用户上传的照片和图像,解答STEM(科学技术工程和数学)相关问题,还是判断何时调用网络搜索来提供有用答案,新模型的表现都更加出色。

面对复杂的数学题,新模型展现出强大的纠错能力。

官方展示了一道代数方程题的例子。

新模型起初可能赞同错误的解法,但随即将解答代入原方程进行检验。发现代入失败后,模型立刻定位到用户在移项时犯下的代数错误,改用求根公式计算出正确答案。

与之相比,老版本GPT-5.3 Instant同样能发现代入失败,却过早停止思考,草率得出无实数解的错误结论,完全没有回顾代数过程并重新求解。

除了算得更准,新模型的文字表达也更精炼。在保留亲和力与个性化语气的前提下,模型给出的回答直奔主题,保留了核心信息。

新版本去除了冗长毛病,减少了不必要的追问,抛弃了无意义的表情符号,排版更加清爽。

一个例子展示了GPT-5.5 Instant在不牺牲内容质量的情况下,使用的字数减少了26.6%,行数减少了36.4%。

老版本在处理同类提示词时,结构显得过于复杂,甚至会出现指出冗余问题的同时给出同样冗余的修改建议的情况。

记忆可控,真正懂你

个性化是新版本的另一项核心升级。

只要用户授权连接,模型就能高效利用过往聊天记录、本地文件以及Gmail(谷歌邮箱)中的上下文信息。

模型会自动判断何时需要引入个性化数据来提升回答质量,检索历史对话的速度大幅加快,免去了用户反复交代背景信息的麻烦。在获取量身定制的计划、继续推进未完成的工作时,这个特性的优势尤为明显。

例如,在提供出行或餐饮建议时,新老版本的表现截然不同。

老版本通常只能根据用户身处旧金山的基础定位,给出一些大而全的推荐。GPT-5.5 Instant则会深度检索用户之前的聊天记录和关联数据,结合用户日常喜好与品味,给出精准且高度个性化的深度推荐。

为了让个性化过程更加透明,OpenAI在所有ChatGPT模型中引入了Memory sources(记忆来源)功能。

用户可以通过全新的控制面板,清晰查看到底是哪些历史聊天记录或保存的记忆影响了当前的回答。发现过时或不相关的信息,用户随时可以进行删除或修改。

当你选择与他人分享某段对话时,记忆来源信息会被自动隐藏。用户对专属记忆库拥有完全控制权,可以选择删除不希望被引用的聊天记录,在设置面板中清理记忆项,或者直接开启不调用也不更新记忆的临时聊天模式。

只是目前的记忆来源面板,在设计上优先保证易读性,可能暂时无法穷举影响回答的所有因素。系统优先展示最相关的历史对话,后续还会持续优化显示面板,提供更全面的视图。

新版本全面开放

GPT-5.5 Instant已向所有ChatGPT用户陆续推送,人人免费,正式替代GPT-5.3 Instant成为默认模型。

在API中,新模型被命名为chat-latest。为了照顾付费用户的使用习惯,老版本将在配置设置中继续保留三个月,随后正式退役。

包含历史记录、文件与关联邮箱深度调用的增强版个性化功能,目前正优先向网页版的Plus和Pro用户推送,移动端即将上线。

未来几周内,该功能还将扩展至免费版、Go、Business和Enterprise用户。

记忆来源功能,将在所有网页端消费级套餐中全面铺开,移动端也指日可待。具体个性化数据源的可用性可能因不同地区而有所差异。

告别幻觉与废话,精准严密的推理与清爽懂你的交互,还免费,GPT-5.5 Instant又套牢了日常使用的普通用户。

参考资料:

https://openai.com/index/gpt-5-5-instant/

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/8 4:55:38

Akvorado性能优化指南:10个实用技巧提升大规模流量处理能力

Akvorado性能优化指南:10个实用技巧提升大规模流量处理能力 【免费下载链接】akvorado Flow collector, enricher and visualizer 项目地址: https://gitcode.com/gh_mirrors/ak/akvorado Akvorado作为一款强大的Flow collector, enricher and visualizer工具…

作者头像 李华
网站建设 2026/5/8 4:55:35

LayerZero费用机制深度解析:Treasury与Gas优化终极指南

LayerZero费用机制深度解析:Treasury与Gas优化终极指南 【免费下载链接】LayerZero An Omnichain Interoperability Protocol 项目地址: https://gitcode.com/gh_mirrors/la/LayerZero LayerZero作为跨链互操作性协议(An Omnichain Interoperabil…

作者头像 李华
网站建设 2026/5/8 4:55:34

vscode-dark-islands主题下的Dart开发:Widget与方法色彩区分

vscode-dark-islands主题下的Dart开发:Widget与方法色彩区分 【免费下载链接】vscode-dark-islands VSCode theme based off the easemate IDE and Jetbrains islands theme 项目地址: https://gitcode.com/GitHub_Trending/vs/vscode-dark-islands vscode-d…

作者头像 李华
网站建设 2026/5/8 4:55:31

流媒体建设及部署指导

一、背景 因客户招投标合规需要,需建设一个流媒体平台辅助日常办公,接入摄像头设备路数大约15路,服务器要支持国产化,满足后期扩容需求;对于该流媒体平台可购置商用或采用开源版本。 相关资料:开源视频平台…

作者头像 李华
网站建设 2026/5/8 4:53:40

Casbin容量规划:大规模用户权限系统终极设计指南

Casbin容量规划:大规模用户权限系统终极设计指南 【免费下载链接】casbin Apache Casbin: an authorization library that supports access control models like ACL, RBAC, ABAC. 项目地址: https://gitcode.com/GitHub_Trending/ca/casbin 在构建企业级应用…

作者头像 李华