news 2026/4/18 3:49:46

GPT-5.2遭全网群嘲,原因竟然是不够人性化!

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
GPT-5.2遭全网群嘲,原因竟然是不够人性化!

日前,OpenAI 十周年的日子里,他们如约推出了新的旗舰模型 GPT-5.2。

官方宣传词是「迄今为止在专业知识工作上最强大的模型」,各项基准测试成绩也确实看起来不错。

但就在发布后的几个小时内,整个网络舆论急速反转。

社交媒体上涌现出大量质疑声音:从专业基准测试的「拉胯」成绩,到日常推理能力的离谱错误,再到创意工作上的审美缺陷……

一个曾经被全网期待的升级,瞬间变成了网红吐槽对象。

第一个坑:基准测试对不上

OpenAI官方数据吹得很凶,AIME数学竞赛100%满分、70%工作场景超越人类专家。

但SimpleBench(一个测常识推理的2024年基准),出来,GPT-5.2得分竟然低于Claude Sonnet 3.7,那是一年前的模型。

SimpleBench考的是像人一样思考,不是死记硬背。

200多道多选题,高中生能答83%,但GPT-5.2栽跟头了。

最过分的是那个著名的"garlic有几个r"问题,GPT-5.2一本正经回答0个,被网友直接嘲讽"GPT-5.2 is AGI"。

更扎心的是,前AWS和谷歌总经理Bindu Reddy指出,GPT-5.2在LiveBench上的得分也低于Opus 4.5和Gemini 3.0。

号称升级,结果在多个真实基准上都表现平庸。

第二个坑:安全护栏把人当幼儿园小孩

OpenAI强化了"安全完成"机制,结果用户缺不干了!

有人想转录Ray Kurzweil的哲学论文(纯学术内容),GPT-4o到GPT-5.2全部拒绝,借口是"内容不合适"或"版权问题"。

Reddit用户一致认为GPT-5.2太平淡、过度审查,

就像"把成年人当幼儿园小孩对待",有人甚至说"不像是升级,反而像是倒退"。

那GPT-5.2真的有那么拉垮吗?网上有差的一面,但是也有好的一面。

不少人觉得GPT-5.2更加智能了。

当然,这里也不一一展示了!

其实深究OpenAI到底怎么了?原因也很简单,

其实问题出在OpenAI的战略转向

GPT-5.2不是烂,而是为数学和科学而生。只是在错误的时间,出现在错误的使用场景上。

它被当做自然语言模型来用,结果就显得冷漠、无人性。

我注意到一个趋势。

OpenAI让Jakub Pachocki做首席科学家,这个信号很明确,他们已经打算放弃自然语言了。

看o1、o3、GPT-5、GPT-5.2的走势,每一代模型都在变得更"不自然"。

o3那会儿大家沉迷于它的图像缩放和推理能力,忽视了一件事:它的语言表达越来越不自然,出现了反自然语言倾向。到了GPT-5.2,这个趋势更明显。

最后!

基准测试碾压竞品,不代表真实可用性强。

OpenAI为了刷推理能力而优化模型,反而丧失了在日常对话中的理解力和温度。

一个更聪明但更冷漠、更容易伤害人的系统,这不是升级,这是战略偏移。

可能这就是为什么Claude用户反馈满意度更高,不是智能分更高。

如果大家更加注重日常的聊天。那还是期待新版的GPT-4o早点出来吧!

相关阅读:

不是礼品卡,不是虚拟卡,2025最新ChatGPT Plus订阅教程,小白都学得会!

这个产品,居然可以同时使用Claude code和Codex

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/15 23:09:39

.NET周刊【11月第5期 2025-11-30】

国内文章 TypedSql:在 C# 类型系统上实现一个 SQL 查询引擎 https://www.cnblogs.com/hez2010/p/19261972/turning-csharp-type-system-into-a-query-engine 本文探讨了在 .NET 环境中如何高效处理内存中的数据查询,提出了一种基于 C# 类型系统的全新…

作者头像 李华
网站建设 2026/4/18 2:37:23

【案例共创】从0开始使用华为云开发者空间搭建房价预测模型

最新案例动态,请查阅【案例共创】从0开始使用华为云开发者空间搭建房价预测模型。小伙伴们快来领取华为开发者空间进行实操吧! 本案例由:梅科尔工作室提供 1 概述 1.1 案例介绍 华为云开发者空间,华为云为每个新生态开发者免费…

作者头像 李华
网站建设 2026/4/12 16:28:06

通宵测完NanoBanana Pro,我只想说,太牛逼了。

作为一名长期关注 AI 技术和数字创意工具的用户,最近我终于体验了谷歌最新发布的 Nano Banana Pro,这个图像生成模型真的是让我目瞪口呆。通宵一试,我只能说,这个工具简直是 划时代的神器,不仅技术极其强大&#xff0c…

作者头像 李华
网站建设 2026/4/16 14:31:19

算法题 重构字符串

重构字符串 问题描述 给定一个字符串 s,检查是否能重新排列其中的字符,使得任意两个相邻的字符都不相同。 如果可以重新排列,返回任意一个满足条件的字符串。如果不能,返回空字符串 ""。 示例: 输入: s &qu…

作者头像 李华
网站建设 2026/4/15 19:40:27

无人机红外图像下极小目标检测数据集,无人机红外小目标检测数据集 低空安防、机场净空监测、反无人机系统、鸟类迁徙监控 YOLOv8** 构建的 **无人机红外图像下极小目标检测系统

无人机红外图像下极小目标检测数据集,8302张,yolo和voc两种标注方式 4类,标注数量: Plane:飞机 2163 Drone:无人机 3120 Heli:直升机 2217 Bird:鸟类 1958 image num: 8302 1 1 以下是 无人机红外图像下极小目标检测数据集 的完…

作者头像 李华
网站建设 2026/4/15 19:22:33

qt-lambda信号槽机制

想要调查&#xff0c;lambda信号槽在用完后会不会自己回收 写入成员变量 private: std::function<void()> lambdaSlot; 初始化 lambdaSlot []() {qDebug() << "Lambda slot executed";// 可访问类成员&#xff08;如this指针&#xff09;};cpp代码展示…

作者头像 李华