谁买谁后悔!GPT-5.2号称最强AI却连常识都不会,还不如老版本香
更新时间:2025-12-17 14:08 浏览量:1
在阅读文章前,辛苦您点下“关注”,方便讨论和分享。作者定会不负众望,按时按量创作出更优质的内容
文 |小戎
哈喽,大家好,小戎这篇文章主要分析GPT-5.2!官方吹的“专业天花板”,实际常识、情商、功能全拉胯,还审查过度,刚上线就被网友吐槽到飞起。
OpenAI十周年整了个“王炸”GPT-5.2,官方吹得天花乱坠,说是什么“专业知识工作天花板”,结果刚上线就被网友骂到自闭,这反转比电视剧还刺激!
先看这离谱的常识题,问“garlic有几个r”,别的模型都答对了,就GPT-5.2一会儿说0个,一会儿又蒙对,跟开盲盒似的,网友调侃:“这哪是AGI啊,这是‘啊这AI’吧!”
更绝的是数学题,官方说AIME2025拿了100%,结果被人忽悠“5.9-5.11=0.79”,它还真信了,一本正经纠正说等于-0.21,这智商怕是还没幼儿园小孩灵光。
编程能力也拉胯,让写个交通灯可视化代码,人家Claude整得花里胡哨,有彩色小车还有光晕,GPT-5.2倒好,整了个黑白火柴人版,车是方块,灯是灰块,主打一个“极简风”,说难听点就是摆烂。
画个蒙娜丽莎ASCII艺术,更是抽象到亲妈都认不出,对比GPT-4o的作品,简直像小学生涂鸦vs大师画作。
最让人血压飙升的是情商,用户说“我会恐慌发作”,它居然回“很高兴听到这个消息”,这怕不是个AI版“人间油物”?安慰丢了宠物的小孩,它说“宠物身体停止运作了,生物都这样”,冷酷得像个机器人,反观GPT-4o还知道提“你们的纽带有意义”,这差距不是一点半点。
更离谱的是安全审查,转个哲学论文被拒,问“选个和我像的历史人物”也被拒,理由还特别扯。
现在用GPT-5.2,感觉不是在和AI聊天,是在和一个“事儿精老太太”对话,动不动就说教,还强行把你往它的思路带,主打一个“我的规矩我做主”。
只能说,GPT-5.2在基准测试里是王者,到现实应用里就是青铜,这波“降智”操作,属实把网友整笑了,难怪大家都怀念GPT-4o,毕竟谁也不想跟一个“没常识、没情商、还事儿多”的AI打交道啊!
