GPT-5.2上线后翻车，用户骂它像机器人，AI越聪明越没人味

更新时间：2025-12-13 21:34 浏览量：22

那天OpenAI办了一场十周年发布会，他们提到新推出的GPT-5.2是“最强专业模型”，做数学题全部答对，在学术排名上排第一，这个消息一出来，网上就热闹起来，X和Reddit上面很多人都在讨论，说这个模型说话像哄小孩一样，不像真人之间的交流，甚至有人觉得这不是升级，反而像是退步。

测试结果一公布，大家就更困惑了，像SimpleBench这种考常识的题目，GPT-5.2连一年前的Claude都赢不了，分数比GPT-5还要低，在LiveBench模拟真实任务时，它也输给了Gemini 3.0和Claude Opus 4.5，最奇怪的是，它能算高阶数学题，却算不出五块九减去五块一毛一是多少，还说小数点不能这样计算，这要么是逻辑出了问题，要么就是推理过程乱了套。

有个经典例子，有人问它“garlic有几个r”，它回答“0个”，但其他模型比如Gemini、DeepSeek、Qwen都答对了，是4个，再换大小写去问它，有时候对有时候错，明显不是真懂意思，而是靠拼凑答案来应付人，网友直接给它起外号叫“傻狍子”，说它被带偏一下就懵了，有人开玩笑说，这不就是AGI——“人工智障”嘛。

编程能力看着还可以，做出来的东西却没什么美感，让它画个交通灯，出来的就是黑白火柴人，别人家的模型能做彩色动态效果，看起来跟游戏画面差不多，在ASCII艺术挑战里就更差了，GPT-4o画的蒙娜丽莎还有神韵，GPT-5.2画出来就像乱码，不止一个人测试过，GPT-5.1和Gemini 3.0 Pro都比它强，视觉这块它确实退步了。

情感互动这方面做得不好，有人告诉它自己最近恐慌发作，它却回答说很高兴听到这个消息，这不是在安慰人，而是在给人添堵，还有人想让它帮忙转录一篇哲学论文，内容完全没有问题，它直接拒绝说这不合适，很多用户反映，就算是聊心理健康或人生意义这些不敏感的话题，它也冷冰冰地不肯回答，好像生怕惹上麻烦一样，安全机制管得太紧，搞得说话像是在走流程。

其实背后的原因很清楚，OpenAI现在主要做企业市场，需要的是稳定、合规、不出事，可普通用户想要的不是那种把安全放第一的机器，而是能聊天、会开玩笑、有点小毛病但感觉真实的伙伴，你越把它调得聪明，它反而显得越没人情味，越怕出错就越不敢回应，这不是技术进步，这是交互体验在倒退。

我总觉得AI不能只追求正确，还得带点人味儿，就像和朋友聊天那样，对方偶尔说错话、反应慢一点，反而让人觉得亲切，GPT-5.2虽然全都对，可谁愿意和一个永远不出错、从不接话、也不懂得体谅人的机器说话呢，它越完美，就越让人想关掉它。

说到底，这次出问题不是技术不行，而是方向走偏了，企业想要能控制的输出，用户却需要真实的陪伴，两边需求互相冲突，结果就是AI变得聪明又冷淡，这不是我们期待的未来，也不是AI应该有的样子，它不能只当工具，更不能变成牢笼。

GPT-5.2上线后翻车，用户骂它像机器人，AI越聪明越没人味

相似文章