温馨提示:本站为该正规票务导购网站,提供北京天桥艺术中心正规的购票信息展示。
你现在的位置:首页 > 演出资讯  > 演唱会

GPT-5.2上线后翻车,用户骂它像机器人,AI越聪明越没人味

更新时间:2025-12-13 21:34  浏览量:1

那天OpenAI办了一场十周年发布会,他们提到新推出的GPT-5.2是“最强专业模型”,做数学题全部答对,在学术排名上排第一,这个消息一出来,网上就热闹起来,X和Reddit上面很多人都在讨论,说这个模型说话像哄小孩一样,不像真人之间的交流,甚至有人觉得这不是升级,反而像是退步。

测试结果一公布,大家就更困惑了,像SimpleBench这种考常识的题目,GPT-5.2连一年前的Claude都赢不了,分数比GPT-5还要低,在LiveBench模拟真实任务时,它也输给了Gemini 3.0和Claude Opus 4.5,最奇怪的是,它能算高阶数学题,却算不出五块九减去五块一毛一是多少,还说小数点不能这样计算,这要么是逻辑出了问题,要么就是推理过程乱了套。

有个经典例子,有人问它“garlic有几个r”,它回答“0个”,但其他模型比如Gemini、DeepSeek、Qwen都答对了,是4个,再换大小写去问它,有时候对有时候错,明显不是真懂意思,而是靠拼凑答案来应付人,网友直接给它起外号叫“傻狍子”,说它被带偏一下就懵了,有人开玩笑说,这不就是AGI——“人工智障”嘛。

编程能力看着还可以,做出来的东西却没什么美感,让它画个交通灯,出来的就是黑白火柴人,别人家的模型能做彩色动态效果,看起来跟游戏画面差不多,在ASCII艺术挑战里就更差了,GPT-4o画的蒙娜丽莎还有神韵,GPT-5.2画出来就像乱码,不止一个人测试过,GPT-5.1和Gemini 3.0 Pro都比它强,视觉这块它确实退步了。

情感互动这方面做得不好,有人告诉它自己最近恐慌发作,它却回答说很高兴听到这个消息,这不是在安慰人,而是在给人添堵,还有人想让它帮忙转录一篇哲学论文,内容完全没有问题,它直接拒绝说这不合适,很多用户反映,就算是聊心理健康或人生意义这些不敏感的话题,它也冷冰冰地不肯回答,好像生怕惹上麻烦一样,安全机制管得太紧,搞得说话像是在走流程。

其实背后的原因很清楚,OpenAI现在主要做企业市场,需要的是稳定、合规、不出事,可普通用户想要的不是那种把安全放第一的机器,而是能聊天、会开玩笑、有点小毛病但感觉真实的伙伴,你越把它调得聪明,它反而显得越没人情味,越怕出错就越不敢回应,这不是技术进步,这是交互体验在倒退。

我总觉得AI不能只追求正确,还得带点人味儿,就像和朋友聊天那样,对方偶尔说错话、反应慢一点,反而让人觉得亲切,GPT-5.2虽然全都对,可谁愿意和一个永远不出错、从不接话、也不懂得体谅人的机器说话呢,它越完美,就越让人想关掉它。

说到底,这次出问题不是技术不行,而是方向走偏了,企业想要能控制的输出,用户却需要真实的陪伴,两边需求互相冲突,结果就是AI变得聪明又冷淡,这不是我们期待的未来,也不是AI应该有的样子,它不能只当工具,更不能变成牢笼。

场馆介绍
天桥艺术中心,最大的剧场1600个座位,可以承接大型歌舞晚会、音乐剧等;戏剧剧场有1000个座位,主要承接戏曲、儿童剧等;400个座位的小剧场则以上演话剧为主;此外,还有一个300个座位的多功能厅,可以进行小型演出... ... 更多介绍
场馆地图
北京市西城区天桥市场斜街
天桥艺术中心