当下年轻人为什么越来越喜欢用AI解说辅助逛艺术展
更新时间:2026-01-22 17:24 浏览量:2
最近几年,看展越来越流行,从博物馆到美术馆,从常设展到主题展,看展成为了了解城市历史文化的窗口,也成为了普通人茶余饭后的消遣。
但说实话,我是个没什么艺术细胞的人。逛博物馆还能说是在学历史,但逛艺术展我就真的无能为力了,大部分时候我就是给媳妇儿拍照的工具人,或者配合摆拍的打卡搭子。
原因在于,艺术鉴赏本身是有门槛的,我们当然可以从艺术品中感受到精致和美,但想要深入解读艺术品背后的历史、工艺、作者、故事,要做的功课太多了。
艺术和大众之间隔着一条鸿沟,一边是曲高和寡的艺术圈,另一边是拍照打卡的观众。
去年就有朋友开始用 AI 看展,当时我没太重视,因为我觉得如果只是简单地搜集网络信息,那和在现场看展签、听导览也没太大区别,AI 还可能会有「一本正经胡说八道」的幻觉问题。
但最近,豆包和浦东美术馆搞了一场合作,让我看到了 AI 时代,艺术民主化的另一种可能。
豆包:手机里的「看展搭子」
浦美最近有两场重磅展览,一个是《图案的契机:卢浮宫印度、伊朗与奥斯曼的艺术杰作》,另一个是《非常毕加索:保罗·史密斯的新视角》,前者是卢浮宫的上海首展,也是卢浮宫在国内举办的所有展览中规模最大的一次,后者则是国际巡展的第一站,也是国内唯一一站。
过去,很多人逛展都是两眼一抹黑地直接进去,或者自己花费大量时间做攻略,现在有了看展搭子,豆包可以在看展前就帮我们规划看展路线。
豆包能根据我们提出的需要,给出路线建议,列出核心作品,说明它们为什么重要,这就能帮助我们利用好有限的时间精力,在展厅中快速抓住重点。
真正的核心体验在看展的过程中,只需要打开豆包的语音通话,把摄像头对准展品,就能得到个性化、交互式的讲解,解决过去看展时「看不懂、不敢问」的问题。
比如毕加索的名作《阅读》,放在以前,我可能只会大概了解一下创作背景,然后嘴上说着高雅艺术,心里想着「抽象、看不懂」,去看下一幅画。
https://www.zhihu.com/video/1997394881174336879
现在,我可以把摄像头对准这幅画,让豆包「介绍一下这幅画」。
豆包先是给出了中规中矩的标准答案「这是毕加索在 1932 年奇迹之年创作的《阅读》,画中是他的爱人特蕾莎…」,和展签上的信息差不多。
但是接下来,我开始追问豆包:「为什么这个女人的脸,看上去既是正面,又是侧面?」
豆包就会详细解释「这是毕加索的立体主义手法,在二维平面展现三维空间,把不同视角的观察结果呈现在一幅画里……」
想要了解更多信息,还能一直问下去,从时代背景到人物关系,从色彩构图到情感处理…
几轮问答下来,我对这幅画的理解,已经远远超过了「一个女人在看书」的层面。
在这个过程中,AI 的反应速度很快,回答内容也很准确,它能很好地理解上下文,我的每一个追问都是建立在前一个回答的基础上,它都能接得住。这种体验,真的很像身边有一个懂艺术史的朋友在陪你聊天。
用户体验背后的技术破题
好的用户体验背后,需要专业的技术支撑。豆包如何优化艺术看展场景下的体验?
首先要解决的核心问题就是「准确性」,这也是所有 AI 工具落地的生死线。
作为泛知识类应用,文博艺术场景对准确性的要求是很高的。艺术品文物背后有着历史和知识体系,很多不同时期、不同地域的艺术品,外观可能高度相似,如果从一开始认错了展品,或者讲错了信息,问题就很严重。
在这次卢浮宫特展里,就有一个这样的例子。
一件伊朗 15 世纪的《牡丹纹盘》,在纹样、器型和青花发色上,和中国明代永乐年间的青花牡丹纹盘极为相似。
(左:伊朗 15 世纪《牡丹纹盘》,右:明代永乐年间青花牡丹纹盘)
如果一个通用大模型只靠公开网络数据学习,很可能就会把它俩搞混。要准确区分,模型不仅要具备像素级的视觉识别能力,还需要专业知识库作为后盾。
豆包之所以能提供相对靠谱的讲解,靠的是是「 独家数据合作 + 定向搜索优化 」。
浦东美术馆把关于展品最权威、最准确的官方资料库交给了豆包。豆包在回答问题时,会优先从官方的、经过资料的知识库里寻找和组织答案,这样就能在很大程度上保证知识源头的准确性。
还有一点,就是交互体验。
豆包在看展过程中的体验丝滑流畅,来自于「视频通话」功能。过去的聊天交互,用户需要拍一张、发一张,等 AI 答一句,这个过程经常中断。
得益于字节自研的 Seed 1.8 多模态视觉模型,豆包基于视频流的理解能力,可以处理连续的图像输入,就像真的有一个朋友在跟着你的手机镜头一起看展一样,当你移动手机,从局部到整体,到一件展品转向另一件时,豆包能实时、连续地理解场景变化。
这种「指哪讲哪」的实时交互,才是「看展搭子」能够成立的技术基础。没有连续的视频理解,这种「对话感」就会大打折扣,退化成效率低下的「拍照搜图」。
AI 正在加快「艺术的民主化」
过去,聊起艺术的民主化,绕不开文化评论家 Walter Benjamin 的《机械复制时代的艺术作品》,他认为,随着摄影等技术用无穷多的副本取代此时此地的原作,艺术将实现民主化、大众化。
但复制品解决的只是「看见」的问题,并没有解决「看懂」的问题。
现在,豆包做的并不是简单的「复制」艺术品,而是更深层次的「翻译」,它把原属于策展人、艺术学者和专业爱好者的知识,转化成普通人可以随时随地用大白话交流的服务。
在这里, AI 扮演了「科技平权、知识普惠」的工具 ,让知识的传递不再依赖于少数专家,不再受制于消费能力,变成一种个性化的供给,去满足那些过去只是有点好奇、随便看看的入门级观众。
AI 通过大幅降低了艺术欣赏的门槛,把更多以前觉得有门槛,或者对艺术不感兴趣的人拉了进来,其实是做大了知识服务的增量蛋糕,满足了更多普通人的文化需求,给他们种下文化消费的种子。
豆包此前也已经和国博、中钱博和几大省博共同上线了「豆包带你逛懂博物馆」项目,打造数字化看展体验,帮助大家读懂文物背后的文化。
而且这个模式,绝不只适用于博物馆、美术馆,未来有可能会成为新的文旅模式,嵌入到历史遗迹、名胜古刹,甚至是 Citywalk 的场景。
这还只是导览讲解,再搭配上豆包的图像生成能力,观众可以和艺术品互动,提取画作的风格、元素,现场生成图片、定制文创礼品,成为新的打卡方式。
这种从「看见」到「看懂」,再到「创作」的交互闭环,将给文旅产业数字化的转型和体验升级,带来巨大的想象空间。
小结
回到最初的问题,AI,是一个好的「看展搭子」吗?
在我看来,AI 是非常好的入门搭子,它虽然不能让你速成艺术鉴赏专家,但它的确能让你有勇气、有兴趣在艺术的世界里多停留一会,多问出一些「是什么、为什么」。
AI 把更多被动的、走马观花的旁观者,变成了主动的、积极交互的参与者。
技术真正的价值,不在于它本身多么复杂、多么强大,而在于它是否真正解决了普通人生活中的一个哪怕微小、但却真实存在的需求。
从这个角度看,豆包这次在浦美做的事情很有意义,它并不是让艺术变得廉价,而是带给更多人深度体验,赋予更多普通人探索艺术的自由与可能。
