顾群业:解码人工智能艺术 构建中华传统工艺语料库
更新时间:2025-05-28 02:21 浏览量:1
齐鲁网·闪电新闻5月27日讯 日前,2025年人工智能大模型教育场景应用研讨会在青岛召开,山东工艺美术学院教务处处长顾群业作《人工智能大模型构建中华传统工艺语料库的探索与展望》报告。在此前的不同采访中,他曾多次提到“AI应用为艺术创作提供了源源不断的创新动力,开辟了生成艺术的新时代。在人工智能技术迅猛发展的当下,传统艺术与现代数据的融合,成为推动文化传承与创新的关键力量”,表达关于人工智能与 艺术的诸多思考。
全球人工智能的竞争已演变为一场博弈。高质量语料库的构建,成为决定技术走向的一个要素。有观点认为,全球高质量文本数据将在未来十年内消耗殆尽,AI大模型训练数据面临潜在的枯竭。在此趋势中,中国AI大模型的数量虽位居世界前列,但中文语料库的建设却面临挑战,主要表现为总量相对不足、整体质量有待提升,以及在价值导向上存在单一化倾向。据估计,中文语料的现有规模仅及英文语料的八分之一,开源数据集的质量参差不齐,能够充分反映和承载中华优秀传统文化与价值观的优质内容尤显不足。
与此同时,影像的功用也在经历一场转变——它们不仅仅是供人类观看的对象,而是日益成为机器算法赖以运作的“操作性工具”。顾群业教授指出,这一转变不仅内嵌了不易察觉的文化偏见,也以一种潜移默化的方式影响着人类的生活方式与社会结构。
这种转变的核心问题在于,人工智能系统依赖大规模数据集进行训练,而这些数据并非价值中立或纯粹客观,它们在筛选和标注过程中嵌入了人为的文化预设与偏见。顾群业认为,用于训练生成式AI(例如图像识别模型)的图像数据集,其筛选标准和构建过程往往由特定背景的群体(例如硅谷工程师文化)所主导。这种主导性在一定程度上决定了AI将如何“理解”并“看待”这个世界。例如,在进行年龄或情绪识别的任务时,若数据集中优先纳入的是特定区域人群的面孔或主流文化所认可的表情特征,那么AI在处理其他文化背景的图像时,其判断出现偏差的可能性便会增加。这种偏见并非偶然,它深植于数据采集、特征提取乃至数据标注的每一个环节:哪些数据被选中?它们又被如何定义和标记?这些选择都折射出其背后隐匿的价值观与某种程度的权力结构。
顾群业通过其构建中华传统工艺语料库的实践,对“技术中立”这一流行观点提出了挑战。他指出,AI所谓的“客观性”更像是一种需要审视的表象——数据集构建者的身份背景(例如,在一个以特定文化为主导的AI研发体系中),可能会潜移默化地强化其固有的文化视角。如果数据集中缺乏足够多元的面孔与文化表征,那么AI在诸如公共安全监控或劳动管理等应用场景中,便有可能产生歧视性的判断,进而对社会公平构成潜在威胁。因此,顾群业的核心关切直指问题的根本:我们需要持续追问,这些训练数据的来源究竟是什么?是谁在训练AI?AI最终又为谁服务?它所依据的,又是何种价值标准?这些追问,揭示了AI影像并非中性的技术工具,而是特定权力关系在数智时代的延伸与再现。
影像从人类观看转向机器操作的趋势,其影响更为深远。正如顾群业所论述,现代影像已从人类主观凝视的对象,转变为机器的“操作性影像”(此概念由哈伦·法罗基提出),即主要为算法分析而存在的像素阵列。这些影像的生成与运作甚至无需人类的直接干预,便能通过数据的流动产生切实的社会效应。例如,遍布我们生活空间的监控摄像头所捕捉的画面,可能被用于商场的人流统计算法,或是快递员工作时长的绩效考核。即便算法的判断有时显得不尽合理(比如错误地识别了行人的情绪或误判了年龄),它依然会深度嵌入到日常生活的各种基础设施之中,并带来真实的社会后果——可能是不公正的劳动管控,也可能是公共安全系统中的误判。我们似乎正被无处不在的摄像头所包围和定义:从社交媒体上的人脸认证,到课堂里的注意力监测系统,机器生成的视觉标签(如“悲伤”“专注”或“异常”)正在悄然塑造和固化个体的社会身份。值得注意的是,人类甚至可能开始主动去适应机器的视觉逻辑:外卖员被用于优化算法规划路径而在城市中奔波,构成了一种由算法驱动的新型城市景观。这种转变,在某种程度上将人类置于“机器视觉”的客体地位,我们感知世界的方式也因此被算法所影响。顾群业强调,问题的症结不在于AI判断的精确与否,而在于其作为一种管控工具的嵌入性——即便其判断是错误的,它依然能够产生真实且深远的社会影响。
面对上述挑战,顾群业教授的中华传统工艺语料库实践,提供了一条具有建设性的应对思路。他带领团队将传统工艺美术中蕴含的视觉元素——如图案纹饰、色彩搭配、器物形式等——进行系统性梳理,进而构建起一个根植于中华审美体系的语料库,用以训练AI模型。这不仅是一项技术层面的应用,更深层次看,它构成了一种对AI固有偏见的系统性反思与实践。顾群业说,谁筛选了数据,谁训练了AI,那么AI就具备谁的“世界观”和“价值观”。因此,通过向AI系统“喂养”中华传统工艺的数据,实际上是在引导AI“学习”中国文化中的造物哲学与多元审美范式,以此来平衡单一文化(尤其是某些主导性文化)形成的影响。设想一下,在训练AI进行图像识别或内容生成时,这个蕴含中国智慧的传统工艺语料库,能够补充全球数据集中缺失的多元文化视角,从而在一定程度上防止AI系统因数据偏差而产生歧视性输出。顾群业的实践揭示了AI决策背后潜藏的价值观博弈:机器并非中立的工具,它们是特定权力关系与文化取向的体现。通过他的努力,AI不再被动地复制和放大既有偏见,而是塑造成为承载文化多样性的媒介,呼应并延续人类文明对于多元理解与表达的需求。
然而,对此亦需进行批判性思考。例如,单一类型的特色语料库(即便是如中华传统工艺这样具有深厚底蕴的)其构建本身,是否足以从根本上扭转算法偏见的复杂趋势?在定义和筛选“中华传统工艺”或“中国价值观”时,如何避免自身陷入另一种形式的简化或固化,确保其内部的丰富性、多样性与历史流变性?这也是一个充满挑战的议题。
顾群业的探索最终指向了一个更为广阔的议题:在一个机器日益参与甚至重塑我们视觉认知方式的时代,积极构建和运用多元文化数据,不仅是守护人类理解世界多样性的一种防御性措施,更是主动塑造技术未来走向的积极行动。我们的城市空间早已密布着无数“机器之眼”——那些无处不在的监控摄像头,它们所产生的海量影像,其首要服务对象已然是算法而非人类的直接观看。倘若我们任由单一文化背景的数据集主导AI的训练过程,那么算法会在一定程度上加速全球化背景下的审美趋同,对宝贵的文化多样性构成侵蚀。反观顾群业的语料库实践,它提示我们,对技术的反思与建设性介入并不仅仅停留在工具层面,它更关乎文明的传承与人类精神世界的丰富性。
要真正实现这一愿景,尤其是在国家层面推动高质量、多样化语料库的建设与运营,无疑需要系统性的战略规划。例如,可以考虑在横向上打通数据从汇聚、治理到最终服务的完整链条,同时在纵向上构建起技术支撑、安全监管以及生态创新体系。一种可探讨的技术路径是采用“中心化与分布式相结合”的架构,比如设立一个中央平台负责元数据的统筹管理与标准制定,而具体的区域性或行业性节点则承担特定数据的运营与维护。至于运营模式,则可以探索“政府引导、专业机构市场化运作”相结合的路径,重点攻克数据确权、合理定价机制以及收益分配等长期存在的制度性难题。
在数据治理层面,挑战同样存在。不仅需要建立一个能够动态更新、涵盖多种模态的语料体系,还需要开发出高效的清洗与标注工具,以应对数十万亿token级别的海量数据处理需求。更为关键的是,必须着手构建一套科学、公正的中文数据质量评价标准体系,其中,对于可能存在的意识形态偏差、文化刻板印象等问题,进行重点筛查与纠偏。同时,在实践中积极探索合成数据与真实数据相结合的混合训练模式,力求在保持文化独特性的前提下,最大限度地提升数据的多样性与鲁棒性。只有通过打造包含预训练、精调、测试等全流程的高质量数据集,逐步形成具有自主知识产权的语料生态系统,我们才能为本土AI大模型注入中国智慧与文化基因,使其在全球智能领域中发挥其应有的作用。但在此过程中,也要警惕形成新的“中心化”或“单一化”,确保多元化的初衷得到贯彻。(文/李广福)
闪电新闻记者 李静怡 综合报道