马斯克为何点赞王力宏演唱会机器人?
更新时间:2025-12-24 16:37 浏览量:2
前言:后空翻好啊,机器人得学啊!真机器人必会韦伯斯特!人形机器人下半场的竞争胜负手?如果把 2025 年的人形机器人热潮只理解为“更强的电机、更贵的传感器”,很容易错过真正的拐点:决定机器人能不能在真实世界稳定工作、能不能把动作做到又快又准又安全的,正在从传统的“手写控制链路”,迁移到以强化学习/模仿学习为核心的端到端“小脑模型”——并且,这条路线开始被开源、被工程化、被芯片化,进入可复用、可量产的产业节奏。 换句话说,机器人行业正出现一条越来越清晰的分工:上层“大脑”负责理解与规划,下层“小脑”负责高频、低延迟、确定性的运动执行。这个架构不是新概念,但端到端模型的成熟让“小脑”第一次从“控制器”变成了“可训练、可迁移、可持续进化”的能力底座。
为什么马斯克要点赞宇树跳舞机器人?2025年12月,王力宏成都“Best Place Tour”演唱会的一段画面在网上公布,将宇树人形机器人再次推上热搜:宇树G1作为伴舞登台,完成了一场专业的街舞表演,并在舞台上做出高难度的后空翻(部分报道将其描述为“韦伯斯特”空翻)动作。引爆舆论热点的另一个事件则是——马斯克随后在社交媒体上点赞并转发相关内容,这进一步让这段演出出圈,迅速变成跨圈层的技术话题。 很多评论者通过这段画面和马斯克的点赞,意识到人形机器人在2025年又经历了巨大的进步。它让外界第一次以更直观的方式看到——人形机器人在动态控制上能走到什么程度,以及这种能力在可控环境里如何被包装成可传播的成果。 不过,外行看热闹,内行看门道。如果仅仅看到宇树G1动作流畅娴熟的舞蹈动作,感慨一下宇树机器人相比2025年央视春晚时期的秧歌舞表演“又厉害了”,人类又要“失业”了,那显然还达不到我们尊贵的与非网读者的专业要求。那么马斯克究竟在“点赞”什么? 笔者的解答是:人形机器人正迎来一个新的“iphone时刻”——人形机器人要从舞台走向工厂、仓储、园区、家庭,在从“能演”走向“能用”的过程中,人形机器人的什么能力必须被工程化、标准化、可复制?大脑与小脑如何分工,实时系统怎样保证确定性,冗余与失效保护要做到什么级别,芯片/系统软件/控制算法各自该承担哪些边界责任? 当热度退去,这些问题会留下来——也将决定人形机器人下一阶段的竞争,是谁能在更复杂、更随机的环境里,持续输出稳定、可预测的运动与交互表现。
技术进展:端到端“小脑模型”到底进步在哪?众所周知,人类有大脑和小脑。 在人类神经系统里,大脑偏“认知与规划”,小脑偏“运动控制与平衡”。类比到机器人,“小脑”也常被用来指向运动控制层,但市场上对“小脑模型”主要有两种说法:一类是功能隐喻,强调它在系统中的角色——实时、低延迟、高精度地闭环控制;另一类是算法实现,强调是否在芯片/系统中实现更接近生物小脑学习机制的模型(如 SNN 等)。前者更多是控制系统工程能力,后者更偏类脑计算形态。 我们可以把人形机器人的“小脑进化”,归结为三条主线:控制方式变化、仿真到现实的迁移、以及平台化基座能力。 第一,控制方式从“预编程”走向“在线学习/端到端策略”。传统控制依赖动力学建模与固定轨迹,在不确定环境下容易显得僵硬。比如2025年初春晚机器人的扭秧歌,虽然整齐划一,但略显笨拙。这个阶段就是典型的预编程模式。 到了“在线学习/端到端策略”,由于采用了AI大模型驱动,用强化学习(RL)在仿真中大规模试错,找到工程师未必能手工设计的动作序列;再用模仿学习(IL)让动作更自然、更像人。这类策略之所以被称为“小脑”,本质在于更接近“运动本能”:输入来自传感器与状态,输出是可执行的动作/力矩/目标指令,强调快速闭环与稳定落地。 第二,仿真到现实的迁移。Sim2Real 跨过“现实鸿沟”,才谈得上上岗。仿真训练能降成本、降风险,但真实世界中的摩擦差异、地面材质、装配误差、温度漂移等都会让策略失效。2025 年人形机器人的重要进步在于通过领域随机化、自适应等方法增强 Sim2Real,使仿真策略迁移到真机后仍保持鲁棒性。这也解释了为何越来越多公司强调“数据引擎”和“世界模型”:短期优化 VLA 与动作建模;长期走向更完整的 WorldModel,并结合自我博弈与强化学习;而“真正的世界模型”必须覆盖摩擦、动力学、材料、天气、风阻等物理属性,而不仅是视觉纹理与几何。 在日前举行的地平线2025技术生态日上,地平线发布了具身智能的大脑、小脑基座模型HoloMotion和HoloBrain(关于大脑模型我们会在以后分析) 第三,“小脑基座模型”出现,让运动能力从“项目”变成“平台”。以地平线在日前推出的具身智能开源模型HoloMotion 为例,该模型在开源后一个月内获得较高关注,下载来源覆盖多个全球顶级机构,其 GitHub 项目也将自身定位为覆盖数据、训练、评估到部署的端到端工作流。由此可见,运动能力的竞争正在向“大模型式”的系统战演进:比拼的不只是单点算法,而是“基座模型 + 数据 + 工具链 + 工程化部署”的整体能力。 HoloMotion是一个支持单个策略,能做出任意动作,并且能够支持任意指令,任意地形的本体,它在地平线的计算平台S100、S600上面去运行Transformer、MOE、Mixture of Experts的一个架构,还可以实现高达50赫兹高帧率完美地运行。端到端“小脑模型”主要供应商:从“算力竞赛”转向“交付形态竞赛”具身机器人“小脑/大小脑”路线对比,来源:与非研究院整理 据了解,目前端到端“小脑模型”的供应商主要四个路线,其差异本质不在“谁算得更快”,而在“把小脑这件事交付成什么形态”。其中,地平线更像把运动控制能力做成可迁移的基座资产:不仅给模型,还强调训练框架、部署配方与统一评测,让生态围绕同一套方法论沉淀数据与对齐指标,减少各团队重复造轮子;HoloMotion 的端到端流程覆盖数据到 ROS2 部署,也在强化这种“配方化交付”的产品形态。 黑芝麻智能走的是更工程、更量产的路径:用“硬件隔离 + 分时 OS”把实时控制任务锁在安全区域,同时让 AI 计算并行运行。对要进工厂、要进入人机共存场景的机器人来说,决定能否量产的往往不是某次 demo 的动作上限,而是延迟、抖动、故障模式是否可预期、可验证——也就是“最坏情况”的确定性。 英伟达则把大小脑问题平台化:Jetson Thor 面向 Physical AI,Isaac 提供端到端开发栈,并明确将 Thor 与 Isaac GR00T 等基础模型深度绑定。换句话说,它卖的不只是算力,而是“仿真—数据—训练—部署”的生产线;一旦端到端模型成为主流,机器人公司会越来越依赖这种全栈平台,而不是单买一颗芯片。 至于 RK3588/英特尔等“通用平台 + 异构”的现实主义组合,价值在于低门槛试错:先把闭环跑起来、快速迭代策略与工程,再决定是否走向专用化与高度集成。短期它会持续存在,但长期会被两股力量挤压:一是量产对确定性/安全的硬要求(更像黑芝麻的方向),二是端到端时代对数据与工具链的系统性依赖(更像英伟达/地平线的平台化方向)。小脑“工程化”对人形机器人产业的意义?2025年,人形机器人从“能走能跳”的演示,开始走向更难的目标:在非结构化环境里稳定行走、灵巧操作、与人协作。这背后最现实的矛盾是计算分工:一边要跑视觉/语言/决策等“大模型”(偏吞吐、偏并行),一边要以高频率闭环控制几十个关节(偏实时、偏确定性)。其中大脑负责感知与规划,小脑把高层意图“解码”为高频、实时的关节控制信号,并处理动力学、平衡与扰动,应对端到端控制落地时“物理世界最后一厘米”的难题。 此次王力宏演唱会上,宇树机器人展示的就是“小脑工程化”的能力,把“运动控制能力”从项目制、手工调参、强耦合的代码堆里抽出来,做成可复用、可交付、可评测的系统资产。。而在英伟达、地平线、黑芝麻、英特尔、瑞芯微等芯片厂商的努力下,这种“小脑工程化”能力正在普及。 它至少会带来对人形机器人产业带来四个层面的变化: 第一,把“运动能力”变成可迁移的基座资产,降低重复造轮子。以地平线为例,资料中明确其发布面向机器人的小脑基座模型 HoloMotion,并强调其可在计算平台上运行 Transformer/MoE 等架构,且以高帧率运行;同时与具身大脑基座模型 HoloBrain配套,提供训练框架与“训练后部署的完整配方”。 这类“模型 + 训练框架 + 部署配方”的组合,实际上把运动控制从“算法论文”拉到“工程交付物”:团队更容易在统一框架下复现能力、对齐数据口径、做迭代评测,而不是每家都从底层控制栈重新搭一遍。 第二,把实时性与安全性“硬化”,让小脑成为确定性系统。黑芝麻智能 C1236 的路径更偏工程系统:资料强调其通过“分时操作系统 + 硬件隔离”把资源严格划分——实时运动控制任务获得独占资源,非实时任务在另一侧运行,从而降低延迟与抖动,并在非实时部分故障时仍保证底层控制稳定,构成功能安全的基础。 这类工程化的价值在于:它不追求“把一切都交给端到端网络”,而是先把可预测、可验证、可隔离的控制域建立起来,给上层大模型留出试错空间,同时把“摔倒/失控”这类物理风险压到系统边界内。 第三,为端到端控制范式落地搭桥,明确“谁输出、谁兜底”。端到端模型并未淘汰“大脑-小脑”架构,反而让分工更清晰:大脑运行端到端 VLA 等模型输出中间表示或高级动作指令,小脑仍要把这些指令转为高频控制,并应对动力学与扰动;因此对高性能小脑(芯片/控制器/实时OS)的需求“空前迫切”。 这意味着产业竞争点会从“峰值算力”外溢到更细的工程指标:控制回路延迟、抖动、多轴同步精度、在规定频率下可跑的控制算法复杂度等——这些往往比TOPS更决定机器人是否“顺滑、稳、敢上场”。 第四,推动标准化与生态重心迁移:从硬件单点到“软件栈/基准/中间件”。从未来趋势来看,小脑技术可能从“功能隐喻”走向更深的算法实现(如SNN等);专用小脑芯片与一体化SoC路线将并存;更关键的是,连接大脑与小脑的软件栈、实时操作系统与中间件的重要性上升,同时行业可能建立标准化接口与性能基准测试来促进健康竞争。 换句话说,“小脑工程化”会把竞赛从“谁家能跑”推向“谁家更好集成、更好验证、更可复现”,最后沉淀为工程师可依赖的工具链与评测体系。下一阶段,“可交付能力”成为胜负手总结来看,具身智能仍处在相对早期阶段:短期优化 VLA 与动作建模;长期要啃世界模型、强化学习、自我博弈与终身学习这些更硬的骨头。 但产业层面的确定性正在增加:端到端“小脑模型”已经从概念走向工程化,供应商路线从“模型开源”到“芯片固化”全面展开。这意味着,人形机器人离“在真实世界可持续工作”又近了一步——也意味着下一轮竞争,会更像一场关于架构、数据引擎、工具链与安全可信的系统战,而不只是一次舞台上的“动作秀”。 当小脑被工程化之后,人形机器人的产业推进方式会更像汽车:能力不再靠单点天才调参,而靠平台化资产、可复现配方与标准化评测持续迭代。短期看,它让“稳定与安全”成为可交付件;中期看,它让运动能力可迁移、可规模化复制;长期看,谁能把小脑做成可验证的确定性系统,同时把大脑的端到端能力接得足够顺,谁就更可能在真实场景里拿到规模化落地的门票。