“ 2025年4月19日,全球首个人形机器人半程马拉松在北京亦庄成功举办,吸引了来自全国各地的20支人形机器人参赛队和9000余名人类跑者共同参与。这场赛事不仅是机器人技术的一次集中展示,更是人形机器人产业发展的里程碑事件,标志着人形机器人正逐步从实验室走向实际应用场景。”
参赛队伍来自北京、上海、广州、苏州等地,包括20余家顶尖企业和高校团队。参赛机器人形态各异,既有身高达到1.8米、威武矫健的"大高个",也有仅1.2米高、惹人喜爱的"小萌娃",为现场观众呈现了一场别开生面的科技盛宴。不过这场科技盛宴的背后,人形机器人展现出的突破性运动控制能力固然令人瞩目,但也同时揭示了产业深层的隐痛—— 数据荒漠正成为制约人形机器人进化的最大瓶颈。
人形机器人能够在复杂环境中完成高难度动作,如翻跟头和跑马拉松,但仍然面临许多挑战,尤其是在执行日常任务如端茶倒水时显得力不从心。
举个例子:春晚机器人整齐划一的动作,本质是提前编程的“标准答案”,依赖舞台定位标记完成固定套路,但现实中,晃动的桌子、倾斜的茶杯、蒸汽等意外情况远超程序预设,如同让背熟课本的学生突然应对辩论赛,瞬间“卡壳”,机器人抓杯子需辨别材质(玻璃/纸杯)、预判手抖动作、应对蒸汽遮挡摄像头,这些人类本能反应需从零学习——既要计算力度,又要模拟情感互动,还得实时处理环境干扰,相当于同时解物理、数学和逻辑题。
与语言大模型依赖互联网海量文本不同,人形机器人需要复杂的多模态数据(视觉、运动、触觉)。而这些数据的稀缺性与采集成本远超想象。当前具身智能领域仍处于“GPT-1到GPT-2过渡阶段”,基础物理世界数据极度匮乏。以特斯拉Optimus为例,其训练需求是自动驾驶的10倍。成本与技术门槛 :真实环境交互数据需遥操作人员穿戴动捕设备手把手示教,单工位需配置完整机器人+专业设备,成本超百万元;虚拟仿真数据虽能部分替代,但柔性物体交互等复杂场景仍难模拟;标准化缺失 :国内厂商数据管理各自为政,采集格式、标注方法不统一,导致数据复用率不足30%,重复标注浪费超40%研发资源 。
开源数据集共建 :智元机器人开源百万真机数据集AgiBot World,谷歌DeepMind联合21家机构发布Open X-Embodiment数据集(100万条演示轨迹),试图填补空白 。
合成数据技术突破 :英伟达推出Cosmos世界基础模型,通过生成符合物理规律的三维空间数据降低采集成本,但商业落地仍需3-5年验证期 。人形机器人需至少3-5年积累千万级高质量数据才能实现端到端智能。科技投资领域的“卖铲人”法则再次应验,人形机器人产业已进入“数据驱动进化”阶段,动作捕捉设备作为训练数据的核心采集工具,成为产业链中确定性最高的价值锚点。这场马拉松赛事不仅是技术展示,更是对数据基础设施的紧急呼唤—— 谁能率先突破数据荒漠,谁将定义人形机器人的未来形态 。部分券商观点
高盛:看空短期商业化进程,认为技术拐点未至。报告指出,人形机器人训练数据量仅为大模型的万分之一,且存在“仿真与现实差距”“运动轨迹毒性”等问题。预计2027年全球出货量仅7.6万台,远低于市场预期,建议优先关注谐波减速器、伺服电机等核心零部件厂商。建议关注行业硬件降本进展和应用场景实际落地节奏。长期来看,大模型+具身智能或成为人形机器人胜负手,建议关注具身智能领先的人形机器人本体厂商及其产业链。认为人形机器人行业在2025年将迎来量产关键节点,国际巨头(如特斯拉)的技术突破与商业化进展将加速产业链成熟。国内厂商通过差异化技术路径(如灵巧手、消费场景)参与竞争,供应链中高确定性环节(减速器、执行器)是短期投资重点。需关注后续技术拐点验证及政策支持力度。认为人形机器人行业在2025年将进入量产元年,硬件降本(如减速器、电机驱动器)与传感器技术突破(六维力矩、柔性触觉)是核心驱动力。国内厂商在部分环节(如谐波减速器、空心杯电机)已实现技术突破,但需警惕制造业需求波动及技术迭代风险。建议关注具备技术壁垒的供应链环节。