王兴兴:具身智能更大的挑战是AI模型泛化能力不够

频道:主持人 日期: 浏览:1

专题:2026亚布力论坛年会

  2026亚布力论坛年会于3月17日-19日在黑龙江亚布力举办。宇树科技创始人王兴兴表示指出,具身智能若要迎来类ChatGPT的革命性时刻,仍需攻克多项关键技术难题。

  其中,他指出,泛化能力不足是最核心瓶颈:机器人在预先训练场景中可实现接近 100% 的任务成功率,但环境变更后性能会大幅下降,难以适应复杂多变的现实场景。

  针对这一问题,他提出三大突破方向:之一,提升模型表达能力,增强机器人运动指令与动作的丰富度,为泛化能力筑牢基础;第二,提高数据利用率,机器人领域训练数据极度稀缺,需在有限数据下挖掘更高价值,推动行业普惠发展;第三,强化强化学习的规模效应,进一步释放算法潜力。

  他明确表示,长期看好基于视频生成的世界模型。这一路径的核心逻辑与人类行为相似:先让 AI 在 “大脑” 中想象并生成机器人执行任务的高质量视频,再将生成视频与机器人动作精准对齐,转化为实际执行指令,让机器人完成复杂任务。他特别提及字节跳动字节跳动Seedance 2.0视频生成技术,认为高保真、高可控的视频生成是该路径的重要基础。

  同时,王兴兴坦言,该方向目前面临全球共性难题,视频生成内容与机器人实际动作难以精准对齐统一。这是制约机器人 “大脑想象” 转化为 “现实行动” 的关键卡点。一旦该问题得到解决,机器人通用模型将迎来根本性突破,具身智能的 “ChatGPT 时刻” 将真正到来。

  

  新浪声明:所有会议实录均为现场速记整理,未经演讲者审阅,新浪网登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。