博鳌论坛2026| 熊友军、王晓刚等：具身机器人何时能迎来“ChatGPT时刻”？-工信会

> 自媒体 > （AI）人工智能 > 博鳌论坛2026| 熊友军、王晓刚等：具身机器人何时能迎来“ChatGPT时刻”？

博鳌论坛2026| 熊友军、王晓刚等：具身机器人何时能迎来“ChatGPT时刻”？

来源：观察者网

2026-05-16 11:20:55

175

管理

洗衣做饭收拾房间，具身机器人何时能帮助人类做家务？何时能进入养老行业，提供生活照料和情感服务？比起花拳绣腿的炫技，具身机器人还能做哪些在我们看来更有价值的事情？

为展望人形机器人产业发展前景，2026年3月25日，海南博鳌，博鳌亚洲论坛2026年年会就相关话题举行“人形机器人的进阶与飞跃”分论坛。

会上，北京人形机器人创新中心CEO熊友军；商汤联合创始人、执行董事、大晓机器人董事长王晓刚；清华大学苏世民书院院长、人工智能国际治理研究院院长薛澜等知名专家学者围绕具身智能研究范式、家庭场景落地路径、技术创新与标准建设展开深入探讨。

【整理/ 唐晓甫】

薛澜：首先请问北京人形机器人创新中心的熊总，未来人形机器人的高质量发展有哪些新的趋势，哪些行业是人形机器人下一个风口？

薛澜(清华大学苏世民书院院长、人工智能国际治理研究院院长) 博鳌亚洲论坛

熊友军：非常好的问题，我想从技术发展、产品发展和产业应用三个方面来讲。

从技术发展的角度来看，当前人形机器人其实分了三个技术维度，机器人本体、机器人小脑、机器人大脑。本体外形方面相对来说是逐步趋向于收敛，这两年随着大模型的进步，运动控制能力也在快速进步，大脑方面现在有一个非常明显的趋势，就是小脑在协同进化，但是也出现了非常多的技术发展范式，比如说像世界语言行为大模型分层控制的方式，还有多模态大模型和VLA协同发展。另一个重要趋势是，世界模型与通用大模型正走向融合统一，并以此作为机器人的“大脑”加速发展。整体来看，机器人的大脑与小脑协同进化特征已十分显著。

第二个方面是产品发展趋势。现在人形机器人产业在整机与核心零部件领域正快速迭代升级，国产化、规模化发展态势尤为突出。去年，工信部已经牵头组建行业标准化委员会，对人形机器人上下游产业链标准进行系统梳理并面向行业发布。这是一个非常好的趋势，可以帮助行业从以往高度定制化模式，加速走向成熟的产业链协同方向发展。

如今，已经有大量零部件企业正与整机厂商、系统集成商深化合作，形成集团化协同发展模式，这样可以有效降低研发与生产成本。通过上下游联合攻关核心零部件实现共同进步，进一步提升产品可靠性、稳定性与标准化水平，持续降低行业准入门槛与应用成本。

第三个趋势是人形机器人正从技术炫技走向实用化，从专用场景迈向通用领域。过去的人形机器人更多的是偏向于表演式炫技，如今它们已深度切入产业实际应用，服务国民经济主战场与重点行业场景。

另外在泛工业领域，人形机器人正加速向汽车、家电制造，以及搬运、分拣、物流等环节渗透。未来，我们认为人形机器人的价值可能不止于完成简单重复的作业，更有望率先落地涉及生命健康、存在作业风险或不利于人体健康的高危场景，替代人工开展工作。随着技术持续成熟，人形机器人能做的事情会越来越多，也会逐步渗透不同的场景和用户。

王晓刚：刚才熊总提到的机器人大脑，其实行业对机器人通用智能的期待也是来自大模型。大家都希望将ChatGPT这类大模型放在机器人身上，使其具备更强的通用能力。但过去几年，大模型发展长期受限于数据瓶颈。以往机器人数据多依靠人工遥控采集，效率极低，过去几年累计仅约十万小时量级。对比来看，自动驾驶领域的特斯拉，其FSD技术路线依托海量数据以及世界模型的仿真加持，单日训练经验便相当于人类四百万小时的驾驶经验，两者数据差距极为悬殊。

当前行业的一个重要趋势是，机器人数据采集正从真机操控采集，转向通过人体穿戴传感器设备，在真实生产生活场景中捕捉人类行为，以此训练大模型与世界模型。这样，不仅可以让机器人实现跨本体训练，还能让机器人行为更贴近人类。此前网上一段机器人整理房间的视频便很有代表性：机器人双手被占用时，会主动将毛巾搭在肩上，用手臂夹起水桶。这些都不是人预先定义的行为，而是从人类行为中自主学习而来，这是数据层面的重要突破。

还有很重要的一点是，OpenClaw 问世之后，为人形机器人赋予了自我进化的能力。机器人本身具备大量基础能力，一个机控平台就可管控多台机器人；而龙虾模型具备自我调用、自我反思与记忆能力，能够实现从单机具身智能到群体协同的转变，让机器人在环境探索与操作执行中不断变得更智能，也推动我们的数字员工走向物理执行层面，这是一个十分重要的发展趋势。

其一是对机器人的能力要求极高。在工业场景中机器人需要达到非常高的节拍效率，非常高的成功率，甚至99%以上，包括很高的可靠性，这是实打实要用的，真正要把它做成一个工业级稳定的产品，不只是单次能完成某项任务，而且要能够可靠、持续地完成，且实现低成本落地，每一项都很困难，这也要求我们的能力是全栈的。

这就要求机器人能力实现体系化升级，从大脑能力能实时进行感知反馈和快速决策，到小脑控制，再到底层硬件本体，本体包括本体零部件、关节体系化供应，所以我们必须把机器人从单机能力上升成系统化能力。这里也包括刚才晓刚总提到数据的平台。

第二个制约规模化应用的因素，是泛化能力。目前我们距离机器人的 “ChatGPT 时刻” 还有一段距离。我之所以认为现在还没到大规模进入家庭的阶段，最大的卡点就在于模型的泛化性。每个家庭的环境、布局都千差万别，我们没有足够的资源、时间，也没有客户的耐心，去在每个家庭单独采集数据、单独训练模型。这就要求我们的模型具备像 ChatGPT一样的泛化能力，能够适配全新环境，接收到任意指令即可实现零样本泛化，无需任何新的采集数据，零训练就可以去部署，这就是我们家庭应用的终极目标。

虽然目前还有一定差距，但是我想告诉大家这个时间不会太长，我认为五到十年内，至少能够看到非常好的效果。当然在机器人版的ChatGPT出现之前，也不妨碍我们能在工业等场景去应用，因为工业场景是完全垂直标准化的，我们可以投入一定的力量在当前模型的基础之上，投入一定的数据和算力，把一些关键环节给打通，而一个环节就可以标准化复制到上万或者是数十万个场景。

薛澜：建宇刚才给了一个估计。我想顺便问一下其他几位产业界的老总，你们觉得人形机器人的ChatGPT时刻还有几年？

王晓刚：我们刚才聊到了数据量的问题，目前行业内的数据大概在10万小时这个量级。去年我们提出了环境式速采的方案，目标是在未来两年，也就是到2027年，将数据量提升到1000万小时的量级。在此基础上，再通过一些技术加持，数据量有望达到上亿小时的级别，到那个时候，才能真正迎来人形机器人的ChatGPT时刻，所以我们判断大概需要两年时间。

邵浩：我们在工业界做手机很多年，结合过往经验来看，我们觉得人形机器人的ChatGPT时刻会更久一些。大家可以想一下，AI领域的ChatGPT时刻是怎么来的？从2012年深度学习开始兴起，直到2019年ChatGPT时刻才真正出现，这中间最关键的变化就是数据层面的突破。

本文系观察者网独家稿件，文章内容纯属作者个人观点，不代表平台观点，未经授权，不得转载，否则将追究法律责任。关注观察者网微信guanchacn，每日阅读趣味文章。

赏礼

赏钱

免责声明：本文仅代表作者个人观点，与本站无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。凡本网注明 “来源：XXX（非本站）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。 QQ：617470285 邮箱：617470285@qq.com

商汤联合创始人王晓刚：人形机器人的“ChatGPT时刻”还需要两年

1个月前

美国：ChatGPT被指为佛州枪击案“帮凶” OpenAI再遭起诉

1个月前