一个GPT Plus会员的钱，够机器人跑一个月世界模型了-工信会

> 自媒体 > （AI）人工智能 > 一个GPT Plus会员的钱，够机器人跑一个月世界模型了

一个GPT Plus会员的钱，够机器人跑一个月世界模型了

来源：量子位

2026-06-14 12:57:50

91

管理

henry 发自凹非寺

量子位 | 公众号 QbitAI

真没想到啊！物理AI的账单，有一天竟然能和大模型一个价。

毕竟，视频跟文本孰大孰小，我还是分得清的。

不过，就在刚刚，具身世界模型的部署成本，被智在无界打下来了——

在机器人身上部署世界模型，一个月只要150块，相当于充个GPT Plus会员的钱。

而这，就来自他们最新发布的隐式世界模型产品Being-H-Flash。

在单台机器人每天扫码1000件快递的流水线场景中，Being-H-Flash月算力成本仅需150元。

相当于英伟达Cosmos方案的2%，甚至比VLA架构的Pi0.5还便宜70%。

更关键的是，它不只是便宜。

当其他显式世界模型还主要依赖云端部署时，Being-H-Flash已经直接跑进了机器人本体。

在类似Orin NX这样的百TOPS级端侧算力条件下，Being-H-Flash能实现接近20FPS实时运行，并且同时兼容国产AI芯片和英伟达平台部署。

（注：不同世界模型在训练级显卡、消费级显卡与端侧芯片上的推理速度对比，单位FPS，越大越好，x表示由于算力受限）

智在无界介绍，Being-H-Flash也是全球首个在端侧，甚至是百TOPS级芯片上实现实时运行的世界模型。

这是怎么做到的？

世界模型端侧开跑

要理解Being-H-Flash为什么能在100TOPS端侧芯片上实时运行，得先回到开头浅浅提到的两个概念：

显式世界模型和隐式世界模型。

过去一年，以VLA（Vision-Language-Action）为代表的具身模型不断刷新机器人的操作能力上限。

但与此同时，一个问题也越来越难以回避：在动态的真实世界里，单纯地看到场景、输出动作，往往并不够。

一旦涉及物体运动、遮挡、接触以及形变，机器人就必须考虑动作带来的后续影响。否则，一个看似正确的动作，可能从执行开始就已经注定失败。

因此，机器人不仅需要知道下一步该怎么做，还需要预判这样做之后会发生什么。

于是，能规划未来的世界模型开始成为具身新的演进方向，但世界模型内部，也有两条不同路线。

具体来说，一边是以英伟达Cosmos-Policy为代表的显式世界模型，它会先逐帧生成未来画面，再根据这些画面规划动作。

这样做的好处是能够直接建模未来的物理变化，但代价也很明显：未来画面需要逐帧生成，算力和延迟成本都很高。

而Being-H0.7所采用的隐式世界模型，则选择了另一条路线。

它不再生成未来画面，而是在多模态感知与动作生成之间构建一个潜空间（Latent Space），把当前观测、任务目标以及对未来状态的判断压缩到其中进行推演。

换句话说，它依然在预测未来，只是不再通过“画出来”的方式。

（注：Being-H-Flash产品矩阵，以隐式世界模型为基座，从aura，ventus到procella，逐级推进真实场景机器人的部署效率和性能）

就像开头说的，Being-H-procella已经完成英伟达与国产芯片双平台适配，并在国产百TOPS级端侧平台实现实用化部署。

这意味着，“国产世界模型国产芯片”第一次从产业愿景走向工程现实。

当端侧算力门槛降到百TOPS，当月度算力成本降到百元级，许多过去算不过账的场景，也开始有了规模化落地的可能。

仓储物流里高速变化的包裹，工业产线上不断调整的机械臂，以及商超和家庭环境中的柔性物体与连续操作任务，都开始进入世界模型的能力半径。

从Being-H0到Being-H0.7再到Being-H-Flash，智在无界用一年时间完成了隐式世界模型从提出到端侧部署的闭环。

而这或许也揭示了世界模型商业化真正重要的一件事——

决定它能否走出实验室的，从来不只是能力上限。

更重要的，是谁能先把它装进机器人、放进产线，再把成本打到产业愿意买单的位置。

至少从今天来看，世界模型终于开始算得过这笔账了。

One More Thing

最后来简单介绍一下， Being-H-Flash背后的团队——

BeingBeyond（智在无界）。

智在无界成立于2025年5月，是一支刚满一岁的团队。

创始人卢宗青，是北京大学计算机学院长聘副教授、智源学者，长期深耕强化学习。

在学术界，他较早提出利用大规模人类视频训练具身模型的方向，这也成为了智在无界后来技术路线的起点。

公司核心技术开发人员占比超过70%，博士学历占比近60%，主要来自北京大学、清华大学、中国人民大学、南洋理工大学、南加州大学等国内外知名高等院校。

过去一年，智在无界几乎保持着3-4个月一代模型的迭代速度。

从Being-H0的1000小时人类视频预训练，到H0.5扩展至1万小时，再到H0.7将训练规模提升至20万小时，这条技术路径始终围绕着同一个问题：

如何让机器人像人一样，通过观察世界来理解世界。

而今天发布的Being-H-Flash，则把这套能力第一次带进了百TOPS级端侧芯片。

从人类视频预训练，到隐式世界模型，再到端侧实时部署。

一年，四代模型，很具身。

— 完 —

量子位 QbitAI · 头条号签约

关注我们，第一时间获知前沿科技动态

0

点赞

赏礼

赏钱

0

收藏

免责声明：本文仅代表作者个人观点，与本站无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。凡本网注明 “来源：XXX（非本站）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。 QQ：617470285 邮箱：617470285@qq.com

黄仁勋：物理AI迎来ChatGPT时刻，机器人会干活，但解题成功率不到三成

宇树科技王兴兴：人形机器人今年年中跑赢人类，具身智能“ChatGPT时刻”还需2-3年

相关文章

阿里发布千问最强推理模型Qwen3-Max-Thinking，性能媲美GPT-5.2、Gemini 3 ..

阿里巴巴1月26日正式发布千问旗舰推理模型Qwen3-Max-Thinking，在多项权..

2026轻量API实测：GPT-5.5 Nano、Gemini 3.1 Flash、Haiku 4.5对比..

实测背景：业务倒逼模型选型降级上个月团队落地客服意图识别微服务，业务..

别再瞎折腾ChatGPT！3招让效率暴增8倍（建议收藏

你是不是也这样？打开ChatGPT，手放在键盘上想了半天，打出一句：“帮我..

GPT-4面对未知88%却在编造，不说不知道是设计层面的原因吗？..

2022年，一位资深律师用ChatGPT准备一份法庭文件。他让AI找到相关的过往..

GPT-5.5 和 GPT-4 差距到底有多大？一次偏实战的基准测试对比..

最近很多开发者和内容团队都在关注一个问题：如果 GPT-5.5 逐步进入应用..

中指数据 AI Agent发布!地产从业者的一站式智能解决方案..

中指数据 AI Agent，拥抱智能高效的地产工作新范式！以大数据 AI 深度赋..

港股AI决策第一股｜深演智能锚定Agentic Software长期价值..

2026年5月27日，深演智能（02723.HK）正式登陆港交所，上市首日股价大涨..

最强AI调解员弥合分歧仅1/3，KAIST测试为何戳破高分泡沫？..

假设你请了8位当前最强的AI来当调解员，让它们各自独立处理600场从真实公..

首周调用1万亿Token，Agnes免费全模态API为何引爆开发者圈？..

过去一年，任何一个深度使用AI的开发者都会告诉你同一件事：AI越来越贵了..

关于作者

兰花草(普通会员)

文章

2080

关注

0

粉丝

0

点击领取今天的签到奖励!

猜你喜欢

01

DeepSeek 究竟是个啥？一文带你看明白

2025/02/08

02

微信聊天时，女人说“哼哼”，10个高情商回复

2023/10/04

03

聊天交友软件常用骗局（套路）交友需小心！

2023/07/15

04

这怕是全网最强的 DeepSeek 图片教程吧，赶紧收藏了！

2025/02/09

05

AI 界黑马DeepSeek 超详细介绍

2025/02/09

标签云

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体113437

@2022 All Rights Reserved

浙ICP备19035174号-6 技术支持：千寻网络

0

0

分享

请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索