获上亿顶级美元融资,GPT-4核心贡献者姜旭,归国押注具身智能预训练新路径
> 曾深度参与GPT-4与InstructGPT核心研发的姜旭,在2024年选择离开OpenAI,于深圳创立亮源新创(Light Origins)。他将大语言模型的成功经验——规模化预训练——视为解锁具身智能的关键,这一路径正挑战着行业依赖真机数据对齐的主流做法。## 从OpenAI到深圳:一位核心贡献者的技术迁徙姜旭是少数完整经历OpenAI大模型爆发关键阶段的华人技术专家之一。2019年至2023年间,他的工作横跨底层训练架构、大规模预训练、以及奠定ChatGPT对话能力的**RLHF对齐算法**。他不仅是GPT-4技术报告的核心贡献者,也是InstructGPT的主要作者。在OpenAI期间,他主导了**FP8(8比特浮点数)训练技术**的探索,并说服英伟达从H100系列开始原生支持该技术,这后来成为前沿大模型训练的标配。这些经历为他提供了从“知识压缩”到“对齐”的完整大模型方法论视角。## 预训练优先:一条反共识的技术路径姜旭对当前具身智能发展提出了尖锐批评。他认为,许多公司正在重复自然语言处理早期的弯路。> “大部分公司都在走弯路。具身智能正在经历自己的bitter lessons,大部分公司正在重复NLP当年的弯路,都聚焦在了知识提取这一步,跳过了预训练,直接在做对齐。”在他看来,受限于采集成本与场景覆盖,真机数据更适合作为高价值的对齐与验证数据,而非预训练的核心规模来源。他主张,具身智能的突破关键在于完成**人类行为的压缩**,这需要通过预训练来实现。亮源新创的核心方案是使用**互联网尺度的人类运动、空间移动和物理交互数据**进行预训练,将具身基础模型视为一种**面向物理世界的多模态大模型**。在模型架构上,公司选择训练端到端的模型,并认为可规模化的技术路线主要集中于**自回归**和**flow matching**两类。## 亮源新创:低调布局与资本加持尽管公司保持低调,但已有多项实质性进展。根据公开信息,亮源新创已开发两款全自研的硬件本体:**一款人形机器人**和**一款低自由度轮式机器人**,均可搭载其自研模型,公司也曾尝试适配宇树科技的机器人本体。在资本层面,公司已获得**上亿顶级美元融资**。工商资料显示,其境内主体上海亮源新创科技有限公司的注册资本,已从**3000万人民币增至1亿人民币**,增幅达**233.33%**。公司在北京、深圳设立了子公司,并正在推进新一轮融资。## 具身智能:多技术融合与“ChatGPT时刻”的追问具身智能的实现依赖于多项AI理论的融合。根据学术定义,其发展离不开**世界模型、表征学习、因果推理和生成式AI**的支撑。生成式AI,特别是大语言模型和多模态大模型,为具身智能的环境感知与行动决策提供了关键能力。行业内外都在追问具身智能的“ChatGPT时刻”何时到来。有观点认为,机器人可能在未来一两年内经历关键迭代。然而,实现这一目标面临核心挑战:- **高质量数据稀缺**:物理世界的操作数据采集成本高昂,被比喻为“数字原油”。- **仿真到现实的鸿沟**:仿真数据与真实场景存在差异。- **模型对齐效果**:如何让AI模型的理解与真实机器人的动作精确匹配。姜旭的归国创业,不仅是一位顶尖技术专家的个人选择,也为中国在具身智能这一前沿领域的竞争增添了新的变量。其坚持的“预训练优先”路径,能否像大语言模型那样,通过规模化数据驱动迎来突破,仍需时间与市场的检验。