> 自媒体 > (AI)人工智能 > 前OpenAI 联合创始人发声:AI主流发展路线已经遇到瓶颈
前OpenAI 联合创始人发声:AI主流发展路线已经遇到瓶颈
来源:第一财经
2025-12-05 14:06:43
150
管理

11 月 26 日,Safe Superintelligence(SSI)CEO伊利亚·苏茨克维(Ilya Sutskever)三万字访谈在AI圈刷屏了。苏茨克维在AI领域称得上信仰一样的人物,他的另一层身份是前OpenAI 联合创始人和首席科学家、GPT 系列的关键缔造者,被认为是AI先驱。

在离开OpenAI创业后,苏茨克维一直鲜有发声,他此次采访备受关注。在播客中苏茨克维谈到了对当前 AI 路径的判断、预训练范式有什么问题、AI为什么会在泛化上输给人类等等。

这次访谈最为关注的论点是,苏茨克维认为,目前主流的路线已经明显遇到瓶颈,AI的扩展(Scaling)时代已经终结。尽管他去年就曾预言“预训练的终结”,但这一次他更加明确:我们来到了研究的时代,从规模化扩展回到了研究范式本身。

苏茨克维提出,2012 年到2020年,是研究的时代。而2020 年到 2025 年,是规模化时代,但现在算力规模已经很大了,却不能持续带来更好的“扩展”,扩展与浪费算力之间的界线变得模糊。于是我们又回到了研究时代,“只是有了更大的计算机”。

在继续通向AGI的路途中,需要解决的根本问题是,大模型的泛化能力为什么会比人类差很多。

苏茨克维表示,当前模型令人困惑的地方在于,他们在各种评测上表现得很出色,而这些题目实际上也挺难,但另一方面它们也在某些情况下重复犯错,比如用AI去编程时,AI能解决复杂的问题,却也会有简单的Bug,在明知道Bug的存在时却不断引入新的Bug。他提出了两种可能的解释。

“比较异想天开的解释是,也许强化学习 (RL) 训练让模型变得有点过于一根筋和视野狭窄,过于缺乏意识,尽管这同时也让它们在其他方面更有意识。正因为如此,它们无法完成一些基本的事情。”

但另一个解释是,或许现在AI训练选择的数据太狭窄,相比做预训练 (pre-training) 时用上所有的数据,现在做强化学习训练时,会针对评测集去选择对应的数据。这有可能解释评测性能与实际现实世界性能之间的脱节。

苏茨克维举例表示,就像有学生要成为最好的竞赛程序员,所以他在该领域练习了 1万小时,解决了所有问题,背诵了所有证明技巧,成为顶尖选手之一,但他也不一定会在职业生涯中做得很好。

现在的模型就像这样的学生,“我们会说,模型应该擅长编程竞赛,让我们把有史以来所有的编程竞赛题都拿来。然后再做一些数据增强,现在你有了一个很好的竞赛程序员。”仅此而已。

此外,苏茨克维一直在按照人类的大脑来思考AI的进化方向,他认为,当下的AI或许缺少了人类的情绪,这可能是某种价值函数,能让AI更有方向感。

苏茨克维用了现实中脑损伤的案例来阐述他的观点:一个人因某种脑损伤丧失了情绪处理能力,不觉得悲伤和兴奋。他仍然善于表达,可以解决小谜题,但他在做任何决定时都变得极度糟糕,决定穿哪双袜子都要花好几个小时,会做出非常糟糕的财务决策。

苏茨克维的猜测是,人类的价值函数在某种重要的方面受到情绪的调节,这种调节是由进化硬编码的。也许这对于人类在这个世界上有效行动很重要,“简单的东西在非常广泛的情况下非常有用”。

我们能从预训练中得到这种属于人类的“价值函数”吗?苏茨克维目前也并不确定,“也许如果你足够擅长从预训练中挖掘一切,也能得到那个东西。”

值得一提的是,不只是苏茨克维,AI行业不少先驱也对当前的AI路线提出冷静的观点。

图灵奖得主、Meta AI首席科学家杨立昆(Yann LeCun)在多个场合发表过对LLM技术路线的质疑。他认为,绝大多数同行致力于的大语言模型是死胡同,LLM由于其计算机制的限制,无法进行复杂的推理和规划,它们只是为了迎合训练数据的统计规律,根本无法让计算机真正超越人类智能。

相反,杨立昆认为,世界模型将成为人工智能架构的主流模型。世界模型通过摄取视觉信息来了解周围世界,学习方式类似动物幼崽或人类幼儿,而大语言模型则是基于海量文本数据库的预测模型。

杨立昆将于年底离开工作了12年的Meta,并创建专注于世界模型的初创公司。他认为,如果未来五到十年里把“世界模型”的相关难题解决了,就有望构建真正智能的、能够规划和推理的AI系统。

和杨立昆一样,“AI教母”、斯坦福大学教授李飞飞也强调建立“世界模型”和空间智能的重要性。11 月 10 日,她发表长文提到,当前以大型语言模型为代表的AI虽然擅长处理抽象知识,却如同在“黑暗中行走”,缺乏对物理世界的真实理解。

李飞飞解释道,人类对世界的理解是整体性的,不仅关乎我们“看见了什么”,还包括事物在空间上的关系、它们的意义以及彼此的关联,而非仅仅依赖语言描述。为了赋予机器这种能力,我们需要构建一种全新的“世界模型”,一类能构建环境内部表征的 AI 系统,在她看来,这种模型要具备生成性、多模态性和交互性三种核心能力。

显然,对于AI的未来行业尚未达成共识。但可以肯定的是:单纯依靠堆算力、扩规模的阶段已经结束。行业必须重新思考,到底哪个范式才能真正引领我们走向AGI?

(本文来自第一财经)

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
新大洲本田更新两款150通路车型,均配备ABS系统续航650KM+..
这两款车型型号分别为CBF150E和CBF150RE,除了外观风格上的不同之外,整..
10万元全款购买本田电动汽车,次日充电后行驶现乱码,故障频发难正常使用..
“花10.5万元全款购买的本田电动汽车,没想到第二天就出故障,充电后行驶..
本田研发回归!
近日,本田正式发布2025财年前三季度(2025年4-12月)财报。数据显示,公..
预算18万买合资SUV,大众途观L Pro和本田CR-V差距在哪?你选谁?..
前两天有个粉丝私信我,说预算18万左右,想买台合资SUV,看上了大众途观L..
新车|竞争本田CR-V,新款起亚狮铂拓界量产版实车,一季度内上市..
文:懂车帝原创 张凯[懂车帝原创 产品] 日前,我们拍摄到了新款起亚狮铂..
广汽本田用雅阁飞度分层营销,是为应对新能源竞争吗?..
是的,广汽本田用雅阁和飞度进行分层营销,核心目的正是为了应对新能源竞..
本田销量腰斩,合资车还在讲省油故事,用户早就不听了..
2020年东风本田卖出超过82万台车,成为合资品牌中表现最好的一个,到了20..
东风本田5年裁撤2000人关停二厂,合资车企转型要付哪些代价?..
合资车企转型需要付出人力裁撤、产能关停、品牌价值稀释等多重现实代价。..
工信部惊现125cc水冷神车!本田这次要颠覆市场?
最近工信部新一批新车公示里,有个125cc的小踏板。五羊本田把原本用在高..
关于作者
杨子(普通会员)
文章
1995
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体104037

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索