> 自媒体 > (AI)人工智能 > 吵翻天!ChatGPT到底懂不懂语言?PNAS:先研究什么是「理解」吧
吵翻天!ChatGPT到底懂不懂语言?PNAS:先研究什么是「理解」吧
来源:新智元
2023-04-24 15:13:37
558
管理

编辑:LRS

【新智元导读】语言模型理解了人类语言吗?谁赞成,谁反对?

机器会不会思考这个问题就像问潜水艇会不会游泳一样。——Dijkstra

早在ChatGPT发布之前,业界就已经嗅到了大模型带来的变革。

去年10月14日,圣塔菲研究所(Santa Fe Institute)的教授Melanie Mitchell和David C. Krakauer在arXiv发布了一篇综述,全面调研了所有关于「大规模预训练语言模型是否可以理解语言」的相关争论,文中描述了「正方」和「反方」的论点,以及根据这些论点衍生的更广泛的智力科学的关键问题。

在过去的几年里,大型语言模型(LLMs)在人工智能领域的受众和影响力激增,也改变了一些人对机器理解语言前景的看法。

大型预训练模型,也可以叫做基础模型(Foundation Models)是具有数十亿到上万亿个参数(权重)的深度神经网络,在海量自然语言语料库(包括网络文本、在线图书等)上进行「预训练」后得到。

模型在训练期间的任务是预测输入句子中的缺失部分,所以这种方法也叫做「自监督学习」,由此产生的网络是一个复杂的统计模型,可以得到训练数据中的单词和短语之间是如何相互关联的。

这种模型可以用来生成自然语言,并为特定的自然语言任务进行微调,或者进一步训练以更好地匹配「用户意图」,不过对于非专业人士和科学家来说,语言模型到底如何完成这些任务的,仍然是个谜。

神经网络的内部运行原理在很大程度上是不透明的,即使是构建这些网络的研究人员对这种规模的系统的直觉也是有限的。

神经科学家Terrence Sejnowski这样描述LLMs的涌现能力(emergence):

突破了某个阈值后,就好像外星人一下子出现了,可以用一种可怕的、人类交流的方式与我们交流。目前只有一件事是清楚的,大型语言模型并非人类,它们行为的某些方面似乎是智能的,但如果不是人类的智能,它们的智能的本质是什么?

支持理解派VS反对理解派

尽管大型语言模型展现出的性能让人震撼,但最先进的LLMs仍然容易受到脆性和非人类错误的影响。

不过可以观察到,网络性能随着其参数数量和训练语料规模的扩大而有明显改善,这也使得该领域的一些研究者声称,只要有足够大的网络和训练数据集,语言模型(多模态版本)也许是多模式版本--将导致人类水平的智能和理解。

一个新的人工智能口号已经出现:唯一要做的就是提升模型规模(Scale is all you need)!

这种说法也体现了人工智能研究界关于大型语言模型的争论:

一派认为,语言模型能够真正理解语言,并能以通用的方式进行推理(尽管还没有达到人类的水平)。

例如,谷歌的LaMDA系统在文本上进行了预训练,然后在对话任务上进行了微调,能够在非常广泛的领域内与用户进行对话。

另一派认为,像GPT-3或LaMDA这样的大型预训练模型,无论它们的语言输出多么流畅,都不能拥有理解力,因为这些模型没有实践经验,也没有世界的心智模型。

语言模型只是在预测大量文本集合中的单词方面的训练让它们学会了语言的形式,远远没有学会语言背后的意义。

仅靠语言训练的系统永远不会接近人类的智慧,即使从现在起一直训练到宇宙消亡为止。很明显,这些系统注定只能是浅层次的理解,永远无法接近我们在人类身上看到的全身心的思考。

因此可以说,近年来,人工智能领域创造了具有新的理解模式的机器,很可能是一个全新的概念,随着我们在追求智能的难以捉摸的本质方面取得进展,这些新概念将继续得到丰富。

那些需要大量编码的知识、对性能要求很高的问题将会继续促进大规模统计模型的开发,而那些拥有有限知识和强大因果机制的问题将有利于理解人类智能。

未来的挑战是开发新的科学方法,以揭示不同形式的智能的详细理解机制,辨别它们的优势和局限,并学习如何整合这些真正不同的认知模式。

参考资料:

https://www.pnas.org/doi/10.1073/pnas.2215907120

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
去年我国汽车产量是美日德总和的1.5倍!今年有望再创新高..
2025年,全球每卖出三辆新车,就有一辆是中国制造,这个数字有实实在在的..
2026,没有“新技术”?
2026年中国汽车行业的技术演进,呈现出一个共识:没有颠覆性技术涌现,竞..
新技术密集发布,2026补贴少了,反而更适合买高端电车?..
价格战的后遗症还没痊愈,2026的新能源汽车,不止比价格,还要比同价谁给..
YU7销量远超特斯拉!谁能告诉我:到底是谁在买小米汽车啊?..
小米YU7,可以说是继吉利星愿之后,又一台“非典型”神车。1月份,在绝大..
问界汽车回应M9起火事件,称“三电系统正常,将配合调查”..
2 月 23 日,问界汽车发布关于广东省惠州市车辆起火的说明。问界汽车表示..
迈入全新阶段!百年车企官宣
2月23日,法国汽车制造商雷诺集团官方宣布,法国布洛涅-比扬古、瑞典哥德..
奔驰C级纯电版要来了!续航800km,全新平台打造,入华会好卖?..
在奔驰现有的产品体系里,奔驰C级绝对是贡献销量的绝对主力车型,要知道..
德国汽车业逼宫默茨:中国人都不爱买德国车了,必须和中国提要求..
文 | 欧阳立祯 硕士研究生、美国注册管理会计师CMA,高级会计师德国汽车..
未来汽车已来!无人驾驶+全面电动化,整个行业将彻底重构..
二、无人驾驶真正落地,L3量产、L4商业化无人驾驶不再是概念,而是即将普..
关于作者
细雨入梦(普通会员)
文章
1820
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体106194

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索