> 自媒体 > (AI)人工智能 > “我们从未与通用人工智能如此接近”,复旦黄萱菁解析ChatGPT
“我们从未与通用人工智能如此接近”,复旦黄萱菁解析ChatGPT
来源:文汇网
2023-07-13 17:32:29
733
管理

“我们从来没有觉得自己与通用人工智能如此接近,这是我从事人工智能研究这么多年以来最兴奋的时期,”在昨晚举行的复旦科创先锋论坛上,复旦大学计算机学院教授、博士生导师黄萱菁如此形容ChatGPT横空出世后她的心情。作为国内最早从事人工智能、自然语言处理和信息检索的学者之一,她做出的判断是:AI可能会像工业革命和信息革命一样,引领我们走向下一个时代。

活动现场,黄萱菁发表了主题为“迈向大规模语言模型”的演讲,她从语言模型的定义开始娓娓道来:“语言模型就是语言的规律。首先是语法,我们无论学习汉语还是英语等语言,都是从语法开始学起,但是光有语法,我们依然很难捕捉客观世界纷繁复杂的语言现象,因为语言并不会严格按照语法去表达。这个时候,我们就需要使用到数学‘武器’——概率,在各种语言现象中间去寻找规律。如果通过对句子进行概率分析,我们就能知道什么是正确的识别结果。这个概率模型就称为语言模型。”

由于句子在诸多情景下可能包含巨大的词汇量,导致传统概率语言模型所需的计算资源爆炸式增长。所谓大规模语言模型就是含有巨量参数,能够接受很长一段时间窗口的语言文字。2017年开始出现了一个模型叫做Transformer,成为现在预训练模型的基石,也是大规模语言模型的基石。

据黄萱菁介绍,传统的预训练模型有两种思路,第一种思路是以BERT为例的理解模型,另一种思路是以ChatGPT的前身GPT为代表的产生式模型。当然也有一些工作尝试把理解模型和产生式模型结合起来。曾经很长一段时间理解式的模型被使用的比较多,而产生式模型则需要更高的算力和更长的窗口,一直到有了GPT-3之后,大家才知道它如此之强悍,而ChatGPT还拥有了很强的理解人类上下文的能力。

“我们生活在一个飞速变化的时代,每个礼拜都有新的模型发布,预训练 微调的方式是前ChatGPT时代的范式,诸如Google、Open AI这样的大厂商将自身开发的大模型开源,供下游应用者在这些模型上进行参数的微调,以取得优异的表现。”她表示,当语言模型变得更大的时候,一方面厂商出于商业原因逐渐舍弃开源,另一方面用户也缺乏足够的计算资源使用大模型,“这样的情况之下,一个新的范式最终横空出世:利用大规模语言模型的涌现能力。当模型的参数规模还不太大的时候,你看不到它的强大,当达到某一个临界值时,这个模型就会非常强大。”

记者了解到,作为ChatGPT背后的核心技术,大语言模型可以展现出强大的学习能力。而现有研究表明,模型规模和数据量越大,性能越好。当模型和数据规模达到一定程度时,模型将获得涌现能力。

拥有强大能力后,ChatGPT究竟会给我们带来哪些改变?微软CEO萨提亚·纳德拉接受媒体采访时曾说,内燃机带来了廉价的动力,互联网技术减少了信息传递的成本,而ChatGPT会让信息的整合、转译、流通变得更加廉价。

在黄萱菁看来,ChatGPT可以视作是人工智能的基座,就像“大脑”一样,“在肉眼可见的未来,善用AI的人将和不用AI的人在工作效率上会产生巨大差距,因此我鼓励大家多去使用和熟悉与AI进行沟通。在未来一段时间内,ChatGPT还不足以完全替代某一个岗位,但将大大促进各个领域的生产效率,我们希望AI是帮助人类的工具,而不是取代人类的机器。”

她同时表示,“我们发现ChatGPT能力现在的强大性能都是在现有的机器学习框架下可以解释的,并没有一些很玄的东西,我相信今年除了OpenAI,国内外会有很多机构,包括大学和企业等,在ChatGPT模型方面会有大的突破。”

作者:唐玮婕

编辑:朱伟

1
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
NeurIPS 2025放榜:阿里Qwen门控注意力获最佳论文
嘻疯 发自 凹非寺量子位 | 公众号 QbitAI刚刚,NeurIPS 2025最佳论文奖、..
阿里千问开源4款Qwen3.5小尺寸模型,满足资源受限至轻量应用不同需求..
【太平洋科技快讯】3月3日消息,阿里千问近日开源四款Qwen3.5更小尺寸模..
实测Qwen3.6-27B:4分钟做了个跑酷游戏,验证码识别正确率超90%..
它用时四分钟左右,写完了1200多行代码。从实测结果来看,游戏设计与前端..
阿里亲身入局具身智能!Qwen内部组团,通义千问技术负责人带队..
衡宇 发自 凹非寺量子位 | 公众号 QbitAIQwen团队内部组建了一个全新的具..
Qwen紧追OpenAI开源4B端侧大模型,AIME25得分超越Claude 4 Opus..
衡宇 发自 凹非寺量子位 | 公众号 QbitAI三天不开源,Qwen团队手就痒。昨..
Qwen又立功,全球最快开源模型诞生,超2000 tokens/秒
全球最快的开源大模型来了——速度达到了每秒2000个tokens!虽然只有320..
激活170亿参数 Qwen3.5实测 重构大模型性价比逻辑
2月16日Qwen3.5正式开源,以3970亿总参数、仅170亿激活参数的架构实现性..
Qwen最新闭源模型曝光!实测夸克“对话助手”
10月23日,阿里旗下夸克正式上线“对话助手”。从界面上看,它像是“塞进..
林俊旸离职后,Qwen的变与不变
来源:视觉中国OpenAI早期也曾采用垂直整合的架构模式,并集中资源完成了..
关于作者
酷匠(普通会员)
文章
1937
关注
0
粉丝
1
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体106516

1
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索