“我们从未与通用人工智能如此接近”，复旦黄萱菁解析ChatGPT-工信会

> 自媒体 > （AI）人工智能 > “我们从未与通用人工智能如此接近”，复旦黄萱菁解析ChatGPT

“我们从未与通用人工智能如此接近”，复旦黄萱菁解析ChatGPT

来源：文汇网

2023-07-13 17:32:29

733

管理

“我们从来没有觉得自己与通用人工智能如此接近，这是我从事人工智能研究这么多年以来最兴奋的时期，”在昨晚举行的复旦科创先锋论坛上，复旦大学计算机学院教授、博士生导师黄萱菁如此形容ChatGPT横空出世后她的心情。作为国内最早从事人工智能、自然语言处理和信息检索的学者之一，她做出的判断是：AI可能会像工业革命和信息革命一样，引领我们走向下一个时代。

活动现场，黄萱菁发表了主题为“迈向大规模语言模型”的演讲，她从语言模型的定义开始娓娓道来：“语言模型就是语言的规律。首先是语法，我们无论学习汉语还是英语等语言，都是从语法开始学起，但是光有语法，我们依然很难捕捉客观世界纷繁复杂的语言现象，因为语言并不会严格按照语法去表达。这个时候，我们就需要使用到数学‘武器’——概率，在各种语言现象中间去寻找规律。如果通过对句子进行概率分析，我们就能知道什么是正确的识别结果。这个概率模型就称为语言模型。”

由于句子在诸多情景下可能包含巨大的词汇量，导致传统概率语言模型所需的计算资源爆炸式增长。所谓大规模语言模型就是含有巨量参数，能够接受很长一段时间窗口的语言文字。2017年开始出现了一个模型叫做Transformer，成为现在预训练模型的基石，也是大规模语言模型的基石。

据黄萱菁介绍，传统的预训练模型有两种思路，第一种思路是以BERT为例的理解模型，另一种思路是以ChatGPT的前身GPT为代表的产生式模型。当然也有一些工作尝试把理解模型和产生式模型结合起来。曾经很长一段时间理解式的模型被使用的比较多，而产生式模型则需要更高的算力和更长的窗口，一直到有了GPT-3之后，大家才知道它如此之强悍，而ChatGPT还拥有了很强的理解人类上下文的能力。

“我们生活在一个飞速变化的时代，每个礼拜都有新的模型发布，预训练微调的方式是前ChatGPT时代的范式，诸如Google、Open AI这样的大厂商将自身开发的大模型开源，供下游应用者在这些模型上进行参数的微调，以取得优异的表现。”她表示，当语言模型变得更大的时候，一方面厂商出于商业原因逐渐舍弃开源，另一方面用户也缺乏足够的计算资源使用大模型，“这样的情况之下，一个新的范式最终横空出世：利用大规模语言模型的涌现能力。当模型的参数规模还不太大的时候，你看不到它的强大，当达到某一个临界值时，这个模型就会非常强大。”

记者了解到，作为ChatGPT背后的核心技术，大语言模型可以展现出强大的学习能力。而现有研究表明，模型规模和数据量越大，性能越好。当模型和数据规模达到一定程度时，模型将获得涌现能力。

拥有强大能力后，ChatGPT究竟会给我们带来哪些改变？微软CEO萨提亚·纳德拉接受媒体采访时曾说，内燃机带来了廉价的动力，互联网技术减少了信息传递的成本，而ChatGPT会让信息的整合、转译、流通变得更加廉价。

在黄萱菁看来，ChatGPT可以视作是人工智能的基座，就像“大脑”一样，“在肉眼可见的未来，善用AI的人将和不用AI的人在工作效率上会产生巨大差距，因此我鼓励大家多去使用和熟悉与AI进行沟通。在未来一段时间内，ChatGPT还不足以完全替代某一个岗位，但将大大促进各个领域的生产效率，我们希望AI是帮助人类的工具，而不是取代人类的机器。”

她同时表示，“我们发现ChatGPT能力现在的强大性能都是在现有的机器学习框架下可以解释的，并没有一些很玄的东西，我相信今年除了OpenAI，国内外会有很多机构，包括大学和企业等，在ChatGPT模型方面会有大的突破。”

作者：唐玮婕

编辑：朱伟

赏礼

赏钱

免责声明：本文仅代表作者个人观点，与本站无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。凡本网注明 “来源：XXX（非本站）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。 QQ：617470285 邮箱：617470285@qq.com

【深度长文】ChatGPT一夜“爆红”！人工智能需要哲学吗？

2023-07-13 17:33

ChatGPT使用指南：求职外企简历中英文转换

2023-07-13 17:21