> 自媒体 > (AI)人工智能 > “chatGPT”到底是什么啊?
“chatGPT”到底是什么啊?
来源:桃园愚人1
2023-05-18 14:15:58
776
管理

#挑战30天在头条写日记#

“chatGPT”到底是什么啊?

chatGPT是一个智能对话应用,也称聊天机器人,可以回答用户的各种天南海北的问题。

chatGPT背后的技术被称为“大型语言模型”(Large Language Model,简称LLM),是人工智能技术中,属于深度神经网络的技术。

从原理上来说,我觉得chatGPT像是一个知识的压缩器:它把很多知识浓缩在里面,然后你可以通过对话问答的方法把知识取出来。如果把浓缩知识的过程称为“压缩”,那取出知识的过程就是“解压缩”。从这个意义上讲,chatGPT是一个知识的“压缩-解压缩器”。

本来知识的表现形式,是我们看得懂的文本,经过机器的重新编排,存储在一个称为“神经网络”的东西里,也就是今天我们所说的 “模型”。人的大脑有一张“神经网络”,是由很多相互连接的神经元构成。

机器学习技术参照了这个名字,也叫“神经网络”,实际就是许许多多彼此连接的数据节点,其中,大型语言模型拥有的数据节点少则几百亿个、多则上万亿个。

知识被重新编排后,就用这些数据节点的参数以及节点之间的关系来表示,不再是一篇篇可读的文本。“解压缩”就是把知识从网络中恢复出来,变成我们可读的文本。而“解压缩”的钥匙,就是我们问chatGPT的问题。

问题:能不能再解释得详细一点?为什么chatGPT能回答问题?

回答:

我用“搜索引擎”来做对比,有利于说清楚问题。

网上的知识非常多,以网页或数据库的形式存在。搜索引擎首先要去抓取网页,上千亿的网页,就是获取知识的过程,这是搜索的第一个功能。

然后,搜索引擎要浓缩这些网页,它会把文章拆成一个一个的词,以词为单位来重新组织文章,就是制作“倒排表”,“倒排表”就是每个词后面跟着一串它出现过的文档编号,这样查询时可以快速找到哪些文章包含了查询词。这是搜索引擎的第二个功能“索引”。

再然后,当用户来查询的时候,输入一个或几个词,包含这些词的文章是相当多的,那就要给文章排序,尽量让用户想要的结果排在前面。这就是搜索引擎的第三个功能“排序”。

搜索引擎就有这样三个主要功能:获取知识——抓取;编排知识——索引;把你想要的排前面——排序。还有其他很多细节,大致是这样。

可以说,搜索引擎也是一个知识的“压缩-解压缩器”。类似的,我们也可以按照“获取知识-编排知识-呈现知识”这样三个方面来理解chatGPT。

在“获取知识”方面,chatGPT有三个阶段。在第一阶段,研发团队收集大量的网页或者数据库,用里面的文本信息作为训练模型的“语料”,这个量很大,按单词个数来算能达到上万亿。在第二阶段,模型优化阶段,会有专门设计的一些问答数据,这个数量很少,但对模型效果很关键。第三阶段,当模型的效果足够好、可以对用户开放之后,chatGPT可以通过和用户的对话来获取数据,研发团队还开发了插件,方便合作方将各种数据库接入chatGPT,来丰富其指定场景下的知识,这个数据量可以是海量的。

在“编排知识”方面,chatGPT和搜索引擎不同,它把知识揉得更碎,文本变成了数字编码、以节点参数和节点之间的关系的形式来存储,知识就好像“融化”在网络里;当用户来问时,chatGPT会用同样的方式把用户的问话也变成数字编码,输入神经网络,这样就触发了神经网络中的相关信息,回收信息后,再经过一个和揉碎相反的过程——就是解码,就形成了返回的文案。

在“呈现知识”方面,用户用日常对话来获取知识,而不是使用搜索引擎时的查询词。返回的结果也不同,搜索引擎会返回一组网页,而chatGPT给的是通顺的文案。chatGPT还能对信息做梳理,总结成结构化的文案,这是让人印象深刻的地方。至于答案中信息的相关性和重要性等,可能已经被考虑在神经网络的参数里,具体机制我不懂。

另外的区别是,chatGPT还可以和你做多轮问答,有根据上下文调整答案的能力。这取决于它能编码的长度,就是能把多长的问题放到网络中去。

当然,你用日常问话去问搜索引擎也行,但是返回的结果往往很不好,为了改善搜索结果,搜索会在下拉框里补充一些提示词。这当然和千变万化的日常对话没法比。

总而言之,作为知识的“压缩-解压缩器“,chatGPT确实是一次技术上的飞跃。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
新车|2030年前仍继续提供,宝马M车型未来或将取消手动挡..
文:懂车帝原创 杨凯文[懂车帝原创 产品] 日前,据德国媒体AMS报道,宝马..
聚焦可持续发展与科技创新领域,宝马集团与宁德时代签署合作谅解备忘录..
2月25日,宝马集团董事长齐普策随德国总理默茨访华。全球经济格局正经历..
600匹马力5系!国内到店实拍宝石青宝马i5 M60
601马力 3.8秒破百,M性能与豪华质感拉满,纯电旗舰气场无敌。下面这组到..
谁敢把家里的奔驰宝马全卖了换它?三千公里长途实测出答案..
谁能想到,有人竟把家里的奔驰、宝马、英菲尼迪全卖了,一股脑换成零跑?..
宝马CEO最新涉华表态:对中国庞大市场与创新潜力视而不见的人,正错失巨大..
来源:环球网 【环球网报道 记者 姜蔼玲】据路透社报道,宝马集团首席执..
默茨专机抵京,第一道难关出现!宝马CEO通知政府,中方有言在先..
这两天默茨的“访问”可以看做是一次硬碰硬的试算:对内对外都必须强硬,..
默茨专机抵京,第一道难关出现!宝马公开喊话政府,中方亮明底线..
专机引擎的轰鸣声刚在北京上空消散,一场没有硝烟的博弈,已然拉开序幕。..
假期将尽,与宝马“的卢”合影,专治各种“过不去”..
假期最后一天还是来了 明天是节后第一个工作日 此刻的你是否已收拾心情做..
宝马接入中国AI技术,德企为何深耕本土化?
德企深耕本土化是为了抓住中国市场的巨大潜力和创新优势,以维持全球竞争..
关于作者
聚焦每日新资..(普通会员)
文章
1976
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体105600

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索