> 自媒体 > (AI)人工智能 > 如何“喂食”和训练ChatGPT,让它变得更像人?
如何“喂食”和训练ChatGPT,让它变得更像人?
来源:集微网
2023-05-25 15:25:18
363
管理

集微网消息,像chatGPT这样的大型语言模型总是提供一些看似正确合理的内容。这些聊天机器人,很多都是基于生成式人工智能技术,经过训练就能够通过在互联网上搜寻相关信息,组装出连贯的答案来回答用户的问题。它可以写出令人信服的学生论文、权威的法律文件和可信的新闻故事。对此,金融时报特约专栏作者做了专门分析。

但是,由于公开的数据包含错误信息和虚假信息,一些机器生成的文本可能并不准确真实。这促使人们争相开发工具来确定文本是由人还是由机器起草的。科学界也在努力适应这个新时代,现场讨论是否应该允许聊天机器人撰写科学论文甚至提出新的假说。

区分人工智能和人类智能的重要性与日俱增。本月,瑞银(UBS)分析师透露,ChatGPT是有史以来增长最快的网络应用,今年1月份月活跃用户达到1亿。对此有些部门认为,亡羊补牢,为时已晚。周一,国际文凭组织(International Baccalaureate)表示,只要学生标明引用,就允许他们使用chatGPT写论文。

这项技术的创造者坦言了它的局限性。OpenAI首席执行官萨姆•奥尔特曼(Sam Altman)去年12月警告称,ChatGPT“在某些方面足够出色,从而造成了无所不能的假象......我们在稳健性和真实性方面还需继续改进。”该公司正在为其输出的内容开发加密水印,这是一种机器可读的标点符号、拼写和词序序列;并且正在打磨一种“分类器”来区分合成文本和人类文本,并使用两者的例子来训练它。

斯坦福大学的研究生埃里克·米切尔(Eric Mitchell)认为分类器需要大量的训练数据。他和同事们一起提出了DetectGPT,这是一种“零样本”发现两种文本差异的的方法,不需要聊天机器人事先学习。相反,该方法使聊天机器人转向自身探测自己输出的内容。

它的工作原理是这样的: DetectGPT询问聊天机器人对一个样本文本的“喜欢”程度,用“喜欢”这一简写代表该样本与它自己创建的文本的相似程度。然后DetectGPT略微改变样本措辞,进一步“扰乱”文本。其假设是,相较于更改后的机器文本,聊天机器人对更改后的人类文本的“喜欢”程度更加多变。研究人员声称,在早期的测试中,该方法在95%的情况下能正确区分人类作者和机器作者。

需要注意的是: 该研究结果尚未经过同行评议;这种方法虽优于随机猜测,但在所有生成式人工智能模型中的效果并非同样可靠。对合成文本进行人工调整可能会愚弄DetectGPT。

这对科学来说意味着什么?科学出版是研究的生命线,将思想、假设、论点和证据注入全球科学经典。一些人已经迅速将ChatGPT当成研究助手,有几篇论文将人工智能列为合著者,引发争议。

Meta公司甚至推出了一个名为Galactica的科学文本生成器。三天后就被撤回了。所有的错误回答中,还有一段虚构的熊在太空中旅行的历史。

蒂宾根马普智能系统研究所(Max Planck Institute for intelligence Systems)的迈克尔•布莱克(Michael Black)教授在推特上表示,Galactica公司关于对他研究领域的多项询问给出的回答令他感到“困扰”,其中甚至将假论文归于真正的研究人员。“在所有情况下,Galactica的答案都是错误或带有偏见的,但听起来却很正确和权威。我认为这非常危险。”

这种危险来自于似是而非的文本溜进了真正的科学文献,使文献中掺杂着虚假的引文,并永远扭曲经典。现在《科学》杂志完全禁止机器生成的文本;《自然》杂志允许在声明的情况下使用,但禁止将其列为合著者。

文章最后指出,人们大多不会查阅优质期刊来指导自己的科学思考。如果狡猾的人有这样的倾向,这些聊天机器人可以按需喷出大量包含虚假引用的伪科学,解释为什么接种疫苗没有效果,或者为什么全球变暖是个骗局。这些误导性材料被发布在互联网上后,可能会被未来的生成式人工智能吞噬,进而产生新一轮的谎言,进一步污染公共话语。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
去年我国汽车产量是美日德总和的1.5倍!今年有望再创新高..
2025年,全球每卖出三辆新车,就有一辆是中国制造,这个数字有实实在在的..
2026,没有“新技术”?
2026年中国汽车行业的技术演进,呈现出一个共识:没有颠覆性技术涌现,竞..
新技术密集发布,2026补贴少了,反而更适合买高端电车?..
价格战的后遗症还没痊愈,2026的新能源汽车,不止比价格,还要比同价谁给..
YU7销量远超特斯拉!谁能告诉我:到底是谁在买小米汽车啊?..
小米YU7,可以说是继吉利星愿之后,又一台“非典型”神车。1月份,在绝大..
问界汽车回应M9起火事件,称“三电系统正常,将配合调查”..
2 月 23 日,问界汽车发布关于广东省惠州市车辆起火的说明。问界汽车表示..
迈入全新阶段!百年车企官宣
2月23日,法国汽车制造商雷诺集团官方宣布,法国布洛涅-比扬古、瑞典哥德..
奔驰C级纯电版要来了!续航800km,全新平台打造,入华会好卖?..
在奔驰现有的产品体系里,奔驰C级绝对是贡献销量的绝对主力车型,要知道..
德国汽车业逼宫默茨:中国人都不爱买德国车了,必须和中国提要求..
文 | 欧阳立祯 硕士研究生、美国注册管理会计师CMA,高级会计师德国汽车..
未来汽车已来!无人驾驶+全面电动化,整个行业将彻底重构..
二、无人驾驶真正落地,L3量产、L4商业化无人驾驶不再是概念,而是即将普..
关于作者
婆罗花开(普通会员)
文章
1934
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体106194

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索