> 自媒体 > (AI)人工智能 > 可以“作为医生”的 GPT-3,究竟是炒作还是名副其实?
可以“作为医生”的 GPT-3,究竟是炒作还是名副其实?
来源:CSDN
2023-05-01 22:33:04
622
管理

规模庞大的GPT-3

在机器学习领域内,像GPT-3这样的语言模型只是根据前面给定的单词(又称为上下文)来预测句子中的下一个单词。这是一种超强的自动补齐系统,类似于你在写邮件时使用的系统。初看之下,能够预测句子中的下一个单词似乎很简单,但实际上许多了不起的项目都是以该项技术为基础,例如聊天机器人、自动翻译以及常见问题解答等。

截止到目前,GPT-3是有史以来训练复杂度最高的语言模型,共有1,750亿个参数,如此多的神经网络结点需要经过数周密集的云计算微调后,才能让这个AI发挥神奇的作用。虽然这个参数量非常庞大,但远不及人脑在推理、感知以及情感能力方面的数百万亿(甚至千万亿)神经突触。

由于规模庞大,GPT-3可直接用于新任务以及简短的演示,而无需针对特定数据进行进一步的微调。这意味着该模型只需学习几个最初的示例,就可以成功地理解需要执行的任务。与之前简单的语言模型相比,此属性有很大的改进,而且更接近人类的实际行为,比如我们并不需要成千上万的例子来区分猫和狗。

由于数据来源混杂,从各种基本的书籍到整个互联网,从维基百科到《纽约时报》,因此GPT-3的训练数据有明显的偏差,但它在将自然语言转换为网站,创建基本的财务报告,破解语言谜题,乃至生成吉他指法等方面都有出色的表现。那么,在医疗保健领域又如何呢?

GPT-3,下一代私人医疗助理?

我们的第一项测试表明,似乎GPT-3可用于基本的管理任务,例如预约管理。但是当深入研究时,我们发现该模型对时间没有清晰的了解,也没有任何恰当的逻辑。有时它的记忆力明显不足,如下图所示,在处理预约的时候,患者曾明确表示下午6点之后没空,但GPT-3还是推荐了下午7点。

通过回收电子产品缓解压力!

当你坐在客厅的沙发上,放松休息并与GPT-3交谈时,它会倾听患者的问题,甚至提出一些可行的建议。这可能是GPT-3在医疗保健中最出色的用例之一。而实际上,1966年的Eliza算法仅通过模式匹配就实现了像人类一样的行为,所以GPT-3的成果也并不足为奇。

GPT-3与Eliza的关键区别在于,Eliza这类基于规则的系统能够完全控制计算机的响应。换句话说,我们确信这类系统不会给出任何可能对患者有害的说法。

然而,不幸的是与Eliza相反,在如下示例中,GPT-3却建议患者自杀……

内幕揭秘

正如其他人所观察到的那样,GPT-3输出的质量很大程度上取决于其使用的种子词汇,以两种不同方式提出同一个问题也可能得到差异非常大的两个答案。此外,该模型的各种参数(例如温度参数和top P参数)也起着重要作用。温度参数和top P参数控制着该引擎所呈现答案的风险和创造力。

温度参数

在不同的温度参数设定下,对于同一个问题,我们得到了两个截然相反的答案。如下是当温度参数T = 0.9时得出的答案。

频率惩罚参数与存在惩罚参数

此外,我们还应注意频率惩罚参数与存在惩罚参数,二者既能防止单词重复又能防止主题重复。在医学上,直观地来讲我们应尽可能降低这两个参数,因为过于生硬的主题切换可能引发混乱,而且重复实际上相当有用。然而,通过比较人类两次提出的同一个问题,我们可以清楚地看到,具有重复惩罚的模型更富有同情心且更友好,而另一种设定则看起来比较冷漠且对于人类来说重复过多。下面是一个没有惩罚的例子。

而下面则是一个惩罚满格的例子:

总结

正如OpenAI所警告的那样,距离GPT-3真正在医疗保健领域大展拳脚,我们还有很长一段的路要走。由于GPT-3的训练方式,它缺乏科学和医学领域的专业知识,因此尚不能胜任医学文献记录、诊断支持、给出治疗建议或回答医生问题等工作。虽然GPT-3可能给出正确的答案,但也很有可能给出非常错误的答案,这种不一致在医疗保健领域中是站不住脚的。即使对于翻译或总结医学术语等管理任务,GPT-3的发展前景虽然良好,但距离真正为医生提供支持还需要付出很大的努力。在目前这个阶段,与采用一种雄心勃勃的通用模型相比,采用多个经过专项任务训练的监管模型更为有效。

话虽如此,GPT-3的聊天模块似乎已做好准备鞠躬尽瘁,为医生减轻重担。在结束了一天的忙碌之后,坐下来与私人医疗助手开怀畅谈,可以为你洗去一天的尘埃,抛去一天的劳累。

此外,毫无疑问,从整体上来看语言模型也将得到快速改善,这不仅会对上述用例产生积极的影响,而且也会影响到其他重大问题,例如信息结构与规范化或自动咨询汇总等。

原文:https://www.nabla.com/blog/gpt-3/

本文为 CSDN 翻译,转载请注明来源出处。

点分享

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
Qwen要入局机器人了:林俊旸官宣成立具身智能团队
机器之心报道机器之心编辑部已经成为开源模型领头羊的 Qwen,终于要开始..
Qwen拿半成品刷下AIME\u0026#39;25满分,给别人留点面子吧……..
鱼羊 发自 凹非寺量子位 | 公众号 QbitAI半成品模型,已经刷下高难度数学..
阿里发布新一代大语言模型Qwen3.6-Plus 编程能力大幅提升..
来源:环球网 【环球网科技综合报道】4月2日,阿里千问发布新一代大语言..
AI大模型测评,深度解析最强开源模型Qwen3
前几天,阿里发布了Qwen3的新模型。从数值表现来看已经超越了DeepSeek和..
阿里要发飙?Qwen已经干掉Llama,夸克又要干掉Meta眼镜?..
夸克,这个阿里家的小儿子,正在以肉眼可见的速度扩张自己的边界:从“AI..
那个用半成品刷爆SOTA的Qwen3超大杯推理版,现在正式上线..
新一年的基础模型竞逐,没想到是阿里千问率先出手了!就在刚刚,Qwen3-Ma..
亚马逊云科技为何上架Qwen和DeepSeek的最新模型
为何上架Qwen和DeepSeek?开放生态是对抗封闭的最佳武器。国际市场调研机..
qwen3-0.6B这种小模型有什么实际意义和用途吗?
在大模型喧嚣的背后,小模型正在工业场景中悄然崛起。从端侧部署的隐私计..
晚点独家丨林俊旸提出离职,Qwen 多位负责人离开,团队或将调整..
前一天还在奋战模型发布,第二天提离职。文丨陈佳惠 程曼祺编辑丨程曼祺3..
关于作者
你不懂的歌..(普通会员)
文章
1961
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体106067

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索