> 自媒体 > (AI)人工智能 > GPT-3自己上网搜答案!OpenAI新成果,让AI回答开放式问题
GPT-3自己上网搜答案!OpenAI新成果,让AI回答开放式问题
来源:智东西
2023-05-22 16:43:11
587
管理

WebGPT通过检索回答“尼罗河和长江谁更长?”的问题

当被问道:“为什么苏伊士运河在2021年3月被封锁?”

WebGPT:“苏伊士运河于2021年3月被封锁,因为一艘名为‘永远’的集装箱船搁浅在那里。这艘船曾载着20000箱的货物,在有两条水道的运河河道被强风吹进了运河中,因此其他船只无法绕过曾经给定的航道。苏伊士运河管理局雇佣了一艘拖船将这条曾经被遗弃的运河拖出运河。运河阻塞对欧洲、亚洲和中东之间的贸易产生了重大的负面影响。这引发了集装箱现货运价的新一轮飙升,该运价最终开始从创纪录的高点回落。”

ELI5中的评估结果

研究人员说,他们训练了三种不同的AI模型,对应于三种不同的inference time(推理时间)来进行计算。结果表明,表现最好的模型产生的答案,在56%的时间里比人类演示者写的答案更受欢迎,并且答案的事实准确性相近。

研究人员称,未来他们将使用人工反馈来改进模型的答案,可能会最终超越人类的答案。

对于模型的训练分布(training distribution)来说,这三个模型中,最好的模型的答案与人类演示者所写的答案几乎一样准确。然而,研究人员称,实现所有模型都能达到稳健是一个挑战。

为了探讨这个问题,研究人员在TruthfulQA上评估了该模型,TruthfulQA是一个数据集,包含了很多容易产生误解的问题,可以测试模型是否会产生常见的误解。在这个过程中,问题的答案会根据真实性和信息量进行评分,例如,“我没有评论”这个答案就被认为是真实的但不提供信息。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
2026 DeepSeek V4专家模式:12条暴力指令,榨干满血推理力..
多数人用DeepSeek V4仅停留在基础对话,却不知**专家模式(Pro Mode)**..
0.025元起,DeepSeek V4和MiMo V2.5为何走上不同路?
2026年4月,DeepSeek V4和小米MiMo V2.5前后脚进场,把开源大模型的竞争..
DeepSeek永久降价,其实是瞄准了10万亿美元?
(本文作者为 字母AI,钛媒体经授权发布)文 | 字母AI业内一直有这么一个..
DeepSeek 5个“暗黑指令”,第4个专治AI废话,90%人不敢用..
DeepSeek有一些鲜为人知的高压用法,能把它逼出极限性能。这些指令不是常..
1/4 价突袭,DeepSeek 硬刚 OpenAI,美国金融绑定路线遇劫..
调整定价的背后有哪些玄机?很多人不禁好奇,这是否是一次商业战术?从梁..
DeepSeek V4完全使用指南:国产最强模型从入门到精通(30个模板)..
一、痛点导入:你用的AI可能正在浪费你的时间很多人每天都在用AI:写文案..
Deep seek深度解析:每天15分钟,从“嘴笨”到“开口杀”..
每天15分钟,四步练成表达力超强的女生:复述训练(3分钟)——看完短文..
零成本体验DeepSeek V4!Hermes+NVIDIA免费接入,5分钟搞定
近期AI圈热度最高的事件,莫过于DeepSeek V4模型的发布。凭借百万级上下..
价格相差120倍!10.3k Star 的 DeepSeek 工具把缓存命中率打到 99.82%..
#探寻人工智能# #技能改变生活#DeepSeek 降价以后,很多人第一反应是:以..
关于作者
快乐的老范..(普通会员)
文章
2003
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体110888

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索