> 自媒体 > (AI)人工智能 > OpenAI紧急直播,ChatGPT疯狂开挂深度研究!10分钟爆肝万字现AGI
OpenAI紧急直播,ChatGPT疯狂开挂深度研究!10分钟爆肝万字现AGI
来源:新智元
2025-02-05 15:46:07
430
管理

编辑:Aeneas 桃子

【新智元导读】刚刚,OpenAI再度紧急出手,在发布会直播全新的「Deep Research」功能。基于o3的推理再加上联网搜索,ChatGPT如今可以完成耗费人类专家数小时的复杂研究了!现在,模型已经刷爆「人类最后考试」榜单。

一大早,OpenAI开启的在线直播,简直让人猝不及防。

Mark Chen将之称为「我们的下一代智能体产品」。

去年,OpenAI就推出了o1,但这些推理模型的一个限制,是它们无法使用工具,因为缺少了浏览互联网这个核心能力,

因此,现在OpenAI宣布了一个重大步骤:引入Deep Research!

下面是一个生物学方面的例子。

研究者上传了一篇论文,想找到关于同一主题的其他论文。

最终Deep Research给出的结果,得到了生物学专家的认可。

也就是说,如果你想要的答案非常具体,那么Deep Research就会非常有效。

甚至,我们可以用Deep Research找出10年前在东京去过的餐厅的名字,或者找到我们忘记名字、但记得其中某集内容的电视剧。

除了描述情节之外,其余的信息就是这是5到10年前的电视剧了。

毕竟,OpenAI一直设想,真正的AGI是能够自己产出新颖的科学研究。

几天前的Reddit在线问答中,奥特曼也发表了同样的观点。

要知道这项测试包含了超3,000道「专家级」多选题和简答题,涵盖从语言学到火箭科学、从古典学到生态学等100多个学科。

与o1相比,最大的进步出现在化学、人文社会科学和数学领域。

驱动Deep Research的模型通过在必要时有效寻找专业信息,展现出类人的解决方案。

GAIA

在GAIA测试中,这是一个评估AI解决现实世界问题能力的公开基准测试。

驱动Deep Research的模型同样刷新SOTA,位居外部排行榜榜首。

这些测试包含三个难度等级的问题,成功完成这些任务需要具备推理能力、多模态流畅性、网页浏览和工具使用等多项技能。

专家级任务

另外,在对各个领域专家级任务的内部评估中,Deep Research能够自动化完成,需要多个小时的复杂人工调查工作。

下图为专家级任务与最大工具调用次数的对比,显示出了模型花更多时间思考和浏览时,性能就会更强。

这跟OpenAI的理念相吻合:在未来世界里,智能体将花费越来越长的时间,完成越来越困难的任务。

下面这个案例中,Deep Research进行的化学研究,节省了大约4小时的时间。

局限性

Deep Research仍处于早期阶段,同样存在一些限制。

根据内部评估,它有时会在回答中产生虚构的事实或做出错误的推断,不过,频率明显低于现有的ChatGPT模型。

它可能难以区分权威信息和谣言,目前在置信度校准方面表现较弱,往往无法准确传达不确定性。

在发布时,报告和引用可能存在微小的格式错误,任务可能需要更长时间才能开始。

OpenAI预计所有这些问题都会随着使用时间的增加而快速改善。

Pro用户先上手,Plus一个月内上线

OpenAI称,Deep Research在ChatGPT中非常消耗计算资源。

研究查询所需时间越长,所需的推理计算就越多。

目前,OpenAI开始向Pro用户提供优化版本,每月最多100次查询。

接下来,这项功能会逐渐向Plus和Team用户(带越一个月内),以及Enterprise用户推出。

未来,所有付费用户都将获得更高的使用配额。

届时,OpenAI将发布一个更快、更具成本效益的深度研究版本,它由更小的模型驱动,但仍能提供高质量的结果。

下一步:Operator Deep Research

ChatGPT的Deep Research功能现已在网页版正式上线,并将在一个月内推广到移动端和桌面端。

如前所述,目前,Deep Research可以访问实时互联网,获取最新信息,并对上传的文件进行深入分析。

但,这仅仅是开始。

未来,任何一个人将能够接入更专业的数据源,比如学术期刊或企业内部资源。

这种定制化的知识获取能力,让ChatGPT真正成为你的专属智能助手。

最激动人心的是,OpenAI正在酝酿一场更大的革命。

下一步,通过将Deep Research(负责异步网络调查)与Operator(负责实际行动执行)相结合,ChatGPT将不再局限于信息处理,能够为每个人执行愈加复杂的任务。

这种突破性组合,将开创一个全新的AI个人助手时代。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
. 宝马半价卖!降幅高达49%,2026年车市杀疯了
俗话说得好:“三十年河东,三十年河西。”谁能想到,曾经高不可攀、甚至..
宝马 Alpina 新标正式发布,定位仅次于劳斯莱斯
2026年2月12日,宝马正式对外披露其 Alpina 的最新规划,并发布了全新设..
默茨专机抵京,第一道难关出现!宝马CEO通知政府,中方有言在先..
更值得关注的是投资端。2025年前11个月,德国企业在华投资超过70亿欧元,..
本土高管退场、渠道全面告急,奔驰宝马的2026!
2026年一开年,奔驰和宝马接连出现的人事变动,把豪华车市场最真实的压力..
有人说开奔驰E300的都是装。我就想问:你连装都装不起,你酸什么..
春节刚过完,私信快被“56E怎么选”给炸爆了。尤其是2026款的奔驰E300L,..
潘九堂谈小米汽车立项路线之争:既然出发晚了,干脆挑战最难的,最终选择正..
IT之家 2 月 26 日消息,小米产业投资部合伙人潘九堂今日发文,谈到了小..
宝马CEO警告:忽视中国或危及未来经济成功,合作是关键..
【文/观察者网 王一】据英国路透社2月19日报道,德国宝马集团董事长齐普..
宝马CEO最新涉华表态:对中国庞大市场与创新潜力视而不见的人,正错失巨大..
据路透社报道,宝马集团首席执行官(CEO)奥利弗·齐普策当地时间19日警..
宝马7系直降27万 BBA集体放价 豪华车市格局生变
2026年2月,宝马7系终端现金优惠高达27万元,奔驰、奥迪等德系豪车主力车..
关于作者
司机(普通会员)
文章
2038
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体107022

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索