> 自媒体 > (AI)人工智能 > Meta复刻GPT-3“背刺”OpenAI,完整模型权重及训练代码全公开
Meta复刻GPT-3“背刺”OpenAI,完整模型权重及训练代码全公开
来源:量子位
2023-05-01 18:55:10
652
管理

梦晨 萧箫 发自 凹非寺量子位 | 公众号 QbitAI

千亿级参数AI大模型,竟然真的能获取代码了?!

一觉醒来,AI圈发生了一件轰动的事情——

Meta AI开放了一个“重达”1750亿参数的大语言模型OPT-175B,不仅参数与GPT-3的1750亿一样,效果还完全不输GPT-3——

Meta AI对此解释称,OPT就是奔着开放代码去的,为了让更多人研究大模型,环境配置肯定是越经济越好。

这不,运行时产生的碳足迹连GPT-3的1/7都不到,属实省能又高效。

为了方便研究人员“量力而行”,Meta AI搞出了各种大小的OPT模型,从125M参数到1750亿参数的不同大小模型都有。

其中,660亿参数的模型还在制作中,马上也会和大伙儿见面:

所以,最大的OPT-175B模型究竟有多高效,又是怎么做到的?

性能方面,Meta AI针对OPT-175B和GPT-3,用14个NLP任务进行了测试。

结果表明,无论是零样本学习(zero-shot)还是多样本学习(Multi-shot),OPT在这些任务上的平均精度都与GPT-3相差不大。其中虚线为GPT,实线为OPT:

仇恨言论检测任务上的效果,更是完全超过Davinci版本的GPT-3模型(在GPT-3的四个版本中是效果最好的):

研究人员表示,希望能在开放后,有更多人参与进来研究,并真正解决这些问题。

手把手教你复刻GPT-3

上面提到,这一次的OPT模型系列,300亿参数及以下的版本都是可以直接下载,660亿版还在路上。

只有完整的1750亿版需要额外填写一张申请表,包括工作单位、用途、相关发表工作等问题。

斯坦福大学基础模型研究中心主任、副教授Percy Liang对此发表了观点,将大模型的开放程度总结成4个层次,更高层次的开放能让研究者专注于更深的问题。

第一层论文开放,证明一些设想的可行性,并提供构建思路。

第二层API开放,允许研究人员探索和评估现有模型的能力(如推理能力)和限制(如偏见)

第三层模型权重开放和训练数据开放。允许研究人员逐步改进现有模型,开发更深入的可解释性技术和更有效的微调方法,让研究人员更好地理解训练数据在模型行为中的作用。

第四层计算能力开放,允许研究人员尝试新的体系结构、训练目标和过程、进行数据融合,并在不同的领域开发全新的模型。

Percy Liang认为更高层次的开放同时也会带来更多风险。

也许是时候制定相关的社区规范了?

One More Thing

Meta这次论文的的共同一作有三人,其中Susan Zhang加入Meta之前正是来自OpenAI。

不过在OpenAI期间她并没有负责GPT-3的开发,而是参与了玩Dota的OpenAI Five强化学习项目,以及多模态大模型的研究。

项目地址:https://github.com/facebookresearch/metaseq/tree/main/projects/OPT

论文地址:https://arxiv.org/abs/2205.01068

参考链接:[1]https://ai.facebook.com/blog/democratizing-access-to-large-scale-language-models-with-opt-175b/[2]https://www.technologyreview.com/2022/05/03/1051691/meta-ai-large-language-model-gpt3-ethics-huggingface-transparency/[3]https://twitter.com/MetaAI/status/1521489996145958914

— 完 —

量子位 QbitAI · 头条号签约

关注我们,第一时间获知前沿科技动态

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
销量最高的国产车:吉利拿第1,比亚迪称王,小米SU7排第6..
以前,国内的汽车市场,是国外品牌(进口、合资)的天下,大众、丰田、本..
影响1000万辆新车安全,1周2场发布会后,国产车变了啥..
“全世界汽车之所以能到目前这么安全,都要感谢沃尔沃”,这话对一半的原..
行业首批汽车智能底盘实测研究报告:三款国产车成标杆..
快科技12月25日消息,央视新闻今日报道,行业内首批汽车智能底盘实测研究..
尊界S800拆车:排行榜最高分,这就是国产车的顶级水平!..
看过了这辆国产旗舰尊界S800的防撞梁和底盘部分,那内饰做工用料如何呢?..
“6座揽胜”,今年又一台爆款国产车来了
超5.2米车长,大湾区揽胜,大六座新能源,这些标签综合起来,成了小鹏GX..
喝完两斤白酒他一头撞上大货车,眼珠子“劈叉”差点瞎了..
昨天是我第108次断片喝醉▲图源:抖音@有点菜头(广州kiss版)而我的朋友..
“把他的车别下来!”甘肃高速拉煤货车一路飘火星,四川小伙返乡过年路上冒..
2月10日,一网友自驾从新疆回四川过年,途经甘肃酒泉段,遇到前方一辆大..
“把他的车别下来!”甘肃高速拉煤货车一路飘火星,四川小伙返乡过年路上冒..
2月10日,一网友自驾从新疆回四川过年,途经甘肃酒泉段,遇到前方一辆大..
重达134千克!货车暗格发现9块银砖,价值428.8万元
近日,深圳文锦渡海关在进口货运渠道查获车体改造暗格藏匿白银134千克当..
关于作者
轻随风之舞..(普通会员)
文章
1954
关注
0
粉丝
1
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体105040

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索