> 自媒体 > (AI)人工智能 > GPT-4参数最新爆料!8个2200亿MoE模型,PyTorch创始人深信不疑
GPT-4参数最新爆料!8个2200亿MoE模型,PyTorch创始人深信不疑
来源:新智元
2023-06-29 17:27:57
679
管理

编辑:桃子 好困

【新智元导读】GPT-4远不止1万亿,甚至,还是8个2200亿参数组成的混合专家模型。

家人们,GPT-4的参数可能还真不止1万亿!

近来,美国知名骇客George Hotz在接受采访时透露,GPT-4由8个220B模型组成。

这么算来,8 x 220B = 1.76万亿。

就连PyTorch的创建者Soumith Chintala对此也深信不疑。

GPT-4:8 x 220B专家模型用不同的数据/任务分布和16-iter推理进行训练。

如果真是这样的话,GPT-4的训练可能更加有效。

网友得知秘诀后,打算自己也要训练一个LLaMA集合体与GPT-4竞争。

网友下了功夫,给它命名为「九头蛇」。

参考资料:

https://www.latent.space/p/geohot#details

1
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
主流AI IDE的token成本爆炸?试试登上GitHub日榜的Claude Context..
总结来说,纯grep方案主要有三大问题:信息过载:现代代码库动辄数万文件..
郑州GEO优化:珍岛集团如何助力企业抢占AI搜索先机
随着生成式AI技术的快速发展,企业营销正在经历一场深刻变革。截止2025年..
甚好AI助手V1.0产品发布——企业 ERP 的全场景智能交互助手..
#甚好AI助手V1.0正式版于2026年4月正式发布#作为企业 ERP 全场景智能交互..
Siri将对标ChatGPT,进化为完整的聊天机器人,誓要摘掉“人工智障”的帽子..
安徽交通广播2026-01-26 13:16:32据白鹿视频,1月26日,爆料称苹果计划在..
从2年到10年,行业大佬也说不准机器人的chatGPT时刻|2026博鳌论坛..
来源:凤凰网财经《公司研究院》作者:杨诗涵眼下,人们对于机器人的态度..
从GPT-6到人形机器人,一场技术与商业的双重革命
一场迟到但终将到来的革命2026年4月的第二周,全球科技圈被三条重磅消息..
优必选WalkerS2打工记:广东机器人迎ChatGPT时刻
南方财经记者郑康喜 实习生王泽南 广州报道你能想象,未来的工厂里是一群..
对话英伟达业务副总裁:机器人的“ChatGPT时刻”正在到来..
“世界基础模型学习世界的方式是基于物理定律而非语言规律。Cosmos开源,..
2年、5年和10年,人形机器人的“ChatGPT时刻”何时到来?..
中新经纬3月25日电 (薛宇飞 王玉玲)“你们觉得人形机器人的‘ChatGPT时刻..
关于作者
锦阳(普通会员)
文章
1960
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体105913

1
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索