> 自媒体 > (AI)人工智能 > GPT-4 被曝“变蠢”!为了降本,OpenAI 偷偷搞“小动作”?
GPT-4 被曝“变蠢”!为了降本,OpenAI 偷偷搞“小动作”?
来源:CSDN
2023-07-17 17:36:04
596
管理

整理 | 郑丽媛

出品 | CSDN(ID:CSDNnews)

“你们有没有觉得,最近 GPT-4 的质量有所下降?”

早在今年 5 月中旬开始,就有 GPT-4 用户在 OpenAI 的在线开发者论坛中发帖,表示 GPT-4 好像开始“变蠢”了:

“我使用 ChatGPT 已经有一段时间了,自 GPT-4 发布后,我就成为了 GPT Plus 用户。我一般会用 GPT-4 来助力长篇内容的分析和创作。过去,GPT-4 似乎能很好地理解我的要求。但现在,它似乎失去了对信息的跟踪,给了我很多错误的信息,误解我要求的情况也越来越多……目前,GPT-4 感觉更像 GPT-3.5。

有没有其他人注意到这一点,还是说只有我偶然遇到了这个问题?”

问题百出的新版 GPT-4

根据许多使用者的反馈,GPT-4 除了在长篇内容的分析和创作上表现有所退步,在写作质量上也有所下滑。

Roblox 的产品负责人 Peter Yang 在推特上表示,GPT-4 模型的输出更快了,但质量变差了:“只是简单的问题,例如让写作更清晰简洁并提供想法……在我看来,写作质量下降了。”

除此之外,在推特和 OpenAI 的在线开发者论坛中,也不断有用户反映新版 GPT-4 逻辑弱化、产生很多错误响应、无法跟踪提供的信息、不遵循说明要求、忘记在基本软件代码中添加括号、只记住最近的提示等种种问题。

对于 GPT-4 突然“降智”的表现,有用户提出猜测:“当前版本感觉跟刚推出时的版本大不相同,我猜 OpenAI 为了容纳更多客户选择在质量上妥协!”

如此看来,如今用户对于 GPT-4 的评价确实比不上它刚出道时的“风评”巅峰期。

专家推测:或许与 MoE 技术有关

根据 Sharon Zhou 的介绍,这种方法被称为 Mixture-of-Experts(MoE),即混合专家系统。MoE 技术是在神经网络领域发展起来的一种集成学习技术,也是目前训练万亿参数量级模型的关键技术——由于现阶段模型规模越来越大,导致训练的开销也日益增长,而 MoE 技术可以动态激活部分神经网络,从而实现在不增加计算量的前提下大幅度增加模型参数量。

具体来说,MoE 会将预测建模任务分解为若干子任务,在每个子任务上训练一个专家模型(Expert Model),并开发一个门控模型(Gating Model),该模型可根据要预测的输入来学习信任哪个专家,并组合预测结果。

那么 MoE 技术引用到 GPT-4 是什么情况呢?Sharon Zhou 解释道,在 GPT-4 中这些小型专家模型会针对不同的任务和主题领域进行训练,例如可以有针对生物、物理、化学等方面的小型 GPT-4 专家模型,那么当用户向 GPT-4 提出问题时,新系统就会知道要把这个问题发送给哪个专家模型。另外,为了以防万一,新系统可能会向两个或更多的专家模型发送查询,然后将结果混在一起。

对于这个做法,Sharon Zhou 的形容是“忒修斯之船”(一种有关身份更替的悖论,假定某物体的构成要素被置换后,但它依旧是原来的物体吗?),即随着时间的推移,OpenAI 会把 GPT-4 的各个部分替换掉:“OpenAI 正在将 GPT-4 变成一支小型舰队。”

基于以上推测,Sharon Zhou 认为近来 GPT-4 “变蠢”的言论,很可能就与 MoE 这种训练方式有关:“当用户测试 GPT-4 时,我们会问很多不同的问题,而规模较小的 GPT-4 专家模型不会做得那么好,但它正在收集我们的数据,它会改进和学习。”

GPT-4 架构曝光?

由于用户对于 GPT-4 “变蠢”的反馈越来越多,本周几位 AI 专家也发布了所谓的“GPT-4 架构细节”。

其中,一位名为 Yam Peleg 的推特博主表示, GPT-4 有大约 1.8 万亿个参数,横跨 120 层,比 GPT-3 大 10 倍以上,在约 13T token 上进行训练,训练成本约为 6300 万美元……值得一提的是,Yam Peleg 也表示 OpenAI 在采用 MoE,即通过使用 16 个混合专家模型来降低 GPT-4 运行的成本。

截至目前,OpenAI 方面并没有对这一说法做出回应。不过 Allen 人工智能研究所的创始首席执行官 Oren Etzioni 向媒体表示:“虽然我也没得到证实,但我认为这些猜测应该大致正确。”

他解释道,一般使用 MOE 方法有两种原因:要么想要生成更好的响应,要么想要更便宜、更快的响应。

“理想情况下 MOE 会让你同时获得这两方面的优势,但现实中通常需要在成本和质量之间做出权衡。”基于此,Oren Etzioni 认为结合现在的情况来看,OpenAI 似乎为了降低 GPT-4 的成本而牺牲了一些质量。

那么对于这件事,你的看法又是什么呢?

参考链接:

https://www.businessinsider.com/openai-gpt4-ai-model-got-lazier-dumber-chatgpt-2023-7?utm_source=reddit.com

https://community.openai.com/t/has-there-been-a-recent-decrease-in-gpt-4-quality/207392/9

https://the-decoder.com/gpt-4-architecture-datasets-costs-and-more-leaked/

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
2023上半年销量最好的50款SUV揭晓,国产车几乎霸...
2023年1-6月SUV全国合计445.4万辆。数据来源:乘联会。·丰田卡罗拉锐放-..
1月豪车排名:商务人士依旧不认可国产车
1月这张中大型轿车榜单,看着像“油车反扑”,其实更像一面照妖镜:谁在..
油耗低,空间大,续航长,家用一流,盘点5款20w级高品质国产车..
纵观2024年国内车市,“内卷”一词能贯穿全年。各家车企之间的价格战也是..
国产车尴尬了?国外机构评测:没有实体按键的汽车,安全性差一些..
如果大家有关注现在的汽车风向标,特别是新能源汽车,就会发现一个很明显..
中国女婿用私房钱,送外国老丈人国产车,老丈人激动到血压飙升..
外国老丈人万万没有想到,仅仅只是吐槽一句,自己开的车子经常坏,谁曾想..
公认质量最好的十大国产车品牌:吉利坦克进前五,奇瑞五菱上榜!..
近年来,国产车品牌在市场占有率、销量、海外市场表现以及技术方面均取得..
国产车方向盘“断臂”倒计时?2027年起半幅式彻底消失?..
东北一哥们儿在零下二十几度的停车场,对着理想新车门把手猛按三分钟——..
买车选国产还是合资?别听销售瞎吹,5个维度对比,答案一目了然..
现在买车,绕不开一个灵魂拷问:同样预算,到底选国产还是合资?有人说合..
一年零62天,我与问界M9的“日常”,让我看清了国产车的“狠活”..
#问界M9祝您新年手到福来#曾经的我,几乎每天都在生意的路上,开着酷路泽..
关于作者
唐师(普通会员)
文章
1936
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体110855

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索