GPT-4o悄悄更新版本,在大模型竞技场超越DeepSeek-R1登上并列第一。
除了数学(第6),还在多个单项上拿下第一:
创意写作;编程;指令遵循;长文本查询;多轮对话;
先直观看下新版GPT-4o的能力如何,还是以之前DeepSeek-R1和o3-mini都挑战过的一个例子来看。
Prompt:编写一个Python程序,展示一个球在旋转的六边形内弹跳。球应受到重力和摩擦力的影响,并且必须以逼真的方式从旋转的墙壁上弹回。
之前是酱紫的:

而新版GPT-4o看起来又双叒进化了:

与此同时,还有网友趁机扒出了ChatGPT最新系统提示词??
新版GPT-4o更有个性了关于GPT-4o已更新的消息,OpenAI CEO奥特曼在发帖认领的同时还评价道:
它相当不错,且不久将变得更好……

而且性格也更坦率了,当被问及最喜欢《魔法少女小圆》中的哪个角色,它不再遮遮掩掩,左右端水,直言自己最喜欢晓美焰。
她坚强,能够对抗鹿目圆的弱点,我认为她很可爱……

按照相关解释,这是因为新版GPT-4o能够根据用户过去的讨论和对话历史,做出不同行为。

同时,它也在编写Vue.js上更出色了。

从另一个它和DeepSeek-R1和o3-mini的同台竞技中(玩《我的世界》),也能看出其能力升级。
OMT:ChatGPT最新提示词泄露然鹅,当被问到“你属于哪个模型?”这个经典问题,一些混乱又出现了。
大多数情况下,它会问答自己是GPT-4:

不过据一些Pro用户反馈,它声称自己是GPT-4.5。
鉴于奥特曼上周刚宣布将在未来几周内发布GPT-4.5,有人据此推测很可能这里有早期测试。


坐等这两个AI吵起来(等待吃瓜)~
— 完 —
量子位 QbitAI · 头条号签约
关注我们,第一时间获知前沿科技动态
相关文章









猜你喜欢
成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体110143