Qwen拿半成品刷下AIME\u0026#39;25满分，给别人留点面子吧……-工信会

> 自媒体 > （AI）人工智能 > Qwen拿半成品刷下AIME\u0026#39;25满分，给别人留点面子吧……

Qwen拿半成品刷下AIME\u0026#39;25满分，给别人留点面子吧……

来源：量子位

2026-04-30 17:35:14

76

管理

鱼羊发自凹非寺

量子位 | 公众号 QbitAI

半成品模型，已经刷下高难度数学推理测试AIME 25满分战绩。

开源之王Qwen又在深夜放大招了。

Qwen3“超大杯”推理版露出庐山真面目，虽然还是“早期预览版”，仍在训练中，但在当前的Checkpoint，已经能在AIME 25和HMMT25（哈佛-MIT数学竞赛）中达到100%的准确率。

什么概念？就是一整个全场看呆的节奏：

此前，AIME 25的最好成绩由GPT-5系列把持，GPT-5 Codex（high）的准确率是98.7%，GPT-5（high）是94.3%。而Qwen3 235B的成绩是91%。

目前，这个Qwen3-Max-Thinking的早期预览版已经可以在Qwen Chat中免费试用，API也已上线阿里云。官方承诺，训练还在继续，后续会持续更新版本。

实测Qwen3-Max-Thinking

技术细节方面，Qwen官方尚未透露更多信息，但如果你感兴趣，现在就可以实测见真章。

我们已经测试了一波，以供参考。

先上经典题：小球碰撞测试。

编写一个Python程序，让一个小球在旋转的六边形内弹跳，小球运动遵循物理规律

回答正确。

完整答案如下：

前端方面，我们用简单的提示词，要求Qwen3-Max-Thinking用Three.js构建3D太阳系。

需要说明的是，Thinking模式下，Qwen3-Max的思考时间还挺久的……如果一时间想不明白，还会出现中英文各想一遍的情况（doge）。

初步体验下来，Qwen3-Max-Thinking有很多值得深挖的地方，不过也正如Qwen技术负责人林俊旸所说，“要做到面面俱到确实有点难”。

我们还需要更多时间。工作尚未完成。

而对于网友们来说，更重要的是——

“啥时候开源？”

体验地址：https://chat.qwen.ai/API地址：https://modelstudio.console.alibabacloud.com/?tab=doc#/doc/?type=model&url=2840914_2&modelId=qwen3-max-preview

— 完 —

量子位 QbitAI · 头条号

关注我们，第一时间获知前沿科技动态签约

0

点赞

赏礼

赏钱

0

收藏

免责声明：本文仅代表作者个人观点，与本站无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。凡本网注明 “来源：XXX（非本站）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。 QQ：617470285 邮箱：617470285@qq.com

Qwen要入局机器人了：林俊旸官宣成立具身智能团队

阿里发布新一代大语言模型Qwen3.6-Plus 编程能力大幅提升

相关文章

Kimi团队发布K1.5：让AI像人类一样\u0026#34;边思考边学习\u0026#34;的突破..

这项由Kimi团队开展的研究发表于2025年6月3日，详细介绍了他们最新的多模..

DeepSeek对比Kimi：两个国产AI谁更适合办公？实测告诉你答案..

说实话，最近AI工具多得让人眼花缭乱。DeepSeek和Kimi，两个名字我都听过..

涉嫌违规收集个人信息 Kimi等多款AI应用被通报

5月20日，国家网络与信息安全信息通报中心发布通报，经公安部计算机信息..

阿里Qwen开源模型为什么能火？

阿里Qwen开源模型能火，是因为它用过硬的技术、开放的态度和实惠的价格，..

谁是开源大模型之王？Llama、DeepSeek还是Qwen？

“友商，你们拿什么和我比？”“友商，你们拿什么和我比？”这不是哪家公..

开源Qwen一周连刷三冠，暴击闭源模型！基础模型推理编程均SOTA..

鱼羊发自凹非寺量子位 | 公众号 QbitAI卷疯了，通义千问真的卷疯了。Qw..

Qwen负责人转发2025宝藏论文，年底重读「视觉领域GPT时刻」..

闻乐发自凹非寺量子位 | 公众号 QbitAI2025最后几天，是时候来看点年度..

成本骤降97% 实测Qwen3.5小模型国产大模型破局？

阿里推出Qwen3.5系列三款中型开源大模型，性能媲美国际顶尖竞品，开发者..

曝京东拦截员工使用外部AI，美团内部开始限制阿里Qwen模型..

IT之家 4 月 8 日消息，据“大厂日爆”公众号消息，京东在 3 月底正式限..

关于作者

大男孩(普通会员)

文章

1999

关注

0

粉丝

0

点击领取今天的签到奖励!

猜你喜欢

01

DeepSeek 究竟是个啥？一文带你看明白

2025/02/08

02

微信聊天时，女人说“哼哼”，10个高情商回复

2023/10/04

03

聊天交友软件常用骗局（套路）交友需小心！

2023/07/15

04

这怕是全网最强的 DeepSeek 图片教程吧，赶紧收藏了！

2025/02/09

05

AI 界黑马DeepSeek 超详细介绍

2025/02/09

标签云

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体106085

@2022 All Rights Reserved

浙ICP备19035174号-6 技术支持：千寻网络

0

0

分享

请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索