> 自媒体 > (AI)人工智能 > 夸克背后最新Qwen闭源模型意味着什么?
夸克背后最新Qwen闭源模型意味着什么?
来源:王智远
2026-04-30 20:59:16
169
管理

有时候我们找东西,是在「搜资源」。

大多数资源都太散太杂怎么办?我这次换了个思路,直接问夸克:有没有心理学书籍的网盘资源?

它给我列出了一份清单,338 本心理学书籍,书名、作者、文件大小全都有,里面还有马斯洛、荣格、阿德勒这些经典著作。

有些链接,我点进去就能直接存进自己的夸克网盘;有些给的是下载方式,整个过程还挺顺,它帮我把“找”和“存”这两件事,一起干完了。

所以我,玩了将近一天,我才意识到:这已经不是单纯的「能聊天」了,它「能干活」。

体验完这几件「能干活」的小事,再看外部进展。

最近,OpenAI 也推出了浏览器功能,让 ChatGPT 能「自己去找」,这是AI发展的第二个阶段,从「能说话」到「能思考」。

夸克这一步「边找边干」的动作,也有异曲同工之处。

问问题同时,它已经在后台完成搜索、筛选、整合、比对,然后把结论整理成一段能直接使用的回答。

这种能力在交互上是质变的,因为作为一个用户,我不用手动去查、去点、去拼,直接得到「已经验证过的答案」,很方便。

也就是说,它把搜索和执行融合成了一件事。

02

如果说,豆包代表「陪聊型AI」,价值在于帮用户表达、陪伴、娱乐;那么,夸克方向更像「任务型AI助理」,它的核心是解决问题、完成任务。

两条路都没错,一个在训练AI的「情感力」,一个在强化AI的「执行力」;但从用户角度看,这次夸克明显更接近「能帮我干点实事」的那个AI。

所以,我觉得,这次变化不只是产品层面的,AI助手这件事,正在迎来一个分水岭:

从陪聊,到帮忙;从生成信息,到执行动作;从理解问题,到完成任务,而夸克,正好站在这条分界线上,它在探索新机会点。

夸克这次的「聪明」,背后有一颗全新「脑子」。

我查了下,它用的是阿里最新 Qwen 闭源模型。这个模型定位有点意思,介于「实验室」和「落地」之间,属于那层最核心的引擎。

怎么理解呢?

过去我们说 AI 模型厉害,大多是形容它“知道得多”,但 Qwen 的强,是在「理解力」和「执行力」上;它能听懂模糊的问题,也能给出清晰的决策,这背后靠的阿里那颗「闭源大脑」。

闭源,不是封闭,更像是一种「可控的极致」;它让模型的稳定性、准确率、响应逻辑,都被打磨到工程级的水准。

这次 Qwen 闭源版,性能已经比 Qwen3-Max 更强一档,从去年到现在,在几乎所有国际榜单上都进了第一梯队。

03

第一梯队这话,我说了不算,有数据可以作证。

比如:

Qwen3-Max 在 Chatbot Arena 上总分 1433 分,全球第三、开源模型第一;在大模型用coding解决真实世界问题SWE-Bench Verified 测试中拿下 69.6 分,跻身全球第一梯队;

在聚焦Agent工具调用能力的Tau2-Bench 测试中得 74.8 分,超过 Claude Opus 4 和 DeepSeek-V3.1;在数学推理的 AIME25 和 HMMT 测试中,更是双双拿到满分 100,这是国内第一次。

等等,有些英文你可能不太懂,我解释一下:

Chatbot Arena 是测「聊天综合水平」的;SWE-Bench 是测「写代码解决问题」的;Tau2-Bench 是测「AI调工具、连系统」的。

而 AIME25、HMMT,就是数学圈最硬核的两场考试,能拿满分,差不多等于 AI 在全球数学竞赛上考了第一。

所以,这一串数据说明一个很简单的事实:Qwen 的这颗「脑子」,是让 AI 终于长出了逻辑中枢。

举个简单例子:

你问它:「中国未来的新能源车会不会降价?」

普通模型大概率跟你扯一堆宏观分析;而 Qwen 会先分析市场结构,再拆变量,最后得出趋势,它不仅有答案,还知道答案是怎么来的。

这就是闭源模型的意义,它代表一种「工程化的确定性」,阿里在用闭源路线,让 AI 从「能输出」变成「能交付」,让每一句回答,都能自证逻辑。

所以,智远认为夸克「AI对话助手」模型的脑子,已经换代了。

阿里现在在用夸克验证「模型驱动的生活系统」,未来文档、网盘、邮箱、搜索、浏览器,都会被AI重新组织,你在一个入口提问,它能调用整个体系去完成。

换句话说,这是一次「模型—系统—生态」的打通,模型成了基础设施,让模型能从场景里长大,在生态里反馈,在使用中自我迭代。

智远判断,这是一场底层协议的改写。

当模型能在应用中自学习、自反馈、自优化时,它就成了一个会自己演化的系统。

阿里过去做电商、做云计算、做支付系统,都在解决人和系统效率的问题,现在,他们开始解决另一个问题:智能体之间的效率。

从搜索、到对话,到推理,再到能干活,AI助手已经进入第三阶段;而夸克,是这条进化线上,第一个能「跑起来」的窗口。

但问题是:当 AI 从会说、会想,进化到会做之后,下一个阶段又会是什么呢?值得进一步关注。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
Kimi团队发布K1.5:让AI像人类一样\u0026#34;边思考边学习\u0026#34;的突破..
这项由Kimi团队开展的研究发表于2025年6月3日,详细介绍了他们最新的多模..
DeepSeek对比Kimi:两个国产AI谁更适合办公?实测告诉你答案..
说实话,最近AI工具多得让人眼花缭乱。DeepSeek和Kimi,两个名字我都听过..
涉嫌违规收集个人信息 Kimi等多款AI应用被通报
5月20日,国家网络与信息安全信息通报中心发布通报,经公安部计算机信息..
阿里Qwen开源模型为什么能火?
阿里Qwen开源模型能火,是因为它用过硬的技术、开放的态度和实惠的价格,..
谁是开源大模型之王?Llama、DeepSeek还是Qwen?
“友商,你们拿什么和我比?”“友商,你们拿什么和我比?”这不是哪家公..
开源Qwen一周连刷三冠,暴击闭源模型!基础模型推理编程均SOTA..
鱼羊 发自 凹非寺量子位 | 公众号 QbitAI卷疯了,通义千问真的卷疯了。Qw..
Qwen负责人转发2025宝藏论文,年底重读「视觉领域GPT时刻」..
闻乐 发自 凹非寺量子位 | 公众号 QbitAI2025最后几天,是时候来看点年度..
成本骤降97% 实测Qwen3.5小模型 国产大模型破局?
阿里推出Qwen3.5系列三款中型开源大模型,性能媲美国际顶尖竞品,开发者..
曝京东拦截员工使用外部AI,美团内部开始限制阿里Qwen模型..
IT之家 4 月 8 日消息,据“大厂日爆”公众号消息,京东在 3 月底正式限..
关于作者
呼唤(普通会员)
文章
1927
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体106085

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索