> 自媒体 > (AI)人工智能 > 35小时自主闭环,阿里云发布Qwen3.7-Max:1541分超GPT-4o成国产首选
35小时自主闭环,阿里云发布Qwen3.7-Max:1541分超GPT-4o成国产首选
来源:运筹帷幄钢笔IuzgH
2026-06-04 19:56:28
56
管理
> Agent赛道正从"对话助手"迈向"自主执行者"。阿里云2026年5月发布的Qwen3.7-Max宣称能独立完成35小时芯片级优化任务,但在GPT-4o、文心一言5.1等强敌环伺下,它究竟是真实的生产力跃迁,还是又一场跑分游戏?本文从**长程任务、编程闭环、生态适配、成本效益**四个维度,用同一把尺子量遍主流模型。![](blockview://markdown-image-tos-cn-i-tt/f4a712de34a348b19a583842b6849512)## 长程任务,35小时是分水岭Qwen3.7-Max用一块陌生芯片证明了自己的耐力。在零硬件文档、零示例内核的前提下,它围绕平头哥真武M890持续自主编程35小时,执行**1158次工具调用**与**432次内核评估**,最终性能超越官方版本10倍,全程无人类干预。测试轨迹显示,模型在30小时后仍主动发起架构重设计,展现出超长程的持续专注与自我进化能力。同一把尺子下,差距清晰可见。GPT-4o支持复杂多步骤任务,工具调用链路成熟,但公开信息中缺乏同等时长的自主工程交付验证。文心一言5.1在LMArena搜索榜以**1223分**位列国内第一,核心优势在于检索增强与信息时效性,而非单任务长程闭环。至于通义千问3.6,虽具备长上下文支持能力,但在复杂任务的自主执行与持续迭代上,与3.7代存在明显代际差。## 编程闭环,1541分改写了国产天花板在代码领域,Qwen3.7-Max以量化成绩闯入全球顶尖梯队。Code Arena全球开发者盲测中,它得分**1541**,排名仅次于Claude系列,位列全球第二,是目前**唯一突破1540分的国产模型**。在Terminal Bench 2.0-Terminus测评中,它得分**69.7**,超过Claude-Opus4.6。![](blockview://markdown-image-tos-cn-i-tt/6d815345ed0c414b9ba9e36fb2339a11)这意味着它不仅能写代码,更能跑完从需求分析到测试迭代的全流程,将原本需专业团队两周的复杂项目压缩至数小时。横向来看,GPT-4o凭借完善的全球开发者生态,仍是编程工具链的标杆,但企业级部署费用昂贵。文心一言5.1在数学推理和Agent评估中表现亮眼,AIME26得分**99.6**,但其编程智能体更聚焦中文语境下的架构设计与搜索聚合。通义千问3.6仅具备基础闭环能力,面对复杂场景时自主迭代有限,与3.7代的"生产级交付"不在同一层面。## 生态适配与成本,谁更懂落地Agent的竞争从来不只是模型本身。Qwen3.7-Max通过千问云/Qwen Cloud将**150多款**主流模型API封装为标准化Skills,支持Claude Code、OpenClaw等主流框架一条指令接入,让Agent直接"学会"平台全部能力。![](blockview://markdown-image-tos-cn-i-tt/69241eddd5fc4ca1a2489c7dc4117e97)阿里云还为其配备了MuleRun多Agent协同平台、Qoder编程平台及真武M890芯片超节点服务器,形成从模型到基础设施的垂直闭环。成本维度上,第三方横评显示Qwen3.7-Max推理成本低于GPT-5.5,在输出速度与生成质量上具备综合优势。文心一言5.1则主打**极低成本**接近一线性能,在本土化价格战中优势明显。GPT-4o生态完善,但境外网络与高昂费用构成门槛。通义千问3.6依托阿里系协同,云生态成本较低,但模型能力代差使其难以承担复杂Agent任务。## 场景适配与最终判断不同需求,答案截然不同:- **复杂工程与长程自主任务**:Qwen3.7-Max是唯一具备35小时级交付能力的国产模型,适合芯片优化、全栈开发等硬核场景。- **中文搜索与知识密集型工作**:文心一言5.1凭借百度搜索RAG优势和本土化知识图谱,响应更顺手。- **全球化与通用工具链**:GPT-4o的插件生态与国际兼容性仍是短期难以绕过的选项。但如果只能选一个Agent基座,且你的目标是让模型从"说得好"变成"做得到",Qwen3.7-Max凭借35小时闭环实测和1541分的编程盲测成绩,是目前国产阵营中最该押注的那张牌。
0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
关于作者
帝王之星(普通会员)
文章
2018
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体112596

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索