实测Qwen3.6-27B：4分钟做了个跑酷游戏，验证码识别正确率超90%-工信会

> 自媒体 > （AI）人工智能 > 实测Qwen3.6-27B：4分钟做了个跑酷游戏，验证码识别正确率超90%

实测Qwen3.6-27B：4分钟做了个跑酷游戏，验证码识别正确率超90%

来源：智东西

2026-05-03 09:22:01

233

管理

它用时四分钟左右，写完了1200多行代码。从实测结果来看，游戏设计与前端实现上，Qwen3.6-27B基本还原了提示词中列举的全部核心要素：玩家的跳跃、二段跳等均已实现，添加了无人机、针刺等障碍物，能量电池、金币、磁铁等均可拾取。美术风格符合设定，UI层完整展示了血量、分数、速度、距离等指标，游戏可玩性强。

但细节层面仍存在一些小问题，针刺悬浮在天上有点怪；吃到电池后，没有能量条显示；撞到箱子，就自动过去了，没有扣除血量。

另外，我们还让Qwen3.6-27B制作了个人记账应用，考察的是模型应用开发能力和对闭环设计的理解，包括统计逻辑怎么算、数据怎么持久化、异常输入怎么拦截，比写一个静态页面要复杂得多。

在应用开发上，Qwen3.6-27B的表现相对稳健。生成的应用完整实现了记录的增删改查、按月份筛选、总收入/总支出/结余的统计以及近7天收支趋势图表，刷新页面后数据没有丢失，说明localStorage持久化已正确实现。

唯一的小Bug是刷新页面后，7日收支柱状图一度不显示，再记一笔账后恢复，属于“初始渲染时机”问题。模型在异步状态初始化的顺序上，没处理到位。从界面上看，这个记账应用视觉设计较为简约，是一套偏实用向的标准控件组合。业务逻辑维度上，它把一个日常工具该有的数据流、统计逻辑与异常处理都串起来了，对于应用开发全流程的理解比较清晰。

之后，我们还让它做了个新闻网站前端设计，看起来还是有模有样的。

Qwen3.6-27B自行规划，分了科技、财经、体育、娱乐、健康五大板块，设有国内新闻和国际新闻，界面右侧，还展示了热门排行、标签、北京的天气，甚至把商业化都想好了，留出了广告的位置。界面条理清晰，内容完整，可视化效果好，模型对“一个新闻网站长什么样”有较为成熟的认知。

二、多模态能力：识别验证码、找不同，通通拿下

作为原生多模态模型，Qwen3.6-27B支持视觉语言思考与非思考模式，可处理图像、视频与文本的联合理解，覆盖视觉推理、文档理解、视觉问答等场景，能力基本上与Qwen3.5-397B-A17B想当。

Qwen3.6-27B识别出了5处差异，不同难度的不同点都注意到了：鸟窝、打开的书、灯笼、颜色差异，还有墙上的挂饰，这个我自己一开始都没注意到。

值得注意的是，它的思考过程非常简单，简单比对就完成了分析，而且描述也很清晰，展示出模型的较强的视觉识别与推理能力。

结语：阿里开源战略渐趋聚焦，27B模型瞄准开发者核心需求

Qwen3.6系列的发布，折射出阿里在开源策略的转向。此前，阿里曾开源从几十亿参数量到数千亿参数量的各种模型，但本次Qwen3.6系列仅开源了小尺寸MoE模型和稠密模型，体现出其开源战略的聚焦。

此类小模型面向开发者、研究者及小团队，可以直接本地部署，或在其基础上做进一步研究和微调。Qwen3.6-27B恰好卡在了这个需求的中心位置。

开源社区对这一尺寸的模型呼声很高；从实际价值看，27B的稠密模型也更能满足开发者对部署灵活性和可控性的现实要求。

赏礼

赏钱

免责声明：本文仅代表作者个人观点，与本站无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。凡本网注明 “来源：XXX（非本站）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。 QQ：617470285 邮箱：617470285@qq.com

阿里千问开源4款Qwen3.5小尺寸模型，满足资源受限至轻量应用不同需求

1个月前

AI大模型实盘投资竞赛终局：阿里千问Qwen夺冠，中国2款大模型收益率领跑

1个月前