> 自媒体 > (AI)人工智能 > 实测Qwen3.6-27B:4分钟做了个跑酷游戏,验证码识别正确率超90%
实测Qwen3.6-27B:4分钟做了个跑酷游戏,验证码识别正确率超90%
来源:智东西
2026-05-03 09:22:01
195
管理

它用时四分钟左右,写完了1200多行代码。从实测结果来看,游戏设计与前端实现上,Qwen3.6-27B基本还原了提示词中列举的全部核心要素:玩家的跳跃、二段跳等均已实现,添加了无人机、针刺等障碍物,能量电池、金币、磁铁等均可拾取。美术风格符合设定,UI层完整展示了血量、分数、速度、距离等指标,游戏可玩性强。

但细节层面仍存在一些小问题,针刺悬浮在天上有点怪;吃到电池后,没有能量条显示;撞到箱子,就自动过去了,没有扣除血量。

另外,我们还让Qwen3.6-27B制作了个人记账应用,考察的是模型应用开发能力和对闭环设计的理解,包括统计逻辑怎么算、数据怎么持久化、异常输入怎么拦截,比写一个静态页面要复杂得多。

在应用开发上,Qwen3.6-27B的表现相对稳健。生成的应用完整实现了记录的增删改查、按月份筛选、总收入/总支出/结余的统计以及近7天收支趋势图表,刷新页面后数据没有丢失,说明localStorage持久化已正确实现。

唯一的小Bug是刷新页面后,7日收支柱状图一度不显示,再记一笔账后恢复,属于“初始渲染时机”问题。模型在异步状态初始化的顺序上,没处理到位。从界面上看,这个记账应用视觉设计较为简约,是一套偏实用向的标准控件组合。业务逻辑维度上,它把一个日常工具该有的数据流、统计逻辑与异常处理都串起来了,对于应用开发全流程的理解比较清晰。

之后,我们还让它做了个新闻网站前端设计,看起来还是有模有样的。

Qwen3.6-27B自行规划,分了科技、财经、体育、娱乐、健康五大板块,设有国内新闻和国际新闻,界面右侧,还展示了热门排行、标签、北京的天气,甚至把商业化都想好了,留出了广告的位置。界面条理清晰,内容完整,可视化效果好,模型对“一个新闻网站长什么样”有较为成熟的认知。

二、多模态能力:识别验证码、找不同,通通拿下

作为原生多模态模型,Qwen3.6-27B支持视觉语言思考与非思考模式,可处理图像、视频与文本的联合理解,覆盖视觉推理、文档理解、视觉问答等场景,能力基本上与Qwen3.5-397B-A17B想当。

Qwen3.6-27B识别出了5处差异,不同难度的不同点都注意到了:鸟窝、打开的书、灯笼、颜色差异,还有墙上的挂饰,这个我自己一开始都没注意到。

值得注意的是,它的思考过程非常简单,简单比对就完成了分析,而且描述也很清晰,展示出模型的较强的视觉识别与推理能力。

结语:阿里开源战略渐趋聚焦,27B模型瞄准开发者核心需求

Qwen3.6系列的发布,折射出阿里在开源策略的转向。此前,阿里曾开源从几十亿参数量到数千亿参数量的各种模型,但本次Qwen3.6系列仅开源了小尺寸MoE模型和稠密模型,体现出其开源战略的聚焦。

此类小模型面向开发者、研究者及小团队,可以直接本地部署,或在其基础上做进一步研究和微调。Qwen3.6-27B恰好卡在了这个需求的中心位置。

开源社区对这一尺寸的模型呼声很高;从实际价值看,27B的稠密模型也更能满足开发者对部署灵活性和可控性的现实要求。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
关于作者
有点醉(普通会员)
文章
1933
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体106516

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索