> 自媒体 > (AI)人工智能 > Qwen 3.5 的口碑持续走高,林俊旸辞职出走,开源阵营震荡
Qwen 3.5 的口碑持续走高,林俊旸辞职出走,开源阵营震荡
来源:MacTalk
2026-05-06 15:02:59
148
管理

这件事值得记上一笔。

理一理时间线,事情的起点是林俊旸(Junyang Lin,@JustinLin610)3 月 4 日在 X 上发的一句话:“我要辞职了。再见,我深爱的 Qwen。”

看娱乐八卦和社会行为,去微博;AI 和科技领域的事儿,还是推特上更及时靠谱。

1

如果你这两年一直关注大模型的开源生态,大概率见过这个名字。作为通义千问的首席研究员、阿里最年轻的 P10 员工之一,林俊旸是 2024 年以来一系列开源权重背后的关键人物,和站在台前讲 ppt 的人不一样,他是通过一篇篇技术报告和一个个新的 checkpoint 被社区记住的科学家和技术专家,是阿里巴巴通义千问(Qwen)系列模型的研发主导者和灵魂人物。

这件事情发酵了有两天,我昨晚忙完工作仔细阅读了相关的公开报道和 x.com 上的内容,大致背景是这样的:随着千问上升到了阿里集团核心战略层面,阿里巴巴开始进一步提升团队人才密度,引入在大规模模型研发、工程化落地等领域具备深厚经验的顶尖领军人才,比如年初进入阿里的前 Google DeepMind 研究员周昊(曾在 Meta 和 Google DeepMind 做研究,是 Gemini 3.0 的贡献者之一,方向偏推理和工具调用),这些举措应该造成了林俊旸原本负责的权责范围被调整。

北京时间 3 月 4 日下午一点左右,通义实验室召开了一场紧急全员大会,阿里巴巴集团 CEO 吴泳铭亲自到场沟通。林俊旸在 X 上突然宣布离职让很多千问成员感到震惊,在资源远少于竞争对手的情况下,他们普遍认为,俊旸的专业能力和领导力,是千问能在开源赛道杀出重围的核心因素之一。

下午两点左右,林俊旸又在朋友圈发了一条:“千问的兄弟们,按原计划继续,没问题。” 这句话像是在安抚情绪,没有任何明确的去向和承诺,更像是在说:“就算我走了,你们也知道自己在干嘛。”

同一天宣布离开的,还有几位 Qwen 的核心骨干:

负责代码模型和 Qwen-Coder 系列的惠彬原;

负责后训练研究、主导 Qwen-Instruct 系列的余博闻;

以及在 Qwen 3.5/VL/Coder 中都有重要贡献的李开心。

最终,这个会议并没有改变事情的走向,吴泳铭在内部邮件中回应林俊旸离职一事:

> 各位通义实验室同学:公司已决定批准林俊旸同学的辞职,感谢林俊旸过去在岗位上的付出。阿里将继续坚持开源模型策略,持续加大 AI 研发投入和吸纳优秀人才力度,公司将成立基础模型支持小组。

2

Qwen 3.5:来得太晚,还是走得太早?

这件事在社区里是什么表现呢?一石激起千层浪。因为太可惜了。Qwen 3.5 系列非常出色,有一种“黑豹乐队好容易打开了局面,窦唯却准备离开”的荒诞感。

今年 2 月 17 日,Qwen 团队开源了 Qwen3.5-397B-A17B。这是一个 807GB 的巨无霸,参数规模和工程复杂度都不低。更重要的是,这不是一锤子买卖,而是一整套家族系列的开端。短短几周之内,他们又接连发布了 122B、35B、27B、9B、4B、2B、0.8B 等一系列不同尺寸的权重。

从工程角度看,这样的布局很“开发者”。有大集群的,可以玩 397B;想在高端显卡上跑的,选 35B 或 27B;如果你只有一台 32GB/64GB 的 Mac,也可以用 27B、35B 当本地助手折腾一下。再往下是 4B、2B、0.8B 这种体量,还可以在各种边缘场景里找到用武之地。

过去这段时间,我陆续听到不少开发者在夸 27B 和 35B 的编程能力,在代码生成、补全、解释上都给出过超出预期的反馈。更有意思的是,小模型一点都不“摆烂”——我自己在 LM Studio 里试了 9B、4B 和 2B,在这么小的体积里,还能做一个完整的多模态推理模型,这在一年前几乎是想都不敢想的事情。

那个 2B 模型量化后只有 2G 多,你可以把它丢在一台入门级设备上,让它看图、理解文本、做一些轻量推理任务。对于今天这个“万物要接 AI”的时代,这样的模型就像一个可以插在任何 USB 口上的智能接头——插上就能用,不再依赖一条去云端的网线。

更关键的是,Qwen 3.5 系列展现出来的,是一条清晰的技术路线:在资源拮据的前提下,如何通过工程手段、架构设计和训练策略,把“性价比”这件事做到最好。当年 DeepSeek 就这么干的。

社区为什么那么大反应?因为这些核心人员走了,实在可惜啊。

3

说起来,咱都是局外人,最多算个用户。真相如何,也许只有当事人知道,但大厂战略和技术路线拉扯这个事并不孤立。

过去一年,大模型团队的“重组—出走—再创业”已经成了一个反复上演的模式:

国内外的大厂和 AI 创业公司(OpenAI、Anthropic、Kimi、MiniMax 等)在发展策略上是完全不一样的。后者直接就是云原生,做基模和工具。前者早期都是在原有的云计算、广告、电商等主业之上叠了一块 AI 战略,希望描绘出一个“更大”的故事。

随着 AI 影响力的爆发,模型能力的增强,战略上的调整,大厂的 AI 团队在不停拓展自己的边界。那些从零到一把模型做起来的人,在这个过程中,很容易走到一个需要做选择的位置。

当一件事做大了之后,这件事就不是你的事了,是组织的。这里面有“理想 vs 现实”的问题,也有“工程师文化 vs 组织文化”的博弈。

在资源远少于对手的情况下, Qwen 能跑到今天这个位置,很明显是那群年轻人拼出来的。一边是算力预算、一边是产品迭代节奏,中间还有开源社区的期待,还有组织结构的调整……这种高压环境下的微妙平衡,其实非常难以掌握。

一旦这样的人选择离开,新来的负责人能否撑起产品和市场期待?是否认同原来的技术路线和开源策略?核心成员会不会愿意在空降领导麾下继续工作……这些问题,在公告里是看不到答案的,只能交给时间和结果。

4

过去一年,中国的大模型开源阵营强势崛起,DeepSeek、Qwen、ernie、Moonshot AI(Kimi)、Z.ai(GLM)、MiniMax 等,反复出现在全球榜单,同时在我们这样的国内开发者心里撑起了某种“我们也可以”的信心。

尤其是 Qwen,有阿里云的基础设施、有大厂的工程能力;另一方面,是它在开源策略上的还是挺激进的:不断放出高质量的权重,把 0.5B 到几百 B 的整个模型领域填得越来越满。

中国的开源实验室,让做 AI 应用的团队,多了很多“本地可用”的选择,不必事事依赖闭源 API;做研究的人,多了一堆可以 fork、可以调整的基线;甚至普通的开发者,也能在自己电脑上跑起一个像样的模型,而不是永远停留在“注册账号→充钱→依赖一个黑盒子”的这件事上。

Qwen 3.5 很可能会成为一个标志性版本——它既代表了一段技术高光时刻,也可能标记着一个阶段的结束。

但故事不会就此终止。人才流动—团队重组—新项目诞生,本来就是技术和产品生态的常态。AI 时代,这个变化会更加剧烈。

5

前天推荐了锤科前同事刘炯的作品 Tabbit,我写到:这个时代最佩服的还是有作品的人。

林俊旸们做出了优秀的开源产品,这个无论他是否离开团队,Qwen 都是他们团队的代表作。期待这些年轻人未来有更好的作品问世。

至于开发者和公司,Qwen 3.5 的权重已经开源,有阿里托底,该咋用咋用。更健康的看法是——模型只是当下最合适的工具,人则是有自己人生路线的创作者,而不是公司附属品。

已经被验证的技术路线不会凭空消失,模型也不会轻易被遗忘。对普通开发者来说,关注趋势和变化,保持对好工具的敏感度,然后用 AI 增强自己和团队的能力,大概就可以了。大家都得继续向前。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
关于作者
清水大树(普通会员)
文章
2045
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体107590

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索