本文翻译自 Something is afoot in the land of Qwen,原载于 Hacker News。
事件背景
过去几周,阿里巴巴 Qwen 团队发布了令人瞩目的 Qwen 3.5 开源权重模型家族。然而,就在这个关键时刻,该团队在过去的 24 小时内发生了高层离职事件。
一切始于 Junyang Lin(林俊阳)在 X 平台上发布的这条推文:
“me stepping down. bye my beloved qwen.” (我要离职了。再见了,我深爱的 Qwen。)
林俊阳是 Qwen 项目的首席研究员,是 2024 年以来推动开源模型发布的关键人物。
据我了解,这次离职的导火索可能与阿里巴巴内部的重组有关——一位从 Google Gemini 团队招聘的研究员被任命为 Qwen 的负责人。不过,这一细节尚未得到官方确认。
来自 36 氪的详细报道
36 氪对此事件进行了深入报道。根据该媒体的描述:
北京时间 3 月 4 日下午 1 点左右,通义实验室召开了紧急全员会议,阿里巴巴集团 CEO 吴泳铭坦诚地向千问员工说明了情况。
12 小时前(北京时间 3 月 4 日凌晨 0:11),阿里通义大模型技术负责人林俊阳在 X 平台突然宣布离职。林俊阳是推动阿里开源 AI 模型的核心人物,也是阿里最年轻的 P10 员工之一。在业界的哗然声中,许多 Qwen 成员也无法接受团队关键人物的突然离去。
“在资源远少于竞争对手的情况下,俊阳的领导是取得今天成果的核心因素之一,” 多位千问成员告诉 36 氪。
该报道还列出了其他几位已离职的核心成员:
- Binyuan Hui(惠彬源):Qwen 代码开发负责人,Qwen-Coder 系列模型的主创,负责从预训练到后训练的整个 agent 训练流程,近期还参与了机器人研究。
- Bowen Yu(余博文):Qwen 后训练研究负责人,毕业于中国科学院大学,领导 Qwen-Instruct 系列模型的开发。
- Kaixin Li(李开心):Qwen 3.5/VL/Coder 的核心贡献者,新加坡国立大学博士。
除了上述人员外,许多年轻研究员也在同一天离职。
事态仍不明朗
根据现有信息,一切仍然悬而未决。阿里巴巴 CEO 出席”紧急全员会议”表明,公司意识到这些离职事件的严重性,并可能仍在努力挽留部分人才。
下午 2 点左右,林俊阳在微信朋友圈再次发文:”Qwen 的兄弟们,按原计划继续,没问题”——但没有明确表示是否会回归。
Qwen 3.5 的技术亮点
这个故事之所以令人痛心,是因为 Qwen 3.5 模型确实非常出色。
新模型家族的规模令人印象深刻:
| 模型 | 参数规模 | 特点 |
|---|---|---|
| Qwen3.5-397B-A17B | 807GB | 首发旗舰模型 |
| Qwen3.5-122B | 122B | 中大型规模 |
| Qwen3.5-35B | 35B | 适合 64GB Mac 运行 |
| Qwen3.5-27B | 27B | 适合 32GB Mac 运行 |
| Qwen3.5-9B | 9B | 小型但高效 |
| Qwen3.5-4B | 4B | 轻量级 |
| Qwen3.5-2B | 2B | 仅 4.57GB(量化后 1.27GB) |
| Qwen3.5-0.8B | 0.8B | 超轻量 |
业界对 27B 和 35B 模型在编程任务上的表现评价很高,这些模型仍然可以在 32GB/64GB 的 Mac 上运行。我亲自测试了 9B、4B 和 2B 模型,发现它们在如此小的体积下表现相当出色。
特别值得一提的是 2B 模型——仅 4.57GB(量化后仅 1.27GB),却是一个完整的推理和多模态(视觉)模型!
对开源 AI 社区的影响
如果 Qwen 团队现在解散,那将是一个真正的悲剧。他们已经证明了自己有能力不断找到新方法,在越来越小的模型中获得高质量的结果。
这种”小模型、高性能”的能力对于 AI 的普及和本地部署至关重要。不是每个人都能负担得起运行数百 GB 的大模型,而 Qwen 团队的技术让更多人能够在自己的设备上使用高质量的 AI。
未来展望
如果这些核心 Qwen 团队成员创办新项目或加入其他研究实验室,我很期待看到他们的下一步动作。
开源 AI 领域需要这样的创新者。无论他们最终去向何方,他们对 AI 社区的贡献已经产生了深远的影响。
总结
- Qwen 团队核心成员(包括技术负责人林俊阳)在 3 月 4 日集体离职
- 此次离职可能与阿里内部重组有关,新任负责人来自 Google Gemini 团队
- 正值 Qwen 3.5 模型家族发布之际,该系列包含从 0.8B 到 397B 的多个模型
- Qwen 3.5 在小模型上实现了出色性能,2B 模型即支持推理和多模态
- 阿里 CEO 召开紧急会议,团队去向仍有变数
- 这支团队在”小模型高性能”方面的技术积累对开源 AI 社区至关重要
相关链接: