Qwen3.6 35B A3B 蒸馏版发布：社区用 Claude Opus 推理数据训练出 72GB 开源模型

结论先行

HuggingFace 社区开发者 Jackrong 发布了 Qwen3.6 35B A3B 蒸馏版，使用 Claude Opus 的推理输出进行知识蒸馏。模型文件大小 71.9GB，GGUF 量化版本即将推出。

这意味着什么：社区正在用闭源旗舰模型的推理数据”喂”给开源模型，让开源模型在推理能力上逼近闭源旗舰。这种”蒸馏蒸馏再蒸馏”的模式正在成为开源社区追赶闭源模型的核心路径。

Qwen3.6 35B A3B 是一个 MoE（Mixture of Experts） 架构模型，特点是：

用 Claude Opus 的推理数据蒸馏到这个架构上，相当于让一个”跑得快的底盘”装上了”旗舰级的引擎”。

Claude Opus 推理数据（教师）
         ↓
    生成高质量推理链
         ↓
Qwen3.6 35B A3B（学生）
         ↓
    学习推理模式 + 知识迁移
         ↓
    蒸馏后的开源模型

这种蒸馏方式的核心优势：

维度	原版 Qwen3.6 35B	蒸馏版（Opus 数据）	Claude Opus 4.6
参数规模	35B (激活3B)	35B (激活3B)	闭源，估计数百亿B
推理能力	Qwen 原生	融合 Opus 推理模式	旗舰级
推理速度	快（3B激活）	快（3B激活）	取决于 API
开源	✅	✅	❌
本地部署	✅	✅	❌
成本	免费	免费	按 token 计费

这个蒸馏模型代表了一个明确的趋势：开源社区正在通过”蒸馏闭源旗舰输出”的方式快速缩小能力差距。

Jackrong 之前已经做过多个成功的蒸馏项目，这次选择 Qwen3.6 35B A3B 作为底座，说明这个 MoE 架构在社区的认可度正在快速上升。对于需要在本地部署强推理能力的场景，这是一个值得关注的选项。