关键信号
阿里通义千问的 Qwen 3.6 Max Preview 已悄然登陆 OpenRouter。这是阿里迄今为止参数量最大的模型——一万亿参数,采用稀疏混合专家(MoE)架构,但定价却远低于同级别竞品。
| 维度 | Qwen 3.6 Max Preview | Claude Opus 4.6 | GPT-5.5 |
|---|---|---|---|
| 参数规模 | 1 万亿(稀疏激活) | 未公开 | 未公开 |
| 上下文窗口 | 262K | 1M | 200K |
| 输入定价 | $1.30/M tokens | $15.00/M tokens | $10.00/M tokens |
| 输出定价 | $7.80/M tokens | $75.00/M tokens | $50.00/M tokens |
| 优化方向 | Agentic Coding, Tool Use | 通用推理 | Agentic 能力 |
| 开源权重 | ❌ | ❌ | ❌ |
价格差距一目了然:Qwen 3.6 Max Preview 的输入价格仅为 Claude Opus 4.6 的 1/11,输出价格为 1/10。
架构拆解
Qwen 3.6 Max Preview 的核心技术特征:
- 万亿参数稀疏 MoE:总参数量达 1T,但每次推理仅激活部分专家,实际计算量远低于稠密万亿模型。这意味着在同等硬件下吞吐量显著提升。
- 262K 上下文窗口:虽不及 Claude 的 1M 和 Gemini 的 2M,但足以覆盖绝大多数代码库级任务。
- Agentic Coding 专项优化:针对代码生成、多步工具调用、自主调试场景进行了专门微调。在 Terminal-Bench 和 SWE-bench 等基准上表现值得期待。
为什么值得关注
- 性价比碾压:对于需要大量 token 消耗的 Agent 场景(长上下文代码分析、多轮工具调用),Qwen 3.6 Max Preview 的成本优势显著。
- 阿里生态整合:预计将在阿里云百炼平台、通义灵码等内部产品中优先部署,国内开发者可快速接入。
- 开源跟进:此前 Qwen3.6-27B 已开源,社区反馈积极。Max 版本虽不开源,但证明了阿里在大模型技术上的持续投入。
行动建议
- 已有 Claude/GPT 订阅:可在 OpenRouter 上试用 Qwen 3.6 Max Preview 作为成本敏感型任务的主力模型,保留 Opus/GPT-5.5 处理高难度推理。
- 国内开发者:关注阿里云百炼平台后续接入,预计会有更优惠的企业定价。
- Agent 开发者:262K 上下文 + 低定价组合,非常适合需要长上下文代码库分析的自主编码 Agent 场景。
风险提示
- 目前仅为 Preview 版本,稳定性待验证
- 不开源权重,无法本地部署
- 中文语境下的实际表现仍需社区反馈