C
ChaoBro

Qwen 3.6 Max Preview 登场:万亿参数 MoE 架构,每百万 token 仅 $1.30

Qwen 3.6 Max Preview 登场:万亿参数 MoE 架构,每百万 token 仅 $1.30

关键信号

阿里通义千问的 Qwen 3.6 Max Preview 已悄然登陆 OpenRouter。这是阿里迄今为止参数量最大的模型——一万亿参数,采用稀疏混合专家(MoE)架构,但定价却远低于同级别竞品。

维度Qwen 3.6 Max PreviewClaude Opus 4.6GPT-5.5
参数规模1 万亿(稀疏激活)未公开未公开
上下文窗口262K1M200K
输入定价$1.30/M tokens$15.00/M tokens$10.00/M tokens
输出定价$7.80/M tokens$75.00/M tokens$50.00/M tokens
优化方向Agentic Coding, Tool Use通用推理Agentic 能力
开源权重

价格差距一目了然:Qwen 3.6 Max Preview 的输入价格仅为 Claude Opus 4.6 的 1/11,输出价格为 1/10

架构拆解

Qwen 3.6 Max Preview 的核心技术特征:

  • 万亿参数稀疏 MoE:总参数量达 1T,但每次推理仅激活部分专家,实际计算量远低于稠密万亿模型。这意味着在同等硬件下吞吐量显著提升。
  • 262K 上下文窗口:虽不及 Claude 的 1M 和 Gemini 的 2M,但足以覆盖绝大多数代码库级任务。
  • Agentic Coding 专项优化:针对代码生成、多步工具调用、自主调试场景进行了专门微调。在 Terminal-Bench 和 SWE-bench 等基准上表现值得期待。

为什么值得关注

  1. 性价比碾压:对于需要大量 token 消耗的 Agent 场景(长上下文代码分析、多轮工具调用),Qwen 3.6 Max Preview 的成本优势显著。
  2. 阿里生态整合:预计将在阿里云百炼平台、通义灵码等内部产品中优先部署,国内开发者可快速接入。
  3. 开源跟进:此前 Qwen3.6-27B 已开源,社区反馈积极。Max 版本虽不开源,但证明了阿里在大模型技术上的持续投入。

行动建议

  • 已有 Claude/GPT 订阅:可在 OpenRouter 上试用 Qwen 3.6 Max Preview 作为成本敏感型任务的主力模型,保留 Opus/GPT-5.5 处理高难度推理。
  • 国内开发者:关注阿里云百炼平台后续接入,预计会有更优惠的企业定价。
  • Agent 开发者:262K 上下文 + 低定价组合,非常适合需要长上下文代码库分析的自主编码 Agent 场景。

风险提示

  • 目前仅为 Preview 版本,稳定性待验证
  • 不开源权重,无法本地部署
  • 中文语境下的实际表现仍需社区反馈