大模型动态

Qwen 3.6 Max Preview 登场：万亿参数 MoE 架构，每百万 token 仅 $1.30

2026年5月4日 by ChaoBro

#Qwen #通义千问 #MoE #Agentic Coding #OpenRouter

Qwen 3.6 Max Preview 登场：万亿参数 MoE 架构，每百万 token 仅 $1.30

关键信号

阿里通义千问的 Qwen 3.6 Max Preview 已悄然登陆 OpenRouter。这是阿里迄今为止参数量最大的模型——一万亿参数，采用稀疏混合专家（MoE）架构，但定价却远低于同级别竞品。

维度	Qwen 3.6 Max Preview	Claude Opus 4.6	GPT-5.5
参数规模	1 万亿（稀疏激活）	未公开	未公开
上下文窗口	262K	1M	200K
输入定价	$1.30/M tokens	$15.00/M tokens	$10.00/M tokens
输出定价	$7.80/M tokens	$75.00/M tokens	$50.00/M tokens
优化方向	Agentic Coding, Tool Use	通用推理	Agentic 能力
开源权重	❌	❌	❌

价格差距一目了然：Qwen 3.6 Max Preview 的输入价格仅为 Claude Opus 4.6 的 1/11，输出价格为 1/10。

架构拆解

Qwen 3.6 Max Preview 的核心技术特征：

万亿参数稀疏 MoE：总参数量达 1T，但每次推理仅激活部分专家，实际计算量远低于稠密万亿模型。这意味着在同等硬件下吞吐量显著提升。
262K 上下文窗口：虽不及 Claude 的 1M 和 Gemini 的 2M，但足以覆盖绝大多数代码库级任务。
Agentic Coding 专项优化：针对代码生成、多步工具调用、自主调试场景进行了专门微调。在 Terminal-Bench 和 SWE-bench 等基准上表现值得期待。

为什么值得关注

性价比碾压：对于需要大量 token 消耗的 Agent 场景（长上下文代码分析、多轮工具调用），Qwen 3.6 Max Preview 的成本优势显著。
阿里生态整合：预计将在阿里云百炼平台、通义灵码等内部产品中优先部署，国内开发者可快速接入。
开源跟进：此前 Qwen3.6-27B 已开源，社区反馈积极。Max 版本虽不开源，但证明了阿里在大模型技术上的持续投入。

行动建议

已有 Claude/GPT 订阅：可在 OpenRouter 上试用 Qwen 3.6 Max Preview 作为成本敏感型任务的主力模型，保留 Opus/GPT-5.5 处理高难度推理。
国内开发者：关注阿里云百炼平台后续接入，预计会有更优惠的企业定价。
Agent 开发者：262K 上下文 + 低定价组合，非常适合需要长上下文代码库分析的自主编码 Agent 场景。

风险提示

目前仅为 Preview 版本，稳定性待验证
不开源权重，无法本地部署
中文语境下的实际表现仍需社区反馈