4 月 20 日,阿里巴巴发布了 Qwen 系列的最新旗舰模型早期预览版:Qwen3.6-Max-Preview。这是千问系列目前性能最强的模型,在多个维度上较此前的 Qwen3.6-Plus 有明显提升。
核心能力
Qwen3.6-Max-Preview 是一个纯文本模型,支持思考和非思考两种模式,但目前不支持图像等多模态输入。在第三方评测平台 Artificial Analysis 的智能指数排名中,该模型得分为 52 分,超过了 GLM-5.1 和 MiniMax-M2.7,成为榜单上得分最高的国产模型。
提升最显著的领域
- 智能体编程(Agent Coding):这是 Qwen3.6-Max-Preview 的核心升级方向。模型在理解复杂编程任务、多文件协作和代码自检方面有显著提升。有社区实测指出,在前端代码生成任务中,Qwen3.6-Max 的表现已经接近甚至在某些场景超越 Claude Opus。
- 世界知识:相比 Qwen3.6-Plus,在常识推理和事实性问答方面有明显改进。
- 长上下文理解:虽然具体的上下文窗口上限尚未完全披露,但从架构设计来看,长文档处理能力是重点优化方向。
架构与开源情况
阿里在同日开源了 Qwen3.6-27B 稠密模型(Apache 2.0 协议),定位为面向本地私有化、Agent 开发和代码工程的旗舰级开源模型。与 MoE 架构不同,27B 稠密模型没有路由开销,部署更简单。
| 模型 | 架构 | 参数量 | 开源 | 定位 |
|---|---|---|---|---|
| Qwen3.6-Max-Preview | 闭源(API) | 未披露 | 否 | 旗舰预览,最强性能 |
| Qwen3.6-27B | 稠密 Dense | 27B | Apache 2.0 | 本地部署,Agent 开发 |
| Qwen3.6-Plus | 未披露 | 未披露 | 否 | 上一代主力模型 |
与竞品的对比
在 Artificial Analysis 榜单上,Qwen3.6-Max-Preview 的 52 分意味着它已经进入了全球第一梯队。但需要注意几个边界:
- 纯文本限制:不支持多模态输入,在需要图像理解的场景中无法与 GPT-5.5、Claude 等支持视觉的模型直接竞争。
- 预览版:作为早期预览,模型的稳定性和 API 可用性还需要观察后续正式版的更新。
- 前端代码优势:有开发者实测反馈,在前端和 UI 代码生成场景中,Qwen3.6-Max 的表现优于 Claude Opus,但在后端逻辑和系统设计方面 Claude 仍有优势。这意味着模型选择应该基于具体任务而非笼统的”谁更强”。
行动建议
- Agent 开发者:如果你有编程 Agent 的需求,Qwen3.6-Max-Preview 的智能体编程能力提升值得试用,特别是前端和代码生成场景。
- 本地部署需求:Qwen3.6-27B 的 Apache 2.0 开源协议意味着商用免费且可二次微调,适合需要私有化部署的企业。
- 多模态场景:如果工作需要图像理解或生成,目前需要搭配其他模型使用。