阿里发布 Qwen3.6-Max-Preview：千问最强旗舰，智能体编程能力显著提升

4 月 20 日，阿里巴巴发布了 Qwen 系列的最新旗舰模型早期预览版：Qwen3.6-Max-Preview。这是千问系列目前性能最强的模型，在多个维度上较此前的 Qwen3.6-Plus 有明显提升。

核心能力

Qwen3.6-Max-Preview 是一个纯文本模型，支持思考和非思考两种模式，但目前不支持图像等多模态输入。在第三方评测平台 Artificial Analysis 的智能指数排名中，该模型得分为 52 分，超过了 GLM-5.1 和 MiniMax-M2.7，成为榜单上得分最高的国产模型。

智能体编程（Agent Coding）：这是 Qwen3.6-Max-Preview 的核心升级方向。模型在理解复杂编程任务、多文件协作和代码自检方面有显著提升。有社区实测指出，在前端代码生成任务中，Qwen3.6-Max 的表现已经接近甚至在某些场景超越 Claude Opus。
世界知识：相比 Qwen3.6-Plus，在常识推理和事实性问答方面有明显改进。
长上下文理解：虽然具体的上下文窗口上限尚未完全披露，但从架构设计来看，长文档处理能力是重点优化方向。

阿里在同日开源了 Qwen3.6-27B 稠密模型（Apache 2.0 协议），定位为面向本地私有化、Agent 开发和代码工程的旗舰级开源模型。与 MoE 架构不同，27B 稠密模型没有路由开销，部署更简单。

在 Artificial Analysis 榜单上，Qwen3.6-Max-Preview 的 52 分意味着它已经进入了全球第一梯队。但需要注意几个边界：

纯文本限制：不支持多模态输入，在需要图像理解的场景中无法与 GPT-5.5、Claude 等支持视觉的模型直接竞争。
预览版：作为早期预览，模型的稳定性和 API 可用性还需要观察后续正式版的更新。
前端代码优势：有开发者实测反馈，在前端和 UI 代码生成场景中，Qwen3.6-Max 的表现优于 Claude Opus，但在后端逻辑和系统设计方面 Claude 仍有优势。这意味着模型选择应该基于具体任务而非笼统的”谁更强”。