2026 年 4 月 23 日,小米发布了 MiMo-V2.5 系列全模态大模型,包含 V2.5(通用版)和 V2.5-Pro(旗舰版)。一个月后,该模型在 Chatbot Arena 上的成绩证实了小米在大模型领域的投入已经进入第一梯队。
Arena 成绩
根据 LMSYS Chatbot Arena 的公开数据和小米官方披露:
- Arena 文字榜全球第六(约 1489 分区间),是排名最高的开源模型
- Agent 专项指数开源第一,在所有大模型中跻身前五
- 全球开源大模型综合智能指数并列第一
这些成绩意味着 MiMo-V2.5-Pro 在真实用户对话中的表现,已经超过了 GPT-5.5(Arena 文字榜第七)和绝大多数闭源模型。
核心能力
MiMo-V2.5-Pro 的关键特性集中在三个方向:
智能体(Agent)能力。 Agent 专项指数开源第一说明该模型在工具调用、多步骤任务规划和自主执行方面有显著优势。这与小米在 IoT 生态中积累的 Agent 开发经验有关——智能家居场景天然需要模型具备多设备协调和长流程执行的能力。
百万级长文本处理。 支持 100 万+ token 的上下文窗口,对于代码库分析、法律文档审查、长视频字幕理解等场景非常实用。在同等基准分数下,MiMo-V2.5-Pro 的 token 使用效率相对较低,意味着达到相同输出质量所需的计算量更少。
全模态覆盖。 MiMo-V2.5 系列包含文本、语音(V2.5-TTS Series)等多个模态,是少有一站式覆盖多模态的开源模型系列。
生态适配
小米宣布 MiMo-V2.5 系列已适配几乎所有国产推理芯片,这对于国内企业用户来说是一个重要的可用性指标。这意味着模型可以在不依赖英伟达 GPU 的情况下部署,降低了供应链风险和部署成本。
此外,小米已官宣该系列即将开源。考虑到小米在硬件和 IoT 领域的生态整合能力,MiMo-V2.5-Pro 一旦全面开源,很可能在端侧部署和 IoT Agent 场景中获得快速采用。
与同类模型对比
| 维度 | MiMo-V2.5-Pro | Qwen3.6-35B-A3B | GLM-5.1 |
|---|---|---|---|
| Arena 文字 | 全球第六 / 开源第一 | 未进入 Top 10 | 未进入 Top 10 |
| 代码能力 | 中等 | SWE-bench 接近 Claude 4.5 | Arena 代码榜第五 |
| 长上下文 | 百万+ token | 百万+ token | 未明确 |
| 多模态 | 文本 + 语音 | 文本为主 | 文本为主 |
| 国产芯片适配 | 几乎全覆盖 | 部分支持 | 未明确 |
MiMo-V2.5-Pro 的差异化在于 Agent 能力和生态适配,而不是纯粹的基准分数。如果你需要一个能跑在国产芯片上、能处理长文本、能协调多设备任务的开源模型,它是目前最好的选择之一。
适用场景与建议
- IoT / 智能家居开发: MiMo-V2.5-Pro 的 Agent 能力和小米生态整合是天然优势。
- 国产芯片部署团队: 适配覆盖面广,降低了硬件依赖。
- 长文档处理: 百万 token 上下文 + 高效 token 使用,适合法律、金融等需要大量上下文分析的场景。
- 通用 AI 应用: Arena 成绩证明其在通用对话能力上已经达到第一梯队,可作为 Claude/GPT 的平替方案。
主要来源: