月之暗面开源 Kimi K2.6:13 小时不间断编码,SWE-Bench 超越 GPT-5.4

月之暗面开源 Kimi K2.6:13 小时不间断编码,SWE-Bench 超越 GPT-5.4

4 月 20 日晚,月之暗面发布并以 Apache 2.0 协议开源了 Kimi K2.6——1 万亿参数的编程大模型,被称为”迄今最强的开源代码模型”。

核心能力

  • 13 小时不间断编码:支持连续编写或修改超过 4000 行代码,覆盖 Python、Rust、Go 等
  • Agent 自主执行:面对”生成 2026 年 AI 编程助手报告”的复杂指令,能自动拆解任务、分步执行、自我验证
  • Agent 集群升级:支持多个 Agent 协作完成更大规模的编码任务

基准测试

在 SWE-Bench Pro 和 Terminal-Bench 2.0 等核心编程基准上,K2.6 超越了 GPT-5.4 和 Claude Sonnet,刷新了开源模型的记录。

定价策略

API 价格上调了 58%,官方解释为”算力成本与模型规模的合理匹配”。在 1/8 的价格下提供接近旗舰模型的编程性能。

开源威胁

月之暗面采取”模型开源、服务收费”策略,与 DeepSeek 的路线一致。对 OpenAI 和 Anthropic 而言,万亿参数级编程模型的开源比任何付费竞品都更具威胁——因为闭源模型的定价权被从根本上挑战了。

短板

长程推理仍有不足,数学问题的多步逻辑推导不如编码任务稳定。


主要来源:今日头条、百度百科、21经济网