Kimi K3 前瞻：2.5 万亿参数 + 百万级上下文，月之暗面的下一张王牌

信号

Kimi K2.6 刚宣布 6 月上线，月之暗面的下一代旗舰 Kimi K3 的情报已经流出。据多方信源交叉验证，K3 正处于内部密集测试阶段，预计今年 Q3 正式发布。

核心参数令人瞩目：模型总规模超过 2.5 万亿参数，内部实验已跑通远超 100 万 token 的上下文长度。

Kimi K2.6 已经是一个 1.1 万亿参数的 MoE 模型，K3 直接把规模拉到 2.5 万亿以上。这不是简单的”参数堆料”——在 MoE（混合专家）架构下，每次推理只激活一部分专家，实际计算量可控，但模型容量和知识密度实现了质的提升。

值得注意的是，DeepSeek V4 Flash / Pro 已经把 1M 上下文的价格打到了极低水平，而 Kimi K3 选择在同一维度上继续加码，说明长上下文 + 大规模 MoE 已经成为国产头部模型共识性的技术路线。

据内部信源，K3 限制向用户开放 100 万上下文的主要原因不是技术瓶颈，而是算力资源。

这句话信息量很大。它暗示了两个层面：

这也解释了为什么月之暗面在 Kimi K2.6 发布后，同步加大了在各大中转站的推广力度——刷 token 送京东卡，本质是在扩大使用场景和数据飞轮，同时为 K3 的算力需求积累运营经验。

Kimi K2.6 的定位很清晰：它不是终点，而是通往 K3 的桥梁。

K2.6 的关键词是”开源权重”和”面向 Agent”——1.1 万亿参数、完全开放权重、专为长时间自主执行设计。这些特性为 K3 铺好了生态基础：开发者社区可以先用 K2.6 熟悉 MoE 架构下的 Agent 工作流，等 K3 发布后平滑升级。

但也有用户反馈 K2.6 在某些基础任务上表现不稳定，有人直言”k3 不出来感觉是没法用了”。这种”过渡期阵痛”在快速迭代的模型发布节奏中并不罕见，但也说明月之暗面需要在 K3 的稳定性上给出更有说服力的答案。

Kimi K3 一旦发布，将直接改写国产大模型的竞争格局：