核心判断
2026 年 AI 行业的竞争焦点,正在从「谁的模型更强」转向「谁的 Agent 能稳定干活」。
这不是一句口号,而是架构层面的真实迁移。OpenAI 用一篇《Harness Engineering》博客点破了这个趋势:「Humans steer. Agents execute.」(人类掌舵,智能体执行)。当数以十万计的 Agent 并发执行复杂任务时,模型能力本身已经不是瓶颈——真正决定成败的,是包裹在模型外面的那整套执行系统。
发生了什么
机器之心近日发布了一篇深度长文,以 MiniMax 为样本,拆解了这场被称为 Harness Engineering(驾驭工程) 的架构演进。文章指出,AI Agent 的发展经历了三个阶段:
- 2022-2024:Prompt Engineering 时代——研究怎么跟 AI 说话
- 2025:Context Engineering 时代——关注如何给模型更好的上下文输入
- 2026:Harness Engineering 时代——管住整个执行流程,让 Agent 自主完成任务
MiniMax 是这场转变中最敏锐的国内玩家之一。他们基于 OpenClaw 架构推出了云端 AI 助手 MaxClaw,又基于 Hermes Agent 发布了 MaxHermes,彻底扫清了本地部署和配置 API 的工程门槛。MaxClaw 已经在用户规模上跻身同类服务第一梯队。
技术细节:企业级 Agent 要跨过四道鸿沟
文章的核心价值在于,它系统性地拆解了单机 Agent 框架(如本地运行的 OpenClaw 和 Hermes Agent)在企业级场景下暴露出的四道鸿沟:
第一道:安全边界
本地框架直接运行在宿主 OS 上,天然拥有 Shell 执行和文件读写等高危权限。一旦模型遭遇提示词注入,就可能引发越权操作。截至 2026 年 3 月,OpenClaw 已累计披露 82 个 CVE 漏洞。
MiniMax 的解法是 MicroVM 沙箱隔离——每个 Agent 实例运行在独立的轻量级虚拟机中,攻击者必须突破虚拟化层才能逃逸。配合默认拒绝的流量策略和端到端加密,形成安全闭环。
第二道:状态持久化
Agent 正从短时交互演变为多阶段、跨会话的长流程任务。本地框架在实例重启或网络中断时容易丢失上下文。
MiniMax 构建了分层持久化存储:沙箱内置 ESSD 云盘承载配置和短期记忆,NAS 共享空间分发 Skills 资产,PolarDB + Tair 处理结构化业务数据和缓存。
第三道:大规模集群运维
单机自治部署在面对数十万级并发 Agent 时完全不够用。MiniMax 基于阿里云 ACK(Kubernetes) + ACS(Agent Sandbox) 实现了控制面与执行面分离的架构——ACK 负责消息分发、任务编排和运行观测,ACS 负责动态调度和承载沙箱实例。
第四道:成本控制
自治型 Agent 需要常驻运行以维持心跳和响应,空闲期持续消耗资源。ACS Agent Sandbox 支持最高每分钟 15,000 个沙箱 的弹性供给,任务结束自动释放,冷启动时间压缩到 20-40 毫秒。
行业格局
这个趋势不只是 MiniMax 在走:
- OpenAI 发布《Harness Engineering》工程博客,明确提出模型与 harness 已不可分割
- Manus 刚推出 Cloud Computer,将 AI Agent 与云服务器打包为一站式服务
- 阿里、字节、腾讯 都在围绕 Harness Engineering 构建自己的 AI 基础设施
- Gartner 预测:到 2028 年,约 95% 的新 AI 部署将基于 Kubernetes 环境运行
- IDC 预测:到 2027 年,全球 2000 强企业的 Agent 使用量将增加 10 倍,Token 和 API 调用负载将激增 1000 倍
Martin Fowler 在 2026 年 4 月的一篇文章中直接把 Harness Engineering 定义为「一套围绕 coding agent 的信任建设模型」。2026 年的真相是:比拼模型的时代过去了,比拼 Harness 的时代开始了。
行动建议
对于开发者和企业来说,这个转向意味着几件事:
- 别只盯着模型 benchmark——同样的模型套在不同的 Harness 上,能力可以差出一个数量级
- 关注云原生 Agent 基础设施——ACK/ACS 这类容器服务正在成为 AI 时代的「操作系统」
- 安全隔离是第一优先级——沙箱、MicroVM、权限收敛是企业级部署的前提条件
- 状态管理决定 Agent 能走多远——短时对话到长流程任务的跨越,需要持久化架构支撑