C
ChaoBro

ИИ пересекает «эпоху контекста» и вступает в «эпоху Harness»

ИИ пересекает «эпоху контекста» и вступает в «эпоху Harness»

Ключевой вывод

В 2026 году фокус конкуренции в индустрии ИИ смещается с «чья модель сильнее» на «чей агент может стабильно работать».

Это не просто лозунг — это реальная архитектурная миграция. OpenAI прояснил этот тренд в блоге «Harness Engineering»: «Humans steer. Agents execute.» (Люди управляют. Агенты исполняют.) Когда сотни тысяч агентов одновременно выполняют сложные задачи, способность самой модели уже не является узким местом. Решающим фактором становится вся система исполнения, обёрнутая вокруг модели.

Что произошло

Jiqizhixin (机器之心) недавно опубликовал глубокую статью, используя MiniMax в качестве примера для разбора этой архитектурной эволюции, названной Harness Engineering (инженерия управления). Статья выделяет три этапа развития AI-агентов:

  • 2022-2024: Эпоха Prompt Engineering — изучение того, как общаться с ИИ
  • 2025: Эпоха Context Engineering — фокус на том, как предоставить моделям лучший контекст
  • 2026: Эпоха Harness Engineering — управление всем процессом исполнения, позволяющее агентам автономно выполнять задачи

MiniMax — один из самых проницательных игроков на внутреннем рынке в этом сдвиге. Они выпустили облачного AI-ассистента MaxClaw на базе архитектуры OpenClaw, а затем MaxHermes на базе Hermes Agent, полностью устранив инженерные барьеры локального развёртывания и настройки API-ключей. MaxClaw уже вошёл в первый эшелон同类 сервисов по масштабу пользовательской базы.

Технические детали: Четыре барьера для агентов корпоративного уровня

Основная ценность статьи заключается в систематическом разборе четырёх критических барьеров, которые однопользовательские фреймворки агентов (такие как локально запущенные OpenClaw и Hermes Agent) обнажают в корпоративных сценариях:

Барьер 1: Границы безопасности

Локальные фреймворки работают непосредственно на хост-ОС, обладая высокорисковыми правами, такими как выполнение shell-команд и чтение/запись файлов. При столкновении модели с prompt injection возможны несанкционированные операции. По состоянию на март 2026 года OpenClaw накопил 82 CVE-уязвимости.

Решение MiniMax: изоляция через MicroVM-песочницу — каждый экземпляр агента работает в независимой лёгкой виртуальной машине. Атакующему необходимо преодолеть уровень виртуализации для побега. В сочетании с политикой запрета по умолчанию и сквозным шифрованием формируется замкнутый цикл безопасности.

Барьер 2: Постоянство состояния

Агенты эволюционируют от кратковременных взаимодействий к многоэтапным, кросс-сессийным длительным задачам. Локальные фреймворки склонны терять контекст при перезапуске экземпляра или обрыве сети.

MiniMax построил многоуровневое постоянное хранилище: встроенные ESSD-диски песочницы для конфигурации и кратковременной памяти, общее пространство NAS для распространения ассетов Skills, и PolarDB + Tair для структурированных бизнес-данных и кэширования.

Барьер 3: Управление крупномасштабным кластером

Однопользовательское автономное развёртывание совершенно недостаточно при столкновении с сотнями тысяч параллельных агентов. MiniMax построил архитектуру разделения плоскости управления и плоскости исполнения на базе Alibaba Cloud ACK (Kubernetes) + ACS (Agent Sandbox) — ACK отвечает за распределение сообщений, оркестрацию задач и наблюдаемость, а ACS — за динамическое планирование и размещение экземпляров песочницы.

Барьер 4: Контроль затрат

Автономным агентам необходимо работать постоянно для поддержания heartbeat и отклика, потребляя ресурсы даже в периоды простоя. ACS Agent Sandbox поддерживает эластичное provisioning до 15 000 песочниц в минуту с автоматическим освобождением после завершения задачи и временем холодного старта, сжатым до 20-40 миллисекунд.

Отраслевой ландшафт

Этот тренд касается не только MiniMax:

  • OpenAI опубликовала блог «Harness Engineering», явно заявив, что модели и harness стали неразделимы
  • Manus только что выпустила Cloud Computer, объединив AI-агентов с облачными серверами в единый сервис
  • Alibaba, ByteDance и Tencent строят свою AI-инфраструктуру вокруг Harness Engineering
  • Прогноз Gartner: К 2028 году примерно 95% новых развёртываний ИИ будут работать на Kubernetes
  • Прогноз IDC: К 2027 году использование агентов предприятиями Global 2000 вырастет в 10 раз, а нагрузка от токенов и API-вызовов увеличится в 1000 раз

Мартин Фаулер в статье от апреля 2026 года определил Harness Engineering как «модель построения доверия вокруг кодирующих агентов». Реальность 2026 года: эпоха конкуренции по моделям закончилась, началась эпоха конкуренции по Harness.

Рекомендации к действию

Для разработчиков и предприятий этот сдвиг означает несколько вещей:

  1. Не смотрите только на бенчмарки моделей — одна и та же модель, обёрнутая в разные Harness, может отличаться по способности на порядок
  2. Обратите внимание на cloud-native инфраструктуру агентов — контейнерные сервисы типа ACK/ACS становятся «операционной системой» эпохи ИИ
  3. Изоляция безопасности — приоритет номер один — песочницы, MicroVM и ограничение прав являются обязательными условиями корпоративного развёртывания
  4. Управление состоянием определяет, как далеко смогут зайти агенты — переход от кратких диалогов к длительным задачам требует поддержки архитектуры постоянства