Исследование Cast AI 23 000 кластеров: средняя загрузка GPU на предприятиях всего 5%, 95% вычислений простаивает

Основной вывод

Анализ Cast AI примерно 23 000 кластеров Kubernetes раскрывает шокирующий факт: средняя загрузка GPU на предприятиях составляет всего 5%. Другими словами, 95% вычислительных мощностей GPU простаивают. При этом загрузка CPU составляет 8%, а памяти — 20%.

Это не аномалия маленькой выборки — это систематические потери по всей индустрии.

Обзор данных

Сравнение использования ресурсов

Тип ресурса	Средняя загрузка	Простаивает	Уровень потерь
GPU	5%	95%	Крайний
CPU	8%	92%	Крайний
Память	20%	80%	Значительный

Почему это происходит?

Выделение ресурсов из страха: Предприятия боятся нехватки GPU, боятся проблем с производительностью и боятся жалоб от бизнес-команд, поэтому massively избыточно выделяют ресурсы. Этот подход похож на паническую скупку туалетной бумаги во время пандемии — не из-за потребности, а из-за «страха остаться без ресурсов».

Разбор ключевых находок

1. Что означает загрузка GPU 5%?

Предположим, предприятие покупает 100 GPU H100 по цене примерно $30-40/час. При загрузке 5%:

Эффективные вычисления: эквивалентно 5 GPU H100, работающим на полную мощность
Потерянные вычисления: эквивалентно 95 GPU H100 в режиме простоя
Годовые потери: примерно $2,5-3,2 млн

Это не включает сопутствующие расходы на CPU, память, сеть, охлаждение и другую инфраструктуру.

2. Новый дисбаланс CPU-GPU

Ещё одна упускаемая из виду тенденция: производительность GPU растёт значительно быстрее, чем CPU. Это означает, что вспомогательные ресурсы CPU на единицу вычислений ИИ отстают. Лаборатории напрямую конкурируют с гиперскейлерами за мощности x86 CPU, что ещё больше повышает общие затраты.

3. Одновременный простой нескольких ресурсов

GPU, CPU и память одновременно имеют низкую загрузку, что указывает на то, что проблема заключается не в ошибке конфигурации одного ресурса, а в систематической неудаче общей методологии планирования ресурсов.

Почему это важно

Прямое влияние на предприятия

Чёрная дыра расходов: 95% многомиллионных бюджетов на GPU — чистые потери
Снижение конкурентоспособности: При одинаковом бюджете эффективные предприятия могут получить в 20 раз больше фактических вычислений, чем неэффективные
Экологическое воздействие: Простаивающие GPU всё ещё потребляют электричество и создают углеродный след

Сигналы на уровне индустрии

Сигнал	Значение
Дефицит GPU — иллюзия	Реальный спрос значительно ниже поверхностного
Ценовая власть облачных провайдеров на GPU может ослабнуть	Когда предприятия осознают потери, стратегии закупок изменятся
Взрывной рост рынка инструментов оптимизации ресурсов	Автомасштабирование, планирование смешанных рабочих нагрузок, разделение GPU во времени станут необходимыми

Оценка ландшафта

Поворотный момент в расточительстве вычислений, возможно, приближается.

Когда первые предприятия достигнут «выполнения тех же задач ИИ в 20 раз дешевле» за счёт оптимизации, индустрии придётся столкнуться с этой проблемой. Это не вопрос технологического обновления — это фундаментальный сдвиг в методологии управления.

В то же время это открывает огромную возможность для стартапов ИИ: тот, кто сможет повысить загрузку GPU у клиентов с 5% до 50%, получит вход на триллионный рынок вычислений.

Исследование Cast AI 23 000 кластеров: средняя загрузка GPU на предприятиях всего 5%, 95% вычислений простаивает

Основной вывод

Обзор данных

Сравнение использования ресурсов

Почему это происходит?

Разбор ключевых находок

1. Что означает загрузка GPU 5%?

2. Новый дисбаланс CPU-GPU

3. Одновременный простой нескольких ресурсов

Почему это важно

Прямое влияние на предприятия

Сигналы на уровне индустрии

Рекомендации к действию

Для CTO и технических руководителей предприятий

Для инженеров ИИ

Для инвесторов и аналитиков

Оценка ландшафта

Основной вывод

Обзор данных

Сравнение использования ресурсов

Почему это происходит?

Разбор ключевых находок

1. Что означает загрузка GPU 5%?

2. Новый дисбаланс CPU-GPU

3. Одновременный простой нескольких ресурсов

Почему это важно

Прямое влияние на предприятия

Сигналы на уровне индустрии

Рекомендации к действию

Для CTO и технических руководителей предприятий

Для инженеров ИИ

Для инвесторов и аналитиков

Оценка ландшафта

Похожие материалы

Четыре главных технологических прорыва ИИ-агентов в 2026 году: базовая логика изменилась от Copilot к Autopilot

ByteDance запускает Coze 2.5 с Agent World: платформа мультиагентного взаимодействия позволяет каждому «нанимать» ИИ-сотрудников

JetBrains Air выпущен: мультиагентная параллельная среда разработки, объединяющая Codex, Claude и Gemini