C
ChaoBro

Аренда H100 Растёт: Дефицит Поставок GPU у Neocloud и Экономика Вычислений 2026

Аренда H100 Растёт: Дефицит Поставок GPU у Neocloud и Экономика Вычислений 2026

Что Произошло

В начале мая 2026 года твит о рынке аренды GPU Neocloud вызвал обсуждение в сообществе AI-инфраструктуры:

«Ни одна Neocloud не могла представить, что сегодня они будут сдавать в аренду H100 по ценам выше, чем 3 года назад.»

Этот твит, получивший 432 лайка и более 50 тысяч просмотров, выявил контринтуитивный рыночный феномен: на фоне продолжающегося расширения мощностей GPU и усиления конкуренции чипов AI, цены на аренду H100 растут, а не падают.

Почему Аренда GPU Становится Дороже

Логику этого можно разбить на три уровня:

1. Сторона Спроса: Передовые Фирмы Раньше Блокируют Заказы

Даже если у вас есть финансирование, передовые лаборатории и Neolabs уже заблокировали большую часть поставок GPU на 2026 год. Гиперскейлеры (Microsoft, Google, Meta, Amazon), как ожидается, потратят $725 млрд на капитальные расходы AI в 2026 году, что на 77% больше в годовом исчислении. Эти массивные заказы получают приоритет в распределении мощностей NVIDIA.

2. Сторона Предложения: Бутылочное Горлышко Мощностей HBM

GPU — это не автономные чипы — им требуется HBM (Память с Высокой Пропускной Способностью). Генеральный директор Micron ранее подтвердил, что поставки HBM на 2026 год полностью распроданы, удовлетворяя лишь 50-65% спроса клиентов. Бутылочное горлышко мощностей HBM напрямую ограничивает общий объём выпуска GPU.

Бутылочное ГорлышкоТекущий СтатусВлияние
Кремниевые пластины GPUМощности NVIDIA постоянно расширяютсяНе основное бутылочное горлышко
Память HBMМощности трёх производителей заблокированыОсновное бутылочное горлышко
Упаковка CoWoSМощности TSMC напряженыВторичное бутылочное горлышко
Электропитание и охлаждениеОграничения на размещение дата-центровДолгосрочное ограничение

3. Структура Рынка: Потеря Ценовой Силы Neocloud

Бизнес-модель Neocloud (новых провайдеров облачных вычислений) изначально была «оптовая закупка GPU, розничная продажа по ценам ниже AWS/Azure». Но на рынке с напряжённым предложением:

  • Neocloud не могут получить достаточно GPU для создания эффекта масштаба
  • Даже когда они получают GPU, растущие затраты на HBM повышают общую стоимость владения
  • Спрос значительно превышает предложение, у Neocloud нет мотивации снижать цены

Куда Направляется Каждый $1M Расходов на AI

Понимание того, почему аренда GPU растёт, требует рассмотрения общей структуры расходов на AI-инфраструктуру:

Категория РасходовСумма (на $1M)ДоляКлючевые Поставщики
GPU и акселераторы$520K52%NVIDIA, AMD, Broadcom
Сети и оптика$150K15%Arista, Coherent
Инфраструктура дата-центров$200K20%Электропитание, охлаждение, стойки
Память и прочее$130K13%Micron, SK Hynix, Samsung

Более половины инвестиций в AI направляются на GPU и акселераторы — кто контролирует цепочку поставок GPU, тот контролирует ценовую власть AI-инфраструктуры.

Оценка Ландшафта

Рост аренды GPU выявляет более глубокую тенденцию: AI-вычисления возвращаются от «товарности» к «редкости».

В 2023-2024 годах рынок в целом ожидал, что с расширением мощностей GPU и усилением конкуренции стоимость вычислений быстро снизится. Но реальность такова:

  • Рост спроса значительно опережает рост мощностей
  • Бутылочное горлышко цепочки поставок сместилось с GPU на HBM
  • Раннее блокирование заказов игроками передового фронта сжимает доступ средних и мелких игроков

Это означает, что нарратив «демократизации вычислений» сталкивается с вызовами в 2026 году — наличие доступа к GPU становится конкурентным преимуществом, а не инфраструктурой.

Рекомендации к Действию

  • AI-предприниматели: Не предполагайте, что аренда GPU будет естественно снижаться. Рассчитывайте затраты на вывод в вашей бизнес-модели по текущим или более высоким ценам, резервируя буфер риска поставок.
  • Стратегия выбора модели: Когда затраты на GPU высоки, выбор моделей с более высокой эффективностью вывода (таких как архитектура MoE, квантованные версии) имеет больший экономический смысл, чем погоня за наибольшим масштабом параметров.
  • Следите за альтернативами: Доступность и рентабельность альтернативных чипов AMD MI300, Google TPU, AWS Trainium улучшается. Стратегия с несколькими чипами может снизить зависимость от одного поставщика.
  • Долгосрочная перспектива: Цикл расширения мощностей HBM составляет 18-24 месяца. Напряжённость поставок 2026 года может начать смягчаться во второй половине 2027 года, но только если все планы расширения основных производителей будут реализованы по графику.