24 апреля DeepSeek представила серию моделей V4 — флагманскую V4-Pro с 1,6 триллиона параметров и эффективную V4-Flash с 284 миллиардами параметров. Но важнее самих моделей то, что это первая отечественная большая модель, основанная на чипах Huawei Ascend уже на этапе обучения.
Ключевые показатели
| Показатель | Значение |
|---|---|
| Общее количество параметров V4-Pro | 1,6 трлн, активировано 49 млрд |
| Задержка первого токена | 20 мс |
| Потребление вычислительных ресурсов при инференсе | Всего 27% от предыдущего поколения V3.2 |
| Пропускная способность одной карты Ascend 950 | 4700 TPS (вход 8k) |
| Вычислительная мощность FP4 | Ascend 950PR достигает 1,56P, в 2,87 раза выше H20 |
| Стоимость закупки | Всего от 1/3 до 1/4 стоимости H200 |
От «адаптации постфактум» к «нативному первому выпуску»
Предыдущие отечественные модели сначала обучались в экосистеме NVIDIA CUDA, а затем месяцами мигрировали на фреймворк Ascend CANN. На этот раз DeepSeek V4 обучалась непосредственно на Ascend 950, и Huawei в течение нескольких часов объявила о полной совместимости всей линейки супернод Ascend.
Это означает, что отечественные вычислительные мощности превратились из «запасного варианта» в «основную опцию».
Скачкообразный прорыв в возможностях агентов
V4-Pro демонстрирует скачкообразное улучшение возможностей агентов: опыт программирования превосходит Sonnet 4.5, а качество вывода приближается к Opus 4.6. Одновременно запущены «быстрый режим» и «экспертный режим», а также начато поэтапное тестирование режима распознавания изображений.
Сигнал для индустрии
Когда крупнейший производитель открытых моделей и крупнейший производитель отечественных чипов глубоко интегрированы, маховик всей экосистемы начинает вращаться. После объявления акции компаний, связанных с отечественными чипами для ИИ, в тот же день выросли более чем на 10%.
Основные источники: Toutiao, chinaz, прямая трансляция Ascend на Bilibili