DeepSeek V4 Pro оценка CAISI: на 8 месяцев позади передовой, но open-source локальное развертывание незаменимо
by ChaoBro
#DeepSeek
#CAISI
#Оценка моделей
#Open Source
#Стандарты AI
Основной вывод
Оценка Центра стандартов и инноваций AI (CAISI) за апрель 2026 года показывает, что способности DeepSeek V4 Pro отстают от передовых на ~8 месяцев. Но комбинация open-source весов + миллионный контекст + локальное развертывание остаётся незаменимой.
Результаты оценки
Измерение
DeepSeek V4 Pro
Передовые (GPT-5.5/Claude Opus 4.7)
Разница
Понимание языка
Близко к передовым
Базовый уровень
~-5%
Кодирование
Значительный разрыв
SWE-bench 78%+
~12-15pp отставание
Математика
Умеренный разрыв
95%+ точность
~5-8pp отставание
Мультимодальность
Большой разрыв
Нативная мультимодальность
Значительный разрыв
Использование инструментов
Близко к передовым
Базовый уровень
~-3%
«8 месяцев позади» означает, что способности V4 Pro примерно соответствуют уровню августа-сентября 2025 года.