GPT-5.5 догоняет Mythos Preview: Противостояние моделей в тестах кибербезопасности

Главное

Mythos Preview, ранее преподносившийся как “веха в кибербезопасности”, догнан GPT-5.5 от OpenAI в последней независимой оценке. Это не comeback GPT-5.5 — это сигнал для всей индустрии: разрыв в способностях между большими моделями в сценариях кибербезопасности быстро сокращается.

Фон тестирования

Измерение	Содержание теста	Важность
Обнаружение уязвимостей	Выявление уязвимостей в заданном коде	⭐⭐⭐
Построение цепочек атак	Генерация многошаговых планов проникновения	⭐⭐⭐
Рекомендации по защите	Предложения по устранению уязвимостей	⭐⭐

Ключевые выводы

1. Разрыв устранён

Mythos Preview заявлял, что его способности “превосходят все известные модели”. Но тест показывает:

GPT-5.5 достиг того же уровня, что и Mythos, в обнаружении уязвимостей
В построении цепочек атак — статистически значимой разницы нет
В рекомендациях по защите GPT-5.5 немного лидирует

Главное

Фон тестирования

Ключевые выводы

1. Разрыв устранён

Рекомендации по выбору

Похожие материалы

17 дней, 4 модели: гонка вооружений китайского ИИ с открытым кодом и перекройка ландшафта производительности

Hermes Agent vs OpenClaw: Как выбрать правильный фреймворк AI-агентов в 2026 году?

Загрузки Codex碾压 Claude Code: экосистемическая битва OpenAI с функцией «Migrate to Codex»