Основной вывод
xAI выпустила модель тяжёлого класса самым xAI-образным способом: без пресс-конференции, без блога — просто выложили прямо в API.
Grok 4.3 тихо заработал на платформах вроде Venice, поддерживая контекст в 1 миллион токенов, вызов функций, мультимодальный ввод и нативный поиск X. Модель набрала 53 балла на Intelligence Index от Artificial Analysis, опередив Muse Spark, Claude Sonnet 4.6 и предыдущие версии Grok. Цены API были одновременно скорректированы: входные данные снизились с $2,10 до $1,25 за миллион токенов (снижение на 40%), выходные — на 60%.
Результаты бенчмарков
Intelligence Index от Artificial Analysis
| Модель | AA Index | Примечания |
|---|---|---|
| GPT-5.5 Pro | ~60+ | Текущий лидер |
| Grok 4.3 | 53 | Обогнал Muse Spark, Sonnet 4.6 |
| Muse Spark | <53 | Обогнан Grok 4.3 |
| Claude Sonnet 4.6 | <53 | Обогнан Grok 4.3 |
| Gemini 3.1 Pro | ~50 | Близок к Grok 4.3 |
Рейтинги Vals Index
| Бенчмарк | Позиция Grok 4.3 | Примечания |
|---|---|---|
| Общий | #13 | Выше среднего |
| CaseLaw | #1 | Ведущее юридическое обоснование |
| CorpFin | #1 | Ведущий анализ корпоративных финансов |
| Общее программирование | Слабое | Не сильная сторона |
Бенчмарк GDPval-AA
Наиболее значительное улучшение Grok 4.3 — в реальных агентских задачах. На бенчмарке GDPval-AA показатель агентских способностей Grok 4.3 существенно вырос. Это ключевой метрикой для оценки «может ли ИИ самостоятельно выполнять задачи».
Анализ ценовой стратегии
| Параметр | Grok 4.3 | Изменение |
|---|---|---|
| Цена входных данных | $1,25/млн токенов | ↓ 40% |
| Цена выходных данных | Значительно снижена | ↓ 60% |
| Контекстное окно | 1 млн токенов | Как у предыдущей |
Эта ценовая стратегия чрезвычайно агрессивна. Цена в $1,25 за миллион входных токенов уже ниже, чем у большинства моделей среднего уровня, при этом производительность Grok 4.3 находится в первом эшелоне. xAI явно идёт по «маршруту цена-качество» — предоставляя производительность, близкую к Claude Opus 4.7, по ценам, приближающимся к DeepSeek V4.
Горизонтальное сравнение с конкурентами
| Параметр | Grok 4.3 | Claude Sonnet 4.6 | GPT-5.5 | DeepSeek V4 |
|---|---|---|---|---|
| AA Index | 53 | <53 | ~60+ | Н/Д |
| Цена входных | $1,25/млн | ~$3/млн | ~$5/млн | ~$0,15/млн |
| Юридическое обоснование | #1 | Сильное | Сильное | Среднее |
| Финансовый анализ | #1 | Сильное | Сильное | Среднее |
| Общее программирование | Слабое | Сильное | Сильное | Сильное |
| Агентские способности | Значительно улучшены | Сильные | Сильные | Сильные |
Оценка ситуации
Релиз Grok 4.3 передаёт несколько сигналов:
- xAI переходит из «догоняющих» в «лидеров по соотношению цена-качество»: AA-индекс 53 при цене $1,25 обеспечивает гораздо лучшую ценность, чем Claude и GPT
- Явное преимущество в специализированных областях: Первые места в CaseLaw и CorpFin показывают, что у Grok 4.3 есть уникальные преимущества в юридических и финансовых вертикалях
- Тихий запуск показывает, что xAI ставит продукт выше маркетинга: Это одновременно и сила (прагматичность), и слабость (низкая видимость)
Как использовать
- Юристы и финансовые специалисты: Первые места Grok 4.3 в CaseLaw и CorpFin заслуживают внимания — возможно, самый экономичный выбор специализированной модели
- Пользователи API: Входная цена $1,25/млн + 53 балла производительности делают это самым дешёвым вариантом среди моделей первого эшелона
- Разработчики агентов: Значительное улучшение на GDPval-AA означает, что надёжность Grok 4.3 в агентских сценариях существенно выросла — стоит протестировать