Основной релиз
Google официально выпустила Gemini 3.1 Ultra, доведя контекстное окно до уровня 2 миллионов токенов с нативной мультимодальной поддержкой — текст, изображения, аудио и видео обрабатываются единообразно в одной модели, без необходимости комбинировать несколько моделей.
Сравнение ключевых показателей
| Параметр | Gemini 3.1 Ultra | Gemini 3.0 Ultra | Claude Opus 4.6 |
|---|---|---|---|
| Контекстное окно | 2M токенов | 1M токенов | 1M токенов |
| Поддержка модальностей | Текст+Изображение+Аудио+Видео | Текст+Изображение+Аудио | Текст+Изображение |
| Мультимодальный метод | Нативная единая | Нативная единая | Комбинирование моделей |
| Дата выпуска | Май 2026 | Февраль 2026 | Апрель 2026 |
Что означает 2M контекста
2 миллиона токенов примерно равны:
- 1,5 миллиона английских слов или 1 миллиону китайских иероглифов
- Техническая книга на 1500 страниц
- Полный транскрипт фильма с описанием сцен
- Всё содержимое кодовой базы на 1000 страниц
Обработка такого объёма данных в одном запросе вывода означает, что потребности в RAG (Retrieval-Augmented Generation) могут быть переопределены — когда контекстное окно достаточно велико, шаг «поиска» может стать ненужным.
Четырёхуровневая экосистема Gemini
Google выстраивает многоуровневую продуктовую стратегию:
- Gemini Chat (бесплатный уровень): Повседневные вопросы и ответы, 3.1 Pro для сложных задач
- Gemini Advanced (подписка): Разблокировка модели Ultra, 2M контекст
- Gemini API (уровень разработчика): Оплата за использование, поддержка fine-tuning
- Gemini Enterprise (корпоративный уровень): Варианты приватного развёртывания
Тем временем на LMSys Arena появились записи оценки новой модели Gemini Flash (возможно, версия 3.5). В сочетании с предстоящей конференцией Google I/O ожидаются значительные обновления продуктов.
Оценка конкурентного ландшафта
Гонка контекстных окон вступила в новую фазу:
- Gemini 3.1 Ultra: 2M, лидер
- Claude Opus 4.6: 1M, следует вплотную
- GPT-5.5: 200K, значительный разрыв, но лидерство в агентных способностях
- Qwen 3.6 Max: 262K, преимущество в соотношении цена/качество
Для большинства прикладных сценариев 262K-1M уже более чем достаточно. Ценность 2M проявляется преимущественно в сценариях однократной обработки сверхкрупных документов (юридические дела, медицинская литература, полные репозитории кода).
Рекомендации к действию
- Анализ длинных документов: Приоритетно тестируйте Gemini 3.1 Ultra — 2M контекст обрабатывает целые книги и кодовые базы без разбивки на фрагменты
- Пользователи мультимодальных рабочих процессов: Нативная единая обработка исключает потерю информации при цепочке из нескольких моделей
- Чувствительные к стоимости пользователи: Следите за обновлениями Gemini Flash; новые ценовые стратегии ожидаются после Google I/O
- Разработчики: API доступен — протестируйте фактическое потребление токенов и производительность при 2M контексте