C
ChaoBro

Qwen 3.6 Max Preview: архитектура MoE с триллионом параметров всего за $1.30 за миллион токенов

Qwen 3.6 Max Preview: архитектура MoE с триллионом параметров всего за $1.30 за миллион токенов

Ключевой сигнал

Qwen 3.6 Max Preview от Alibaba Tongyi Qianwen悄然 появился на OpenRouter. Это крупнейшая модель Alibaba на сегодняшний день — один триллион параметров на базе разреженной архитектуры Mixture-of-Experts (MoE), при этом цена значительно ниже конкурирующих моделей того же уровня.

ПараметрQwen 3.6 Max PreviewClaude Opus 4.6GPT-5.5
Масштаб параметров1 трлн (разреженная активация)Не раскрытоНе раскрыто
Контекстное окно262K1M200K
Цена ввода$1.30/млн токенов$15.00/млн токенов$10.00/млн токенов
Цена вывода$7.80/млн токенов$75.00/млн токенов$50.00/млн токенов
Направление оптимизацииАгентное программирование, инструментыОбщие рассужденияАгентные способности
Открытые весаНетНетНет

Разница в цене говорит сама за себя: стоимость ввода Qwen 3.6 Max Preview составляет всего 1/11 от Claude Opus 4.6, а стоимость вывода — 1/10.

Разбор архитектуры

Ключевые технические характеристики Qwen 3.6 Max Preview:

  • Разреженная MoE с 1 трлн параметров: Общее количество параметров достигает 1 трлн, но при каждом выводе активируется лишь подмножество экспертов. Это означает значительно более высокую пропускную способность по сравнению с плотными моделями на триллион параметров при равном оборудовании.
  • Контекстное окно 262K: Хотя оно уступает 1M у Claude и 2M у Gemini, его достаточно для большинства задач на уровне кодовых баз.
  • Специализация на агентном программировании: Специально дообучена для генерации кода, многошагового вызова инструментов и автономной отладки. Стоит следить за результатами на бенчмарках Terminal-Bench и SWE-bench.

Почему это важно

  1. Ценовое преимущество раздаёт конкурентов: Для агентных сценариев с высоким потреблением токенов (анализ кода с длинным контекстом, многократные вызовы инструментов) ценовое преимущество Qwen 3.6 Max Preview значительно.
  2. Интеграция в экосистему Alibaba: Ожидается приоритетное развёртывание на платформе Alibaba Cloud Bailian и Tongyi Lingma, что обеспечит быстрый доступ для китайских разработчиков.
  3. След в open source: Qwen3.6-27B уже была опубликована с положительными отзывами сообщества. Версия Max, хотя и не открыта, подтверждает продолжающиеся инвестиции Alibaba в модели передового уровня.

Рекомендации к действию

  • Существующие подписчики Claude/GPT: Попробуйте Qwen 3.6 Max Preview на OpenRouter как основную модель для задач, чувствительных к стоимости, оставив Opus/GPT-5.5 для сложных рассуждений.
  • Китайские разработчики: Следите за интеграцией с платформой Bailian — ожидаются более выгодные корпоративные тарифы.
  • Разработчики агентов: Комбинация 262K контекста и низкой цены идеально подходит для автономных кодирующих агентов, которым нужен анализ кодовых баз с длинным контекстом.

Примечания о рисках

  • На данный момент это версия Preview; стабильность ещё предстоит проверить
  • Веса не открыты — локальное развёртывание невозможно
  • Фактическая производительность в китайскоязычном контексте ещё требует отзывов сообщества