Основной вывод
AMD планирует выпустить Halo Box в июне 2026 — Mini PC с процессором Ryzen AI MAX+ 395, 128GB унифицированной общей памяти, полной поддержкой ROCm, по цене $2,000-3,000. Первый продукт, предлагающий локальный инференс 200B параметрических моделей по потребительской цене.
Характеристики оборудования
| Компонент | Спецификация | Значение |
|---|---|---|
| CPU | Ryzen AI MAX+ 395 (16 ядер Zen 5) | Мощные универсальные вычисления |
| GPU | 40 вычислительных блоков RDNA 3.5 | Ядро GPU-инференса |
| NPU | XDNA 2 (16 TOPS) | Низкоэнергетические резидентные AI-задачи |
| Память | 128GB унифицированная общая | CPU/GPU/NPU совместно, нулевое копирование |
| ROCm | Полная поддержка | Совместимость с PyTorch, vLLM |
| Цена | $2,000-3,000 | Потребительское ценообразование |
Ключевая инновация: унифицированная общая память. CPU, GPU и NPU разделяют один пул памяти 128GB — нулевые накладные расходы на передачу данных.
Какие модели можно запустить?
С INT4 квантованием:
| Модель | Размер после квантования | Halo Box запустит? |
|---|---|---|
| Llama 3.1 70B | ~35GB | ✅ Легко |
| Qwen3.6-35B | ~18GB | ✅ С запасом |
| DeepSeek V4 MoE | ~70GB | ✅ Да |
| 200B плотная модель | ~100GB | ✅ Да |
Рекомендации
| Ваш сценарий | Рекомендация |
|---|---|
| Высокие затраты на API | Команды, тратящие $500+/месяц на API, должны рассмотреть |
| Конфиденциальность данных | Здравоохранение, финансы, юриспруденция — локальное развертывание обязательно |
| Эксперименты с моделями | 128GB памяти позволяет LoRA fine-tuning без облачного GPU |
| Существующая экосистема NVIDIA | При глубокой зависимости от CUDA-библиотек следите за зрелостью ROCm |
Запуск: Июнь 2026.