核心的な結論
AMDは2026年6月にHalo Boxを発売予定—Ryzen AI MAX+ 395プロセッサ、128GB統一共有メモリ、完全ROCmスタックサポート、価格**$2,000-3,000**のMini PC。コンシューマーグレードの価格で200Bパラメータモデルのローカル推論を提供する初の製品。
クラウドAPIのトークン課金に疲れた開発者、データプライバシーを重視する開発者にとって、真剣に受け止めるべきシグナルだ。
ハードウェア仕様
| コンポーネント | 仕様 | 意義 |
|---|---|---|
| CPU | Ryzen AI MAX+ 395 (16 Zen 5コア) | 強力な汎用計算 |
| GPU | 40 RDNA 3.5 CU | GPU推論コア |
| NPU | XDNA 2 (16 TOPS) | 低電力常駐AIタスク |
| メモリ | 128GB統一共有 | CPU/GPU/NPU共有、ゼロコピー |
| ROCm | 完全サポート | PyTorch、vLLMと互換 |
| 価格 | $2,000-3,000 | コンシューマーグレード |
主要なイノベーション:統一共有メモリ。従来のGPU推論はシステムメモリからGPU VRAMへのモデル読み込みが必要。Halo BoxのCPU、GPU、NPUは同じ128GBメモリプールを共有:
- ゼロデータ転送オーバーヘッド:モデルは一度読み込まれるだけ
- 128GB = 利用可能なモデルサイズ:24GB/48GBの独立VRAMとは異なり、70B-200Bパラメータモデルを保持可能
実行可能なモデル
INT4量子化の場合:
| モデル | 量子化後サイズ | Halo Box実行可否 |
|---|---|---|
| Llama 3.1 70B | ~35GB | ✅ 簡単に |
| Qwen3.6-35B | ~18GB | ✅ 余裕 |
| DeepSeek V4 MoE | ~70GB | ✅ 実行可能 |
| 200B 稠密モデル | ~100GB | ✅ 実行可能 |
行動提案
| シナリオ | 提案 |
|---|---|
| APIコストが高い | 月$500以上のAPI支出があるチームは検討価値あり |
| データプライバシー敏感 | 医療、金融、法律業界—ローカルデプロイはコンプライアンス必須 |
| モデル実験/ファインチューニング | 128GBメモリでLoRAファインチューニング可能 |
| 既存NVIDIAエコシステム | CUDA最適化ライブラリに深く依存する場合、ROCm成熟度を監視 |
発売時期:2026年6月。