xAIがColossus 2で7つのGrokモデルを同時訓練、最大10Tパラメータ

xAIがColossus 2で7つのGrokモデルを同時訓練、最大10Tパラメータ

核心的な結論

xAIはColossus 2クラスター上で7つの異なるGrokモデルを同時に訓練している—公開された中で最大規模の並列訓練計画。リリースされたばかりのGrok 4.3がagentic tool callingベンチマークで首位を獲得したことと合わせ、xAIは軽量から超大型まで完全なモデルマトリックスを構築している。

訓練規模の概要

Xプラットフォームの公開情報によると、Colossus 2上で訓練中のモデルマトリックス:

モデルコード名パラメータポジショニング競合
現行Grok0.5T (500B)既存フラッグシップGPT-5.5, Claude Opus 4.7
Grok 5 Small1T効率的推論Gemini 2.5 Pro
Grok 5 Mid1.5Tバランス性能Claude Sonnet 4.5
Grok 5 Large6T深い推論GPT-6 (予想)
Grok 5 Max10T極致性能直接競合なし

10TパラメータのGrok 5 Maxが訓練に成功すれば、世界最大の単一言語モデルとなる。

Colossus 2:訓練インフラ

Colossus 2はxAIがメンフィスに建設した超大型GPUクラスター:

  • GPU規模:20万基以上のNVIDIA H100/B200 GPU
  • ネットワーク:独自InfiniScaleアーキテクチャ
  • 電力:専用変電所、ピーク消費電力500MW超
  • 冷却:全面液冷、PUE 1.1未満

Grok 4.3:すでに提供されている能力

2026年5月初旬にリリースされたGrok 4.3の主要仕様:

  • Agentic Tool Calling 1位:agentツール呼び出し評価で首位
  • 推論速度:100トークン/秒(サーバーサイド)
  • コンテキストウィンドウ:1Mトークン
  • 価格:$1.25/MTok 入力

行動提案

役割フォーカス
Agent開発者Grok 4.3のtool calling機能を先に使用—低価格、リーディング性能
企業の技術選定Grok 5 Small/Midに注目—コストと性能の最適バランス
研究者Colossus 2の並列訓練アーキテクチャに注目
投資家10Tモデルの商用化パス—推論コストとレイテンシのバランスが鍵

タイムライン:Grok 5 Small/Midは今後3-6ヶ月以内、Large/Maxは6-12ヶ月。