xAIがColossus 2で7つのGrokモデルを同時訓練、最大10Tパラメータ

核心的な結論

xAIはColossus 2クラスター上で7つの異なるGrokモデルを同時に訓練している—公開された中で最大規模の並列訓練計画。リリースされたばかりのGrok 4.3がagentic tool callingベンチマークで首位を獲得したことと合わせ、xAIは軽量から超大型まで完全なモデルマトリックスを構築している。

訓練規模の概要

Xプラットフォームの公開情報によると、Colossus 2上で訓練中のモデルマトリックス：

モデルコード名	パラメータ	ポジショニング	競合
現行Grok	0.5T (500B)	既存フラッグシップ	GPT-5.5, Claude Opus 4.7
Grok 5 Small	1T	効率的推論	Gemini 2.5 Pro
Grok 5 Mid	1.5T	バランス性能	Claude Sonnet 4.5
Grok 5 Large	6T	深い推論	GPT-6 (予想)
Grok 5 Max	10T	極致性能	直接競合なし

10TパラメータのGrok 5 Maxが訓練に成功すれば、世界最大の単一言語モデルとなる。

Colossus 2：訓練インフラ

Colossus 2はxAIがメンフィスに建設した超大型GPUクラスター：

GPU規模：20万基以上のNVIDIA H100/B200 GPU
ネットワーク：独自InfiniScaleアーキテクチャ
電力：専用変電所、ピーク消費電力500MW超
冷却：全面液冷、PUE 1.1未満

Grok 4.3：すでに提供されている能力

2026年5月初旬にリリースされたGrok 4.3の主要仕様：

Agentic Tool Calling 1位：agentツール呼び出し評価で首位
推論速度：100トークン/秒（サーバーサイド）
コンテキストウィンドウ：1Mトークン
価格：$1.25/MTok 入力

行動提案

役割	フォーカス
Agent開発者	Grok 4.3のtool calling機能を先に使用—低価格、リーディング性能
企業の技術選定	Grok 5 Small/Midに注目—コストと性能の最適バランス
研究者	Colossus 2の並列訓練アーキテクチャに注目
投資家	10Tモデルの商用化パス—推論コストとレイテンシのバランスが鍵

タイムライン：Grok 5 Small/Midは今後3-6ヶ月以内、Large/Maxは6-12ヶ月。

核心的な結論

訓練規模の概要

Colossus 2：訓練インフラ

Grok 4.3：すでに提供されている能力

行動提案

関連コンテンツ

MiniMax 3.0 直前：M2 の落后、株価圧力、中国AI第二梯队の生死戦

Qwen3.6-Plus：Opusの1/5の価格で日常Agentワークロードの80%を処理

OpenAI GPT-6 "Goblin" リーク：9 月 29 日 DevDay で発表、AGI タイムライン論争再燃