何があったのか
2026年5月5日、NVIDIA CEOの黄仁勲氏はCNBCインタビューで重要な判断を下した:「生成AIからAgentic AIへ、必要な計算量が1000%増加した。」
この発言はNVIDIAの2026年第1四半期決算発表の直後に行われた。決算报告显示、NVIDIAの四半期純利益は423億ドルに達し、通年予想は2000億ドルに近づいている——2021年からの成長曲線は半導体業界史上最も急峻と言える。
同時に、NVIDIA技術チームはXプラットフォームでVera RubinプラットフォームのAgentワークロード向け具体的なパフォーマンスデータを公開した:ユーザーあたり400+ tokens/sec。極端な共同設計により、Agentシナリオにおけるトークン消費、コンテキスト長、レイテンシの極端な需要に対応している。
1000%の増加はどこから来るのか
黄氏の1000%という判断は根拠のないものではない。生成AIからAgentic AIへのパラダイム転換により、計算需要の構造的変化がもたらされている:
| 次元 | 生成AI | Agentic AI | 変化倍率 |
|---|---|---|---|
| 1回あたりのトークン消費 | 1回の質問応答 ~1K-5K tokens | Agentの多段階推論 ~100K-1M tokens | 20-200倍 |
| セッション長 | 1回セッション <30ターン | Agentは数時間から数日間連続実行可能 | 10-100倍 |
| コンテキストウィンドウ | 8K-128K tokens | 1M+ tokens(Agent状態永続化) | 8-125倍 |
| ツール呼び出しオーバーヘッド | なし | ツール呼び出しごとに追加推論 + 解析が必要 | 新規 |
| マルチAgent協調 | 該当なし | 複数のAgentが並列推論、相互通信 | 新規 |
Agentが「思考-行動-観察-再思考」のループを実行する必要がある場合、1回のタスクのトークン消費は従来の生成AIセッションの数百倍を簡単に超える。これが1000%増加の数学的基盤だ。
Vera Rubin:Agent専用に設計された計算プラットフォーム
NVIDIAが公開したVera Rubinプラットフォームのパフォーマンスデータは、この課題に対するエンジニアリングアプローチを明らかにしている:
- 400+ tokens/sec/user:この指標は従来のバッチスループットではなく、Agentシナリオにおける単一ユーザーエクスペリエンスを対象としている
- 極端な共同設計(extreme co-design):CPU、GPU、メモリ、ネットワークのフルチェーン最適化。単純なGPUの積み重ねではない
- 複雑なワークロード向け:Agentシナリオの計算パターンは従来のトレーニング/推論と異なる——より多くの条件分岐、より長い状態保持、より頻繁なツール呼び出し
これはUBSが以前に発表した分析報告と共鳴する:UBSは2030年までに、Agentic AIがサーバーCPUの総アドレス指定可能市場を300億ドルから1700億ドル(約5倍成長)に押し上げると予測している。AIはもはやGPUだけの話ではない。
GPUサプライチェーンは逼迫したまま
黄氏の発言と同じ日、別のXツイートがGPU供給のもう一面を明らかにした:
「Neocloudの誰もが、今日H100を3年前よりも高い価格で貸し出すことになるとは想像していなかった。」
お金があってもGPUを買うのは難しい——フロンティアラボとNeolabsが2026年の大部分のGPU供給をすでにロックしている。これはハイパースケーラーの2026年7250億ドルの設備投資(前年比77%増)のデータと一致する:
| 支出項目 | 金額($1Mあたり) | 割合 |
|---|---|---|
| GPUとアクセラレータ | $520K | 52% |
| ネットワークと光通信 | $150K | 15% |
| データセンターインフラ | $200K | 20% |
| メメモリその他 | $130K | 13% |
AIインフラ投資の半分以上がGPUとアクセラレータに流向——これがH100レンタル価格が下落せず上昇している理由を説明している。
格局判斷
3つのシグナルが重なり、AIインフラの次の幕が描かれている:
-
Agentic AIは「より良いチャットボット」ではなく、計算パターンの根本的な転換である。1000%の増加は、既存インフラの再設計が必要であることを意味する。単純な拡張ではない。
-
Vera Rubinプラットフォームは、NVIDIAが「GPU企業」から「Agent計算プラットフォーム企業」への転換を示している。CPU、メモリ、ネットワークの共同設計の比重が上昇している。
-
GPU供給の逼迫は続く。設備投資が記録的であっても、フロンティア企業の事前ロックにより、中小プレイヤーのGPU取得コストは下落せず上昇している。
アクション提案
- インフラ投資家:NVIDIA Vera Rubinプラットフォームの出荷ペースと採用率を監視する。400+ tokens/sec/userはAgentシナリオの重要なパフォーマンス指標であり、AIインフラ競争力評価の新たなベンチマークとなる。
- AIアプリケーション開発者:Agentワークロードの計算パターンは従来の推論と異なる——より長いコンテキスト、より多くのツール呼び出し、より頻繁な中間状態保存。アーキテクチャ設計においてこれらの要素を考慮する必要がある。
- 中小企業:GPU供給逼迫により、自社でAgentインフラを構築するコストは短期的に下落しない。クラウドAgentサービス(主要モデルプロバイダーのAgent APIなど)の評価は自社構築よりも費用対効果が高い可能性がある。
- チップ業界従事者:AgentシナリオにおけるCPUの役割が回帰している。UBSが予測する5倍のTAM成長は空論ではない——Agentオーケストレーション、状態管理、ツールルーティングはすべてCPU集約型の作業である。