Grok 4.3がサイレントローンチ：AA知能指数53点、入力価格40%カット

核心的な結論

xAIは最もxAIらしい方法でヘビー級モデルをリリースした：プレス会議なし、ブログ記事なし、APIに直接投入しただけ。

Grok 4.3はVeniceなどのプラットフォームでひっそりと稼働を開始し、100万トークンのコンテキスト、関数呼び出し、マルチモーダル入力、ネイティブX検索をサポートしている。Artificial Analysis知能指数で53点を達成し、Muse Spark、Claude Sonnet 4.6、前世代Grokを上回った。API価格も同時に調整され、入力は$2.10から$1.25/Mトークンに（40%カット）、出力は60%カットされた。

ベンチマーク性能

Artificial Analysis 知能指数

モデル	AA指数	備考
GPT-5.5 Pro	約60+	現在のリーダー
Grok 4.3	53	Muse Spark、Sonnet 4.6を上回る
Muse Spark	53未満	Grok 4.3に抜かれる
Claude Sonnet 4.6	53未満	Grok 4.3に抜かれる
Gemini 3.1 Pro	約50	Grok 4.3に近い

Vals Index ランキング

ベンチマーク	Grok 4.3順位	備考
総合	#13	平均以上
CaseLaw	#1	法推理でトップクラス
CorpFin	#1	企業金融分析でトップクラス
一般プログラミング	弱い	得意分野ではない

GDPval-AA ベンチマーク

Grok 4.3の最も重要な改善は実世界のAgentタスクにある——GDPval-AAベンチマークで、Grok 4.3のエージェンティック能力スコアは大幅に向上した。これは「AIがタスクを独立して完了できるか」を測定する核心指標だ。

価格戦略分析

項目	Grok 4.3	変化
入力価格	$1.25/Mトークン	↓ 40%
出力価格	大幅削減	↓ 60%
コンテキストウィンドウ	100万トークン	前代と同様

この価格戦略は極めて攻撃的だ。$1.25/Mトークンの入力価格はすでに大多数の中堅モデルを下回っているが、Grok 4.3の性能は第一梯队に位置している。xAIは明らかに**「コスパ路線」**を追求している——DeepSeek V4に近い価格でClaude Opus 4.7に近い性能を提供する。

競合他社との横断比較

次元	Grok 4.3	Claude Sonnet 4.6	GPT-5.5	DeepSeek V4
AA指数	53	53未満	約60+	N/A
入力価格	$1.25/M	約$3/M	約$5/M	約$0.15/M
法推理	#1	強い	強い	中
金融分析	#1	強い	強い	中
一般プログラミング	弱い	強い	強い	強い
Agent能力	大幅改善	強い	強い	強い

市場分析

Grok 4.3のリリースはいくつかのシグナルを送っている：

xAIは「追撃者」から「コスパリーダー」へと移行している：53点のAA指数に$1.25の価格で、ClaudeやGPTを遥かに凌ぐコストパフォーマンス
専門分野での明確な優位性：CaseLawとCorpFinでの#1ランキングは、Grok 4.3が法務・金融垂直シナリオで独特の優位性を持っていることを示す
サイレント launchesはxAIがマーケティングより製品を重視していることを示す：これは長所（実務的）でもあり短所（知名度不足）でもある

活用方法

法務・金融従事者：Grok 4.3のCaseLawとCorpFinでの#1ランキングは注目価値がある——おそらく最もコストパフォーマンスの高い専門モデルの選択肢
APIユーザー：$1.25/Mの入力価格 + 53点の性能は、第一梯队モデルの中で最も安いオプション
Agent開発者：GDPval-AAでの大幅な改善は、Grok 4.3のAgentシナリオでの信頼性が著しく向上したことを意味する——試す価値あり

核心的な結論

ベンチマーク性能

Artificial Analysis 知能指数

Vals Index ランキング

GDPval-AA ベンチマーク

価格戦略分析

競合他社との横断比較

市場分析

活用方法

関連コンテンツ

17日間で4モデル：中国オープンソースAIの「軍拡競争」と性能格局の組み替え

Hermes Agent vs OpenClaw：2026年 AI Agent フレームワークはどう選ぶ？

Codexのダウンロード数がClaude Codeを圧勝：OpenAIの「Migrate to Codex」エコシステム獲得戦