核心的な結論
xAIは最もxAIらしい方法でヘビー級モデルをリリースした:プレス会議なし、ブログ記事なし、APIに直接投入しただけ。
Grok 4.3はVeniceなどのプラットフォームでひっそりと稼働を開始し、100万トークンのコンテキスト、関数呼び出し、マルチモーダル入力、ネイティブX検索をサポートしている。Artificial Analysis知能指数で53点を達成し、Muse Spark、Claude Sonnet 4.6、前世代Grokを上回った。API価格も同時に調整され、入力は$2.10から$1.25/Mトークンに(40%カット)、出力は60%カットされた。
ベンチマーク性能
Artificial Analysis 知能指数
| モデル | AA指数 | 備考 |
|---|---|---|
| GPT-5.5 Pro | 約60+ | 現在のリーダー |
| Grok 4.3 | 53 | Muse Spark、Sonnet 4.6を上回る |
| Muse Spark | 53未満 | Grok 4.3に抜かれる |
| Claude Sonnet 4.6 | 53未満 | Grok 4.3に抜かれる |
| Gemini 3.1 Pro | 約50 | Grok 4.3に近い |
Vals Index ランキング
| ベンチマーク | Grok 4.3順位 | 備考 |
|---|---|---|
| 総合 | #13 | 平均以上 |
| CaseLaw | #1 | 法推理でトップクラス |
| CorpFin | #1 | 企業金融分析でトップクラス |
| 一般プログラミング | 弱い | 得意分野ではない |
GDPval-AA ベンチマーク
Grok 4.3の最も重要な改善は実世界のAgentタスクにある——GDPval-AAベンチマークで、Grok 4.3のエージェンティック能力スコアは大幅に向上した。これは「AIがタスクを独立して完了できるか」を測定する核心指標だ。
価格戦略分析
| 項目 | Grok 4.3 | 変化 |
|---|---|---|
| 入力価格 | $1.25/Mトークン | ↓ 40% |
| 出力価格 | 大幅削減 | ↓ 60% |
| コンテキストウィンドウ | 100万トークン | 前代と同様 |
この価格戦略は極めて攻撃的だ。$1.25/Mトークンの入力価格はすでに大多数の中堅モデルを下回っているが、Grok 4.3の性能は第一梯队に位置している。xAIは明らかに**「コスパ路線」**を追求している——DeepSeek V4に近い価格でClaude Opus 4.7に近い性能を提供する。
競合他社との横断比較
| 次元 | Grok 4.3 | Claude Sonnet 4.6 | GPT-5.5 | DeepSeek V4 |
|---|---|---|---|---|
| AA指数 | 53 | 53未満 | 約60+ | N/A |
| 入力価格 | $1.25/M | 約$3/M | 約$5/M | 約$0.15/M |
| 法推理 | #1 | 強い | 強い | 中 |
| 金融分析 | #1 | 強い | 強い | 中 |
| 一般プログラミング | 弱い | 強い | 強い | 強い |
| Agent能力 | 大幅改善 | 強い | 強い | 強い |
市場分析
Grok 4.3のリリースはいくつかのシグナルを送っている:
- xAIは「追撃者」から「コスパリーダー」へと移行している:53点のAA指数に$1.25の価格で、ClaudeやGPTを遥かに凌ぐコストパフォーマンス
- 専門分野での明確な優位性:CaseLawとCorpFinでの#1ランキングは、Grok 4.3が法務・金融垂直シナリオで独特の優位性を持っていることを示す
- サイレント launchesはxAIがマーケティングより製品を重視していることを示す:これは長所(実務的)でもあり短所(知名度不足)でもある
活用方法
- 法務・金融従事者:Grok 4.3のCaseLawとCorpFinでの#1ランキングは注目価値がある——おそらく最もコストパフォーマンスの高い専門モデルの選択肢
- APIユーザー:$1.25/Mの入力価格 + 53点の性能は、第一梯队モデルの中で最も安いオプション
- Agent開発者:GDPval-AAでの大幅な改善は、Grok 4.3のAgentシナリオでの信頼性が著しく向上したことを意味する——試す価値あり