結論先行
Anthropic は内部でコードネーム “claude-jupiter-v1-p” の新モデルに対するレッドチームテストを開始した。命名規則から判断すると、「Jupiter」(木星)は現在の Claude 4.7 Opus の次のフラッグシップモデルである可能性が高い。同時に、英国 AISI の評価データは、GPT-5.5 が特定のエキスパートレベルのタスクで Claude の「Mythos」プレビュー版に迫るか、それを超える結果を示している——Anthropic の製品リズムはかつてないプレッシャーに直面している。
何があったか
Jupiter モデルの暴露
AI セキュリティコミュニティからの投稿が確認した:
“ANTHROPIC 🚨: Anthropic started testing a new ‘claude-jupiter-v1-p’ model with red teams.”
この投稿は 698 件のいいねと 104 件のブックマークを獲得し、コミュニティの関心の高さを示している。
重要情報の分解:
- claude-jupiter:内部コードネーム。Anthropic の天体命名の伝統を継承(以前の「Opus」も同様の意味を持つ)
- v1-p:おそらく「v1-preview」の略で、プレビュー版であることを示唆
- red teams:レッドチームテストは Anthropic のモデル公開前の標準的な安全評価プロセス。Jupiter が開発の最終段階に入ったことを意味する
競争環境の微妙な変化
Jupiter の暴露と同時に、英国 AI 安全研究所(AISI)の評価データが重要なシグナルを明らかにした:
| モデル | TLO エンドツーエンド完了 | エキスパートレベルタスクスコア |
|---|---|---|
| GPT-5.5 | 2/10 | 71.4% |
| Mythos Preview | 3/10 | 未公開 |
AISI の発見:「GPT-5.5 performs nearly on par with, or better than, mythos in several cases。」これは、Anthropic が Mythos を中心に構築した「性能领先」のナラティブが弱まっている可能性があることを意味する。
なぜ重要なのか
1. Anthropic の製品リズムの分析
過去1年間の Anthropic のリリースリズムを振り返る:
- 2025年 Q3: Claude 4.0(Sonnet/Opus/Haiku 三世代並行)
- 2025年 Q4: Claude 4.5 シリーズ
- 2026年 Q1: Claude 4.7 Opus
- 2026年 Q2: Mythos(プレビュー版)
- 2026年 Q2-Q3: Jupiter(予想)
「Jupiter」という命名は、それが Mythos よりも重要なアップデートである可能性を示唆している。「Jupiter」が全く新しいモデルアーキテクチャ(既存モデルのファインチューニング版ではない)であれば、Anthropic はより大きな技術的賭けに出ている可能性がある。
2. レッドチームテストのタイムライン的意義
Anthropic のレッドチームテストは通常、モデル公開リリースの4〜8週間前に開始される。Jupiter のレッドチームテストが4月末に開始された場合:
- ** earliest 公開リリースウィンドウ**:2026年6月
- latest 公開リリースウィンドウ:2026年7月
これは Google I/O(5〜6月予想)や OpenAI の次回更新と「正面衝突」する可能性がある。
3. 安全評価の透明性をめぐる駆け引き
AISI による GPT-5.5 と Mythos の公開比較評価は、実質的に Anthropic に Jupiter の開発加速を迫っている。Mythos の领先優位が公開データによって弱体化すれば、Anthropic は Jupiter で市場の信頼を回復する必要がある。
市場構造の判断
Jupiter の暴露は3つの重要な手がかりを明らかにしている:
- Anthropic はペースを落としていない:Claude 4.7 の後に迅速に Jupiter を推進することは、技術ロードマップへの内部の自信を示している
- 安全評価が競争ツールになりつつある:AISI などの機関の公開データが市場のナラティブに影響を与えており、モデル企業は実際のパフォーマンスで応じる必要がある
- 次世代競争は6〜7月に集中爆発する可能性:Jupiter、Google I/O の新モデル、OpenAI の後続更新が密集してリリースされる可能性がある
アクション推奨
- エンタープライズユーザー:現在の Claude 4.7 のプロダクションワークフローが良好に動作している場合、Jupiter を焦って待つ必要はない——正式リリース後に対象評価を行うことを推奨
- 開発者:Jupiter がもたらす可能性のある新しい API 機能に注目(特にネイティブなマルチ Agent 協力をサポートする場合)
- 競合評価者:6〜7月はモデル集中更新ウィンドウ。Jupiter の正式リリース後に主要な購入決定を延期することを検討