Anthropic 内部で「Claude Jupiter」をテスト：次世代モデルのレッドチームテストが開始

結論先行

Anthropic は内部でコードネーム “claude-jupiter-v1-p” の新モデルに対するレッドチームテストを開始した。命名規則から判断すると、「Jupiter」（木星）は現在の Claude 4.7 Opus の次のフラッグシップモデルである可能性が高い。同時に、英国 AISI の評価データは、GPT-5.5 が特定のエキスパートレベルのタスクで Claude の「Mythos」プレビュー版に迫るか、それを超える結果を示している——Anthropic の製品リズムはかつてないプレッシャーに直面している。

何があったか

Jupiter モデルの暴露

AI セキュリティコミュニティからの投稿が確認した：

“ANTHROPIC 🚨: Anthropic started testing a new ‘claude-jupiter-v1-p’ model with red teams.”

この投稿は 698 件のいいねと 104 件のブックマークを獲得し、コミュニティの関心の高さを示している。

重要情報の分解：

claude-jupiter：内部コードネーム。Anthropic の天体命名の伝統を継承（以前の「Opus」も同様の意味を持つ）
v1-p：おそらく「v1-preview」の略で、プレビュー版であることを示唆
red teams：レッドチームテストは Anthropic のモデル公開前の標準的な安全評価プロセス。Jupiter が開発の最終段階に入ったことを意味する

競争環境の微妙な変化

Jupiter の暴露と同時に、英国 AI 安全研究所（AISI）の評価データが重要なシグナルを明らかにした：

モデル	TLO エンドツーエンド完了	エキスパートレベルタスクスコア
GPT-5.5	2/10	71.4%
Mythos Preview	3/10	未公開

AISI の発見：「GPT-5.5 performs nearly on par with, or better than, mythos in several cases。」これは、Anthropic が Mythos を中心に構築した「性能领先」のナラティブが弱まっている可能性があることを意味する。

なぜ重要なのか

1. Anthropic の製品リズムの分析

過去1年間の Anthropic のリリースリズムを振り返る：

2025年 Q3: Claude 4.0（Sonnet/Opus/Haiku 三世代並行）
2025年 Q4: Claude 4.5 シリーズ
2026年 Q1: Claude 4.7 Opus
2026年 Q2: Mythos（プレビュー版）
2026年 Q2-Q3: Jupiter（予想）

「Jupiter」という命名は、それが Mythos よりも重要なアップデートである可能性を示唆している。「Jupiter」が全く新しいモデルアーキテクチャ（既存モデルのファインチューニング版ではない）であれば、Anthropic はより大きな技術的賭けに出ている可能性がある。

2. レッドチームテストのタイムライン的意義

Anthropic のレッドチームテストは通常、モデル公開リリースの4〜8週間前に開始される。Jupiter のレッドチームテストが4月末に開始された場合：

** earliest 公開リリースウィンドウ**：2026年6月
latest 公開リリースウィンドウ：2026年7月

これは Google I/O（5〜6月予想）や OpenAI の次回更新と「正面衝突」する可能性がある。

3. 安全評価の透明性をめぐる駆け引き

AISI による GPT-5.5 と Mythos の公開比較評価は、実質的に Anthropic に Jupiter の開発加速を迫っている。Mythos の领先優位が公開データによって弱体化すれば、Anthropic は Jupiter で市場の信頼を回復する必要がある。

市場構造の判断

Jupiter の暴露は3つの重要な手がかりを明らかにしている：

Anthropic はペースを落としていない：Claude 4.7 の後に迅速に Jupiter を推進することは、技術ロードマップへの内部の自信を示している
安全評価が競争ツールになりつつある：AISI などの機関の公開データが市場のナラティブに影響を与えており、モデル企業は実際のパフォーマンスで応じる必要がある
次世代競争は6〜7月に集中爆発する可能性：Jupiter、Google I/O の新モデル、OpenAI の後続更新が密集してリリースされる可能性がある

アクション推奨

エンタープライズユーザー：現在の Claude 4.7 のプロダクションワークフローが良好に動作している場合、Jupiter を焦って待つ必要はない——正式リリース後に対象評価を行うことを推奨
開発者：Jupiter がもたらす可能性のある新しい API 機能に注目（特にネイティブなマルチ Agent 協力をサポートする場合）
競合評価者：6〜7月はモデル集中更新ウィンドウ。Jupiter の正式リリース後に主要な購入決定を延期することを検討