C
ChaoBro

Anthropic 内部で「Claude Jupiter」をテスト:次世代モデルのレッドチームテストが開始

Anthropic 内部で「Claude Jupiter」をテスト:次世代モデルのレッドチームテストが開始

結論先行

Anthropic は内部でコードネーム “claude-jupiter-v1-p” の新モデルに対するレッドチームテストを開始した。命名規則から判断すると、「Jupiter」(木星)は現在の Claude 4.7 Opus の次のフラッグシップモデルである可能性が高い。同時に、英国 AISI の評価データは、GPT-5.5 が特定のエキスパートレベルのタスクで Claude の「Mythos」プレビュー版に迫るか、それを超える結果を示している——Anthropic の製品リズムはかつてないプレッシャーに直面している。

何があったか

Jupiter モデルの暴露

AI セキュリティコミュニティからの投稿が確認した:

“ANTHROPIC 🚨: Anthropic started testing a new ‘claude-jupiter-v1-p’ model with red teams.”

この投稿は 698 件のいいねと 104 件のブックマークを獲得し、コミュニティの関心の高さを示している。

重要情報の分解:

  • claude-jupiter:内部コードネーム。Anthropic の天体命名の伝統を継承(以前の「Opus」も同様の意味を持つ)
  • v1-p:おそらく「v1-preview」の略で、プレビュー版であることを示唆
  • red teams:レッドチームテストは Anthropic のモデル公開前の標準的な安全評価プロセス。Jupiter が開発の最終段階に入ったことを意味する

競争環境の微妙な変化

Jupiter の暴露と同時に、英国 AI 安全研究所(AISI)の評価データが重要なシグナルを明らかにした:

モデルTLO エンドツーエンド完了エキスパートレベルタスクスコア
GPT-5.52/1071.4%
Mythos Preview3/10未公開

AISI の発見:「GPT-5.5 performs nearly on par with, or better than, mythos in several cases。」これは、Anthropic が Mythos を中心に構築した「性能领先」のナラティブが弱まっている可能性があることを意味する。

なぜ重要なのか

1. Anthropic の製品リズムの分析

過去1年間の Anthropic のリリースリズムを振り返る:

  • 2025年 Q3: Claude 4.0(Sonnet/Opus/Haiku 三世代並行)
  • 2025年 Q4: Claude 4.5 シリーズ
  • 2026年 Q1: Claude 4.7 Opus
  • 2026年 Q2: Mythos(プレビュー版)
  • 2026年 Q2-Q3: Jupiter(予想)

「Jupiter」という命名は、それが Mythos よりも重要なアップデートである可能性を示唆している。「Jupiter」が全く新しいモデルアーキテクチャ(既存モデルのファインチューニング版ではない)であれば、Anthropic はより大きな技術的賭けに出ている可能性がある。

2. レッドチームテストのタイムライン的意義

Anthropic のレッドチームテストは通常、モデル公開リリースの4〜8週間前に開始される。Jupiter のレッドチームテストが4月末に開始された場合:

  • ** earliest 公開リリースウィンドウ**:2026年6月
  • latest 公開リリースウィンドウ:2026年7月

これは Google I/O(5〜6月予想)や OpenAI の次回更新と「正面衝突」する可能性がある。

3. 安全評価の透明性をめぐる駆け引き

AISI による GPT-5.5 と Mythos の公開比較評価は、実質的に Anthropic に Jupiter の開発加速を迫っている。Mythos の领先優位が公開データによって弱体化すれば、Anthropic は Jupiter で市場の信頼を回復する必要がある。

市場構造の判断

Jupiter の暴露は3つの重要な手がかりを明らかにしている:

  1. Anthropic はペースを落としていない:Claude 4.7 の後に迅速に Jupiter を推進することは、技術ロードマップへの内部の自信を示している
  2. 安全評価が競争ツールになりつつある:AISI などの機関の公開データが市場のナラティブに影響を与えており、モデル企業は実際のパフォーマンスで応じる必要がある
  3. 次世代競争は6〜7月に集中爆発する可能性:Jupiter、Google I/O の新モデル、OpenAI の後続更新が密集してリリースされる可能性がある

アクション推奨

  • エンタープライズユーザー:現在の Claude 4.7 のプロダクションワークフローが良好に動作している場合、Jupiter を焦って待つ必要はない——正式リリース後に対象評価を行うことを推奨
  • 開発者:Jupiter がもたらす可能性のある新しい API 機能に注目(特にネイティブなマルチ Agent 協力をサポートする場合)
  • 競合評価者:6〜7月はモデル集中更新ウィンドウ。Jupiter の正式リリース後に主要な購入決定を延期することを検討