GPT-5.5 Codex Agent 実測:ブラウザ制御、コンピュータ操作、Agent 自律実行

GPT-5.5 Codex Agent 実測:ブラウザ制御、コンピュータ操作、Agent 自律実行

OpenAI は 4 月 23 日に GPT-5.5 をリリースした際、Codex Agent モードを同時に発表した。プログラミング能力に加えて、GPT-5.5 の Agent モードで最も注目すべきはブラウザ制御とコンピュータ操作能力——AI がウェブページの自律ナビゲーション、アプリケーションインターフェースの操作、さらにはカスタマーサービスとの交渉まで実行できる。

Agent 能力概要

GPT-5.5 Codex Agent の中核能力:

  • ブラウザ制御:ChatGPT Pro+ サブスクリプションで computer use を有効にすると、Agent がブラウザを乗っ取り、ログイン、ナビゲーション、フォーム入力などを自律的に完了
  • コンピュータ操作:API やコマンドラインを経由せずに、直接オペレーティングシステムのインターフェースを操作
  • リアルタイム意思決定:操作中にポップアップ、CAPTCHA、ページ変更が発生した場合、Agent が自律的に判断して戦略を調整

実測ケース

コミュニティで複数の実用例が記録されている:

サブスクリプション解約と返金申請:ユーザーが Agent に「Amazon にログインし、Prime 会員を解約し、4 月の $15.89 の返金を申請して」と依頼。Agent が以下のステップを自律的に完了:

  1. Amazon アカウントにログイン
  2. 会員管理ページにナビゲート
  3. サブスクリプションを解約
  4. オンラインカスタマーサービスチャットを開く
  5. 請求サイクルを説明し返金を交渉
  6. $15 の返金を成功裏に獲得

全プロセスは人間の介入なしに数分で完了した。

ブランド会議室背景生成:DevDay で OpenAI は BrandRoom プロジェクトを発表、Codex + GPT-5.5 と GPT Image 2 を使用してブランド化された会議背景を自動生成し、リモートチームのビデオ会議背景の問題を解決。

Claude Code との比較

Agent プログラミングシナリオにおいて、一部のユーザーは Codex の価格透明性が Claude Code より低いと報告している:16 人のエンジニアリングチームが Codex から Cursor への切り替えを検討、Cursor のトークン使用量と価格がより透明で、Composer 2 などの更多のモデルをサポートしているため。

ただし、Codex Agent のブラウザ制御能力は現在リードしている——Claude Code は主にコーディング環境内の操作に焦点を当てているが、Codex はブラウザとより幅広いデスクトップアプリケーションを操作できる。

余談:Goblin システムプロンプト

Codex のシステムプロンプトに新しいルールが追加された:ゴブリン(goblins)、グレムリン(gremlins)、トロール(trolls)などの「クリーチャー」について、タスクに関連しない限り言及を禁止する。コミュニティは GPT-5.5 が Codex で「goblin」という言葉に過剰反応していたことを発見し、OpenAI が明示的な禁止ルールを追加した。これは複雑なインタラクションにおける Agent モデルの予測不可能性を反映している。

アクション推奨

  • ブラウザ自動化が必要なユーザー:GPT-5.5 Codex Agent のブラウザ制御能力は現在最も成熟したソリューションの一つ。Pro+ サブスクリプションを申請し computer use を有効にしてテスト
  • エンジニアリングチーム:チームが主にプログラミング Agent を使用している場合、Codex と Cursor/Claude Code のトークンコストと透明性を比較
  • セキュリティ考慮:Agent はブラウザとシステムインターフェースを操作できる。本番環境で明確な権限境界と操作範囲を設定

主要ソース