GPT-5.5 Codex Agent 実測：ブラウザ制御、コンピュータ操作、Agent 自律実行

OpenAI は 4 月 23 日に GPT-5.5 をリリースした際、Codex Agent モードを同時に発表した。プログラミング能力に加えて、GPT-5.5 の Agent モードで最も注目すべきはブラウザ制御とコンピュータ操作能力——AI がウェブページの自律ナビゲーション、アプリケーションインターフェースの操作、さらにはカスタマーサービスとの交渉まで実行できる。

Agent 能力概要

GPT-5.5 Codex Agent の中核能力：

ブラウザ制御：ChatGPT Pro+ サブスクリプションで computer use を有効にすると、Agent がブラウザを乗っ取り、ログイン、ナビゲーション、フォーム入力などを自律的に完了
コンピュータ操作：API やコマンドラインを経由せずに、直接オペレーティングシステムのインターフェースを操作
リアルタイム意思決定：操作中にポップアップ、CAPTCHA、ページ変更が発生した場合、Agent が自律的に判断して戦略を調整

実測ケース

コミュニティで複数の実用例が記録されている：

サブスクリプション解約と返金申請：ユーザーが Agent に「Amazon にログインし、Prime 会員を解約し、4 月の $15.89 の返金を申請して」と依頼。Agent が以下のステップを自律的に完了：

Amazon アカウントにログイン
会員管理ページにナビゲート
サブスクリプションを解約
オンラインカスタマーサービスチャットを開く
請求サイクルを説明し返金を交渉
$15 の返金を成功裏に獲得

全プロセスは人間の介入なしに数分で完了した。

ブランド会議室背景生成：DevDay で OpenAI は BrandRoom プロジェクトを発表、Codex + GPT-5.5 と GPT Image 2 を使用してブランド化された会議背景を自動生成し、リモートチームのビデオ会議背景の問題を解決。

Claude Code との比較

Agent プログラミングシナリオにおいて、一部のユーザーは Codex の価格透明性が Claude Code より低いと報告している：16 人のエンジニアリングチームが Codex から Cursor への切り替えを検討、Cursor のトークン使用量と価格がより透明で、Composer 2 などの更多のモデルをサポートしているため。

ただし、Codex Agent のブラウザ制御能力は現在リードしている——Claude Code は主にコーディング環境内の操作に焦点を当てているが、Codex はブラウザとより幅広いデスクトップアプリケーションを操作できる。

余談：Goblin システムプロンプト

Codex のシステムプロンプトに新しいルールが追加された：ゴブリン（goblins）、グレムリン（gremlins）、トロール（trolls）などの「クリーチャー」について、タスクに関連しない限り言及を禁止する。コミュニティは GPT-5.5 が Codex で「goblin」という言葉に過剰反応していたことを発見し、OpenAI が明示的な禁止ルールを追加した。これは複雑なインタラクションにおける Agent モデルの予測不可能性を反映している。

アクション推奨

ブラウザ自動化が必要なユーザー：GPT-5.5 Codex Agent のブラウザ制御能力は現在最も成熟したソリューションの一つ。Pro+ サブスクリプションを申請し computer use を有効にしてテスト
エンジニアリングチーム：チームが主にプログラミング Agent を使用している場合、Codex と Cursor/Claude Code のトークンコストと透明性を比較
セキュリティ考慮：Agent はブラウザとシステムインターフェースを操作できる。本番環境で明確な権限境界と操作範囲を設定

主要ソース

OpenAI Codex
OpenAI DevDay 2026
コミュニティ実測レポート（X/Twitter）

Agent 能力概要

実測ケース

Claude Code との比較

余談：Goblin システムプロンプト

アクション推奨

主要ソース

関連コンテンツ

OpenAI Workspace Agents リリース：個人チャットからチーム自動化へ、ChatGTTのパラダイムシフト

DeepSeek V4 Flash レビュー：ツール呼び出しが大幅改善、ワンプロンプトでマルチステップワークフロー

百度ERNIE 5.1 PreviewがArenaに登場、世界13位、法分野で1位を獲得