GPT-5.5 Codex Agent протестирован: управление браузером, операции с компьютером и автономное выполнение

Когда OpenAI выпустила GPT-5.5 23 апреля, она одновременно представила режим Codex Agent. Помимо программирования, самая примечательная особенность режима Agent GPT-5.5 — управление браузером и операциями с компьютером — ИИ может автономно навигировать по веб-страницам, управлять интерфейсами приложений и даже вести переговоры со службой поддержки.

Обзор возможностей агента

Ключевые способности GPT-5.5 Codex Agent:

Управление браузером: С подпиской ChatGPT Pro+ и включённым computer use, агент может захватить браузер, автономно выполняя вход, навигацию, заполнение форм и другие операции
Операции с компьютером: Прямое управление интерфейсами операционной системы без использования API или командной строки
Принятие решений в реальном времени: При столкновении с всплывающими окнами, капчами или изменениями страниц во время операций агент может автономно оценивать ситуацию и корректировать стратегию

Реальные тестовые кейсы

В сообществе задокументировано несколько реальных случаев использования:

Отмена подписки и запрос возврата: Пользователь попросил агента «войти в Amazon, отменить подписку Prime и запросить возврат $15.89 за апрель». Агент автономно выполнил:

Вошёл в аккаунт Amazon
Перешёл на страницу управления подпиской
Отменил подписку
Открыл чат со службой поддержки
Объяснил цикл выставления счетов и договорился о возврате
Успешно получил возврат $15

Весь процесс был завершён за считанные минуты без вмешательства человека.

Генерация брендового фона для конференц-залов: На DevDay OpenAI представила проект BrandRoom, использующий Codex + GPT-5.5 и GPT Image 2 для автоматической генерации брендовых фонов для встреч, решая проблему фонов для видеоконференций удалённых команд.

Сравнение с Claude Code

В сценариях программирования с агентом некоторые пользователи сообщают, что прозрачность ценообразования Codex ниже, чем у Claude Code: инженерная команда из 16 человек рассматривала переход с Codex на Cursor, поскольку прозрачность использования токенов и ценообразования Cursor выше, а также поддерживает больше моделей, таких как Composer 2.

Тем не менее, способность Codex Agent управлять браузером в настоящее время лидирует — Claude Code в основном фокусируется на операциях внутри среды программирования, тогда как Codex может управлять браузерами и более широким спектром настольных приложений.

Интересный факт: системный промпт Goblin

В системный промпт Codex добавлено новое правило: запрещено упоминать гоблинов (goblins), грмлинов (gremlins), троллей (trolls) и других «существ», если они не относятся к задаче. Сообщество обнаружило, что GPT-5.5 ранее чрезмерно реагировал на слово «goblin» в Codex, что побудило OpenAI добавить явное правило запрета. Это отражает непредсказуемость моделей агентов в сложных взаимодействиях.

Основные источники

OpenAI Codex
OpenAI DevDay 2026
Отчёты о тестировании сообщества (X/Twitter)

Обзор возможностей агента

Реальные тестовые кейсы

Сравнение с Claude Code

Интересный факт: системный промпт Goblin

Рекомендации к действию

Основные источники

Похожие материалы

OpenAI Workspace Agents запуск: от личного чата к командной автоматизации, сдвиг парадигмы ChatGPT

DeepSeek V4 Flash обзор: Вызов инструментов значительно улучшен, многошаговые рабочие процессы одним промптом

Baidu ERNIE 5.1 Preview дебютировал в Arena на #13, возглавил категорию права