GPT-5.5 Codex Agent протестирован: управление браузером, операции с компьютером и автономное выполнение

GPT-5.5 Codex Agent протестирован: управление браузером, операции с компьютером и автономное выполнение

Когда OpenAI выпустила GPT-5.5 23 апреля, она одновременно представила режим Codex Agent. Помимо программирования, самая примечательная особенность режима Agent GPT-5.5 — управление браузером и операциями с компьютером — ИИ может автономно навигировать по веб-страницам, управлять интерфейсами приложений и даже вести переговоры со службой поддержки.

Обзор возможностей агента

Ключевые способности GPT-5.5 Codex Agent:

  • Управление браузером: С подпиской ChatGPT Pro+ и включённым computer use, агент может захватить браузер, автономно выполняя вход, навигацию, заполнение форм и другие операции
  • Операции с компьютером: Прямое управление интерфейсами операционной системы без использования API или командной строки
  • Принятие решений в реальном времени: При столкновении с всплывающими окнами, капчами или изменениями страниц во время операций агент может автономно оценивать ситуацию и корректировать стратегию

Реальные тестовые кейсы

В сообществе задокументировано несколько реальных случаев использования:

Отмена подписки и запрос возврата: Пользователь попросил агента «войти в Amazon, отменить подписку Prime и запросить возврат $15.89 за апрель». Агент автономно выполнил:

  1. Вошёл в аккаунт Amazon
  2. Перешёл на страницу управления подпиской
  3. Отменил подписку
  4. Открыл чат со службой поддержки
  5. Объяснил цикл выставления счетов и договорился о возврате
  6. Успешно получил возврат $15

Весь процесс был завершён за считанные минуты без вмешательства человека.

Генерация брендового фона для конференц-залов: На DevDay OpenAI представила проект BrandRoom, использующий Codex + GPT-5.5 и GPT Image 2 для автоматической генерации брендовых фонов для встреч, решая проблему фонов для видеоконференций удалённых команд.

Сравнение с Claude Code

В сценариях программирования с агентом некоторые пользователи сообщают, что прозрачность ценообразования Codex ниже, чем у Claude Code: инженерная команда из 16 человек рассматривала переход с Codex на Cursor, поскольку прозрачность использования токенов и ценообразования Cursor выше, а также поддерживает больше моделей, таких как Composer 2.

Тем не менее, способность Codex Agent управлять браузером в настоящее время лидирует — Claude Code в основном фокусируется на операциях внутри среды программирования, тогда как Codex может управлять браузерами и более широким спектром настольных приложений.

Интересный факт: системный промпт Goblin

В системный промпт Codex добавлено новое правило: запрещено упоминать гоблинов (goblins), грмлинов (gremlins), троллей (trolls) и других «существ», если они не относятся к задаче. Сообщество обнаружило, что GPT-5.5 ранее чрезмерно реагировал на слово «goblin» в Codex, что побудило OpenAI добавить явное правило запрета. Это отражает непредсказуемость моделей агентов в сложных взаимодействиях.

Рекомендации к действию

  • Пользователям, нуждающимся в автоматизации браузера: Управление браузером GPT-5.5 Codex Agent — одно из самых зрелых решений на текущий момент. Подайте заявку на подписку Pro+ и включите computer use для тестирования
  • Инженерным командам: Если ваша команда в основном использует агентов для программирования, а не автоматизации браузера, сравните стоимость токенов и прозрачность Codex vs. Cursor/Claude Code
  • Вопросы безопасности: Агенты могут управлять браузерами и системными интерфейсами. Установите чёткие границы разрешений и операционные рамки в производственных средах

Основные источники