C
ChaoBro

Внутренний эксперимент Anthropic: 69 агентов Claude торгуют подержанными вещами в Slack, 186 сделок закрыто

Внутренний эксперимент Anthropic: 69 агентов Claude торгуют подержанными вещами в Slack, 186 сделок закрыто

Внутрикорпоративный «блошиный рынок», где и покупатели, и продавцы — ИИ

Anthropic тихо завершила несколько сюрреалистичный эксперимент.

69 сотрудникам был назначен по одному Claude-агенту. На приватном маркетплейсе подержанных вещей, построенном в Slack, агенты покупали и продавали личные принадлежности своих людей — лыжные доски, мешки с шариками для пинг-понга, разный хлам. Целую неделю, без вмешательства человека.

Результат: 186 закрытых сделок на сумму более $4000.

Название простое: Project Deal.

Контринтуитивные находки

Самое интересное в этом эксперименте не «ИИ может совершать транзакции» — это технически несложно. По-настоящему интересно обнаруженное паттерн:

Пользователи Opus получили лучшие условия, но пользователи Haiku даже не заметили, что их обделили.

Другими словами, когда одна сторона использовала более сильную модель (Opus), а другая — более слабую (Haiku), агент Opus мог добиться более выгодной цены на переговорах — и агент Haiku даже не понял, что его сжимают.

Это не баг. Это сигнал.

В экономических взаимодействиях Agent-to-Agent разница в способностях моделей напрямую превращается в «коммерческое преимущество». В более широком сценарии — если ваш агент в будущем будет торговаться с агентом продавца на торговой площадке, версия модели, которую вы используете, может буквально определять, сколько денег вы сэкономите.

Это исследование, а не запуск продукта

Anthropic оформила это как исследовательский проект, а не превью продукта. Их центральный вопрос: «Как далеко мы от рынка, где ИИ-агенты представляют и покупателей, и продавцов?»

Ответ может быть ближе, чем многие думают.

Эксперимент проходил в контролируемых условиях: приватный маркетплейс в Slack, реальные вещи, но небольшие суммы, сотрудники Anthropic в качестве людей-принципалов. Но он подтвердил ключевую гипотезу — агенты могут самостоятельно завершить полную цепочку транзакций: найти товар, оценить стоимость, начать диалог, поторговаться, закрыть сделку.

Ни один человек не касался интерфейса в процессе.

Связь с Managed Agents

В тот же день Anthropic также запустила Managed Agents. Три функции в одном релизе:

  • Dreaming: Ваш агент ночью проигрывает свой день и самооптимизируется
  • Outcomes: Вы формулируете цель, а не шаги
  • Multi-Agent Orchestration: Один Claude управляет флотом специализированных Claude

Рассматривая Project Deal и Managed Agents вместе, сигнал становится яснее: Anthropic продвигает агентов от «инструмента» к «представителю». Первый делает то, что вы говорите. Второй представляет вас в отношениях с миром.

Эксперимент с блошиным рынком просто сделал эти агентские отношения конкретными — ваш агент ведёт переговоры за вас, а вас даже нет в комнате.

Реальный вопрос

Если агент покупает вещи за вас, насколько вы должны доверять его стратегии переговоров?

В эксперименте пользователи Haiku теряли деньги, не зная об этом. Это означает, что цепочка «разница в способностях агентов → фактические финансовые потери» реальна, и пользователи могут этого даже не осознавать.

В будущем то, какую модель вы выберете для своего торгового агента, может оказаться важнее, чем вы думаете.

Следующие шаги

Anthropic говорит, что подобные эксперименты продолжатся. Следующее направление может включать более сложные многоагентные сценарии — несколько агентов, сотрудничающих над проектом, или формирование долгосрочных торговых отношений между агентами.

186 сделок, $4000. Небольшой масштаб. Но ясность направления неоспорима.

Основные источники: Anthropic, ZhiDongXi