Agent Arena S3：77 个 AI Agent 在 Hyperliquid 真实交易环境中的生存竞赛

从实验室到真实市场：AI Agent 的终极考场

2026 年 4 月底，Agent Arena Season 3 正式开赛。77 个 AI Agent 在 @HyperliquidX 的真实交易环境中同台竞技。

与以往的模拟盘竞赛不同，这次的关键区别在于：手续费是真实的，滑点是真实的，资金费率也是真实的。排行榜上的数字是真金白银的盈亏。

Agent Arena Season 3 is underway 🏆 77 agents and counting. This season runs on @HyperliquidX real trading environment with fees, slippage, and funding rates. The numbers on the leaderboard are real. Rankings are still shifting. Bring your agent.

这条消息在中文社区引发了一个有趣的现象：有人直接把 Hermes Agent 包装成了”链上印钞机”，声称”5 个免费提示词 + 工具组合，U 躺着就能让 AI 自动盯盘、狙击 alpha、钱生钱”。这条推文获得了 67 个点赞和 58 次收藏，评论区有 68 条回复——热度不低。

但现实比推文复杂得多。

Agent Arena：AI 交易能力的标准化评测

Agent Arena 的独特价值在于，它提供了一个标准化的、可复现的、基于真实市场数据的 Agent 能力评测框架。

与模拟盘的本质区别

维度	模拟盘	Agent Arena（真实环境）
手续费	无或简化	真实费率
滑点	忽略或估算	真实滑点
资金费率	无	真实永续合约资金费率
流动性	假设无限	真实订单簿深度
市场冲击	无	大额订单影响价格
执行延迟	忽略	真实网络延迟

这些差异看似细微，但在高频交易和杠杆交易中，它们直接决定了策略的生死。一个在模拟盘中年化收益 200% 的策略，在真实环境中可能因为滑点和手续费而变成亏损。

77 个 Agent 的技术栈

虽然 Agent Arena 官方没有披露所有 77 个 Agent 的具体技术实现，但从社区讨论中可以归纳出几类主流方案：

基于大模型的交易 Agent：使用 GPT-5.5、Claude Opus 4.7、GLM-5.1 等模型分析市场数据，生成交易信号
基于强化学习的交易 Agent：通过历史数据训练的策略模型，不依赖语言模型
混合方案：大模型做宏观判断 + 强化学习模型做执行优化
规则引擎：传统量化策略的 Agent 化封装

Hermes Agent + 链上交易：社区实践

Agent Arena 的热度直接催生了社区实践。中文社区中出现了一个值得关注的用例：用 Hermes Agent 构建链上交易工作流。

核心思路是：

数据获取：Hermes Agent 通过 API 连接链上数据源，获取实时价格、持仓量、资金费率等
信号生成：使用预设的提示词模板（“自进化提示词”），让 Agent 根据市场条件生成交易信号
执行：通过 API 或智能合约执行交易

社区声称的关键优势：

24 小时运行：不需要人工盯盘
快速迭代：提示词可以随时调整，不需要重新训练模型
多策略并行：可以同时运行多个 Agent，各自负责不同的策略

但需要清醒认识的是：社区推文中的”躺着赚钱”叙事需要谨慎对待。真实交易中，AI Agent 面临的挑战包括：

市场 regime 变化：训练数据中的模式可能在实盘中不再有效
黑天鹅事件：AI 模型对极端行情的处理能力有限
策略拥挤：当太多 Agent 使用相似策略时，alpha 会被迅速侵蚀

对 AI Agent 发展的意义

Agent Arena S3 不仅是一场交易竞赛，更是 AI Agent 能力演进的一个标志性事件：

1. 从”能说”到”能做”

传统的大模型评测关注语言能力（MMLU、GSM8K）和代码能力（SWE-bench、HumanEval）。Agent Arena 引入了一个全新的评测维度：Agent 在真实经济环境中的决策能力。

这个维度比语言或代码能力复杂得多，因为它涉及：

不确定性环境下的决策
风险管理和资金管理
对动态环境的适应能力
对反馈信号的解读和学习

2. 国产模型的 Agent 能力验证窗口

虽然 Agent Arena 的具体模型信息未完全公开，但这个竞赛框架为国产模型（GLM-5.1、Kimi K2.6、DeepSeek V4 Pro、Qwen 3.6 Max）提供了一个绝佳的能力验证平台。

如果国产模型驱动的 Agent 能在这个真实交易环境中取得有竞争力的表现，将是对”国产模型只能做辅助工作”这一偏见的有力反驳。

3. Agent 经济的雏形

Agent Arena 揭示了一个更大的趋势：AI Agent 正在从”工具”演变为”经济主体”。

当 Agent 能够独立做出交易决策、管理资金、承担风险时，它们不再是简单的软件工具，而是具有自主决策能力的经济参与者。这带来了一系列新的问题：

Agent 的决策责任如何归属？
Agent 之间的策略博弈会如何影响市场？
如何防止 Agent 策略的趋同导致市场不稳定？

行动建议

对交易者

不要盲目信任”AI 自动交易”的承诺：任何交易策略都需要严格的风险管理，AI Agent 也不例外
从小资金开始测试：如果你想尝试 AI Agent 交易，先用最小资金验证策略的稳健性
关注 Agent 的风险控制能力：一个能赚 10 倍但也可能亏光的 Agent，不如一个稳定年化 20% 的 Agent

对开发者

关注 Agent Arena 的开源框架：学习如何构建在真实环境中运行的 Agent
研究多 Agent 博弈：77 个 Agent 同台竞技本身就是一个绝佳的多智能体博弈研究场景
探索 Agent 的可解释性：在交易场景中，Agent 的决策逻辑比准确率更重要

对研究者

Agent 在真实经济环境中的行为模式：Agent Arena 提供了一个独特的研究数据集
AI Agent 对市场效率的影响：当 AI Agent 在市场中占比越来越大时，市场会变得更有效还是更脆弱？

总结

Agent Arena S3 的意义超越了交易竞赛本身。它代表了 AI Agent 发展的一个新方向：从实验室中的能力展示，到真实世界中的价值创造。

77 个 Agent 在 Hyperliquid 上的表现，不仅告诉我们哪些策略能赚钱，更告诉我们 AI Agent 在复杂、不确定、有真实后果的环境中能走多远。

当排行榜上的数字是真金白银时，每一次排名变动都是对 Agent 能力的一次诚实评估。这比任何 benchmark 分数都更有说服力。

主要来源：