Anthropic CEO：Claude正在设计下一代Claude，AI自设计时代到来

核心信号

Anthropic CEO的一句话在AI圈引发了广泛关注：

“At Anthropic, we essentially have Claude designing the next version of Claude itself, not completely but most of it.”

这句话的分量不亚于OpenAI首次展示GPT-3时的震撼。它标志着AI系统正在经历一个根本性的范式转移：从”人类设计AI”到”AI设计AI”。

Claude参与设计下一代Claude，并非科幻电影中的”AI自我觉醒”，而是当前已经在发生的具体工程实践：

架构优化：Claude可以分析自身模型的瓶颈——注意力机制在哪些场景下效率低下、某些层的冗余度是否过高、MoE路由策略是否需要调整。这些分析结果直接反馈给工程团队，用于改进下一版本的模型架构。

训练策略设计：Claude能够评估不同训练数据组合的效果，提出数据配比建议，甚至设计新的fine-tuning方案。这大幅缩短了从实验到部署的周期。

安全机制迭代：Claude参与设计自身的安全护栏——包括Constitutional AI规则的更新、红队测试用例的生成、以及对抗性攻击的检测策略。

AI自设计不是Anthropic的独家专利，但Claude在这方面的公开披露是最明确的。

Anthropic的独特之处在于，它将AI自设计与安全研究深度绑定。Claude不仅设计”更好的”Claude，还要设计”更安全的”Claude。这回应了一个核心担忧：如果AI能自我改进，如何确保它不会在安全上”走捷径”？

AI自设计能力的竞争，正在成为模型厂商之间新的分水岭。

短期内，这种能力带来的直接收益是研发效率的指数级提升。Anthropic的年化收入从2025年底的90亿美元增长到2026年3月的190亿美元——不到四个月翻倍——部分归功于研发效率的飞跃。

长期来看，这可能导致模型迭代速度的军备竞赛。如果Claude每周能自我迭代一次，而其他模型仍需按月发布新版本，差距会快速扩大。