CAISI 扩容：Google/Microsoft/xAI 加入美国政府 AI 安全测试计划，自愿框架走向实质化

核心判断

Google DeepMind、Microsoft 和 xAI 正式加入 CAISI（AI 标准与创新中心）的前沿模型安全测试计划，同意在新模型公开发布前向美国政府提供早期访问，用于国家安全评估。

这一变化看似”自愿”，但放在美国政府近期 AI 政策转向的背景下看，它标志着AI 模型监管正在从”行业自律”走向”政府实质审查”。

发生了什么

CAISI 计划扩员

CAISI（Center for AI Standards and Innovation，AI 标准与创新中心）是美国政府主导的前沿 AI 模型安全评估机构。此前已有 OpenAI 和 Anthropic 通过协商加入了该计划，现在 Google DeepMind、Microsoft 和 xAI 也正式加入。

公司	加入状态	涉及模型
OpenAI	已加入（重新协商后）	GPT 系列
Anthropic	已加入（重新协商后）	Claude 系列
Google DeepMind	新加入	Gemini 系列
Microsoft	新加入	Copilot/Phi 系列
xAI	新加入	Grok 系列

政策反转的时间线

时间	事件	方向
2025 年 1 月	特朗普签署行政令，撤销拜登时期 AI 监管约束	放手
2025 年	CAISI 成立，初期仅有 1-2 家公司参与	试探
2026 年 4-5 月	Google/Microsoft/xAI 加入 CAISI	收紧
2026 年 5 月	白宫讨论 AI 模型发布前审查行政令	更强监管

16 个月内，政策从”全面松绑”转向”多家公司自愿接受政府测试”，再到讨论”强制发布前审查”——这一转变的速度和幅度超出市场预期。

关键解读

1. “自愿”背后的真实驱动力

虽然 CAISI 定位为”自愿计划”，但参与的公司面临着现实的政策压力：

行政令威胁：白宫正在讨论的 AI 模型发布前审查行政令，如果不参与”自愿”计划，可能面临强制审查
国家安全关切：AI 模型的网络安全、生物安全、虚假信息生成能力成为政府关注的核心问题
行业共识：头部公司意识到，建立可信的安全评估框架对整个行业的可持续发展是必要的

2. CAISI 测试的范围

根据公开信息，CAISI 的评估至少涵盖以下维度：

网络安全：模型是否可能被用于自动化网络攻击
生物安全：模型是否可能被用于设计生物武器或危险病原体
虚假信息：模型生成高质量虚假内容的能力评估
对齐与安全：模型在边界情况下的行为预测

3. 对竞争格局的影响

CAISI 的扩容对 AI 行业竞争格局产生微妙影响：

维度	影响
准入壁垒	新进入者可能需要承担同等安全测试成本
发布节奏	政府测试可能延长模型从开发到发布的周期
中国模型	CAISI 评估主要覆盖美国公司，中国模型可能面临不同的监管框架
开源模型	开源权重的安全评估仍然是未解决的难题

行动建议

角色	建议
AI 创业公司	关注 CAISI 的评估标准和流程，提前准备安全合规材料
企业用户	评估供应商是否参与 CAISI 测试，作为选择 AI 服务的参考因素
开发者	关注 CAISI 公开的评估报告，了解不同模型的安全表现
政策研究者	跟踪 CAISI 从”自愿”走向”强制”的政策演进路径

风险因素

CAISI 的具体评估标准和流程尚未完全公开
“自愿”框架可能在政治压力下转为强制要求
安全测试可能拖慢创新节奏，影响美国 AI 竞争力
中国 AI 模型在国际市场可能面临额外的合规要求