4 月 24 日,OpenAI 正式在 API 和 Playground 中上线 GPT-5.5,标志着这款 4 月 23 日发布的新一代旗舰模型全面开放调用。定价方面,输入 $5/MTok、输出 $30/MTok,较 GPT-5.4 直接翻倍,但 OpenAI 强调新模型在 token 效率和任务完成率上有显著改进,实际综合成本可能不升反降。
定价与规格
GPT-5.5 API 提供多个推理档位,不同档位对应不同的 compute 预算和成本:
| 档位 | 输入价格 | 输出价格 | 特点 |
|---|---|---|---|
| medium | $2.5/MTok | $15/MTok | 低延迟,日常任务 |
| high | $5/MTok | $30/MTok | 默认档位,平衡智能与速度 |
| xhigh | 更高 | 更高 | 最复杂任务 |
值得注意的是,GPT-5.5 在 ChatGPT 端已于 4 月 23 日向所有付费用户推送,API 端仅晚一天上线,速度明显快于此前版本的节奏。
Token 效率是关键变量
OpenAI 在发布公告中反复提到 GPT-5.5 “very token efficient”,这意味着同样的任务可能需要更少的 token 就能完成。如果实际调用中 token 消耗减少 30%-50%,即使单价翻倍,综合成本反而可能下降。
这一策略与 Anthropic Claude 系列的做法类似——模型发布初期 compute 开销较大,后续通过优化逐步降低实际成本。
Artificial Analysis 实测数据
第三方评测机构 Artificial Analysis 在 4 月 25 日发布了基于其 Index 的跑分成本数据:
- GPT-5.5 (xhigh):$3,357
- GPT-5.5 (high):$2,159
- GPT-5.5 (medium):$1,199
- GPT-5.4 (xhigh):$2,851
- Claude Opus 4.7:$4,811
在高配档位下,GPT-5.5 的评测总成本比 GPT-5.4 高出约 18%,但明显低于 Claude Opus 4.7。如果考虑 token 效率因素,GPT-5.5 (medium) 档位甚至可能在实际业务场景中提供与 GPT-5.4 相近的成本表现。
对开发者的建议
对于正在使用 GPT-5.4 的开发者,建议:
- 先跑基准测试:用实际工作负载在 medium 和 high 档位分别测试 token 消耗量和输出质量,再决定是否升级
- 关注 fine-tuning 路线:如果 GPT-5.5 的 medium 档位已经够用,可能比 GPT-5.4 的 high 档位更划算
- 不要急于全面迁移:新模型上线初期可能存在不稳定性,建议先在非关键路径试用
GPT-5.5 的定位是”real work and powering agents”——它不是一个纯粹追求跑分的模型,而是面向复杂工作流和 Agent 场景设计的。对于需要高任务完成率的场景,升级的理由比较充分。