核心结论
DeepSeek V4 Pro 的限时 75% 折扣将在 2026 年 5 月 5 日 15:59 UTC(北京时间 5 月 6 日凌晨)正式结束。折扣到期后,API 价格将立即恢复至原价,涨幅达 4 倍。
对于已经在 Claude Code、OpenClaw、OpenCode 等工具中配置 DeepSeek V4 Pro 作为推理引擎的用户,这意味着月度 API 成本将瞬间膨胀。如果你依赖 1M 上下文窗口处理大批量任务,建议今天之内完成成本评估和预算调整。
价格对比
| 项目 | 促销价(至 5 月 5 日) | 原价(5 月 6 日起) | 涨幅 |
|---|---|---|---|
| 输入(缓存命中) | $0.109/百万 token | $0.435/百万 token | 4x |
| 输入(未命中) | $0.218/百万 token | $0.87/百万 token | 4x |
| 输出 | $0.435/百万 token | $1.74/百万 token | 4x |
| 输出(高优) | $0.87/百万 token | $3.48/百万 token | 4x |
对你的实际影响
场景 1:AI 编程工具用户
如果你在 Claude Code 或 OpenClaw 中设置了 deepseek-v4-pro[1m] 作为默认模型:
- 处理一个 50 万 token 的代码库分析任务,成本从约 $0.22 涨到 $0.87
- 如果你的 agent 每小时执行 10 次这样的任务,日成本从 $5.28 涨到 $20.88
场景 2:批量数据处理
使用 V4 Pro 的 1M 上下文做文档摘要、数据抽取:
- 每天处理 100 份 500K token 文档,月成本从 ~$327 涨到 ~$1,308
场景 3:个人实验/学习
如果只是偶尔调用做测试,影响有限。单次调用的绝对金额仍然很低,只是相对之前的「地板价」回归了正常水平。
应对策略
立即行动(5 月 5 日前):
- 检查你的 API 用量面板:确认当前消耗速率,预估涨价后的月度成本
- 批量任务前置:把本月剩余的大批量处理任务提前到 5 月 5 日前执行
- 调整 rate limit:如果用的是固定预算的 prepay 账户,适当降低并发以延长配额
中长期策略:
- 缓存优化:DeepSeek 的缓存命中价格仅为未命中的 1/4,确保重复上下文使用缓存键
- 模型降级:非核心场景切换到 DeepSeek-V4-Flash 或其他更便宜的开源模型
- 混合策略:关键推理用 V4 Pro,简单任务用 Flash 或本地部署的小模型
- 关注替代品:Qwen3.6-35B-A3B(仅激活 3B 参数)、MiniMax M3 等近期开源模型也在追赶性能
背景:为什么 DeepSeek 用促销策略
DeepSeek V4 Pro 在 4 月 24 日发布时,就以 75% OFF 的限时折扣迅速吸引了大量开发者和企业接入。这种「先低价获客、后恢复定价」的策略在 AI API 市场并不罕见——Anthropic 和 OpenAI 在新模型上线时也常采用类似的早期优惠。
关键区别在于,DeepSeek V4 Pro 凭借 1.6 万亿参数和 1M 上下文窗口,在促销期间确实建立了相当规模的用户习惯。当 5 月 6 日价格恢复后,有多少用户会留下、有多少会迁移,将是观察 AI 模型市场忠诚度的一个有趣指标。
同时进行的融资动态
值得注意的另一条消息:DeepSeek 目前正在进行新一轮融资。据透露,其 270 人研究团队在过去一年中仅有 10 人离职,人才留存率极高。上一轮训练成本约数亿美元,而下一代模型的训练成本预估将达到 ~25 亿美元(与 GPT-5.5 的训练成本量级相当)。
这意味着 DeepSeek 需要在模型质量和商业收入之间找到平衡——促销结束后的定价恢复,可能正是为下一轮大规模训练储备资金的一部分。