GPT-6的进度条已经走到哪了?
OpenAI的下一代旗舰模型GPT-6已经完成了在Stargate数据中心的预训练,正式进入安全对齐阶段。按照OpenAI的发布节奏,这意味着正式版可能在未来数周到数月内面世。
与此同时,GPT-6的部分能力数据已经公开:
| 指标 | GPT-6 | GPT-4o | 提升幅度 |
|---|---|---|---|
| 数学推理 | 92.5% | ~75% | +17.5pp |
| 代码生成通过率 | 96.8% | ~85% | +11.8pp |
| 职业任务达到人类专家水平 | 83% | ~60% | +23pp |
| 参数规模 | 5-6万亿 | 1.8万亿 | ~3x |
Symphony架构:三合一超级应用
GPT-6不仅是模型升级,更是产品架构的重构。
OpenAI引入了 Symphony架构,将ChatGPT、Codex、Atlas三大产品整合到一个入口中。这意味着:
- 以前需要在三个工具之间切换
- 现在一个入口全搞定:对话、代码执行、物理世界感知
这不是简单的功能合并,而是底层能力的深度融合。Symphony架构让GPT-6可以理解用户的完整意图,在对话、编码、推理之间自由切换,而不需要用户手动指定”我现在要用Codex模式”。
定价信号:AI的天花板还远
GPT-6的API定价已经泄露:
- 输入:$2.5/百万Token
- 比GPT-4o贵了约10倍
这个定价策略传递了明确信号:OpenAI不打算打价格战,而是用能力溢价来定义高端市场。愿意为顶级AI能力付费的企业和个人,才是GPT-6的目标客户。
“AGI部署部”:OpenAI的内部信号
更值得关注的是OpenAI内部的一个变化:产品部门已经更名为”AGI部署部”。
不管你信不信AGI,反正OpenAI是All in了。这个更名不是公关动作,而是组织架构层面的战略调整——意味着OpenAI认为AGI已经从”研究目标”变成了”可部署的产品”。
与竞品的对标
GPT-6进入安全对齐阶段的时间点,正好赶上多个竞品的发布窗口:
| 模型 | 状态 | 对标GPT-6 |
|---|---|---|
| Claude Mythos Preview | 已发布 | Anthropic在5月的基准测试中仍保持领先 |
| GPT-5.5 | 已发布(Cyber + Ultra两个变体) | OpenAI的过渡型号 |
| Gemini 3.5 Pro | 预热中 | Google的回应 |
| Sonnet 4.8 | 即将发布 | Anthropic的中端产品 |
| DeepSeek V4 | 开源可用 | 成本仅1/3,能力差距缩小 |
| MiniMax M3 | 即将发布 | 国产模型的办公场景差异化 |
格局判断
GPT-6的意义不仅在于它本身的能力,更在于它定义的行业节奏:
- 参数竞赛尚未结束:5-6万亿参数意味着Scaling Law仍然有效,但边际收益在递减
- 安全对齐成为新瓶颈:模型越强,对齐越难。安全对齐阶段的耗时可能比预训练更长
- AGI部署从概念走向实操:OpenAI的组织调整表明,行业头部公司已经开始为AGI的规模化部署做准备
行动建议
- API用户:关注GPT-6的定价和API规格变化,$2.5/M Token的定价可能推动企业重新评估AI成本结构
- 开发者:研究Symphony架构的多模态能力整合,这可能是未来AI应用的标准模式
- 企业决策者:评估AGI部署对现有业务流程的影响,特别是在客服、研发、数据分析等高价值场景
GPT-6的安全对齐阶段是一个关键观察窗口——它将告诉我们,当模型能力接近人类专家水平时,AI安全到底有多难。