重要！刚刚，GPT-5.6 正式发布，史上最强但被自己坑惨了 - 星辉官方地址

根据最新消息显示，就在刚刚，GPT-5.6 系列正式发布，不过，它并没有直接全面开放，而是以「有限预览」的方式先行试水。

横向对比其它模型，Claude Mythos 5 为 84.3%，Claude Fable 5 为 83.4%，Claude Opus 4.8 为 78.9%，Gemini 3.1 Pro Preview 为 70.7%。

可用性方面，GPT-5.6 目前仍处于有限预览阶段。

基于这些结果，OpenAI 判断 GPT-5.6 Sol 尚未跨过 Preparedness Framework 中的网络安全关键风险阈值。

但现实是，OpenAI 仍选择接受这一安排，理由是希望争取更广泛开放，同时与美国政府共同制定一套可复制的模型发布流程。

性能最强，但戏份却给了 AI 安全

这种踩刹车的判断显然是为了避免重走「Mythos」的老路。

OpenAI 表示，模型将先通过 API 和 Codex 向一部分可信合作伙伴开放，随后再逐步扩展到 ChatGPT、Codex 和更广泛的 API 用户。

Sol（太阳）是旗舰模型，也是 OpenAI 口中目前最强的模型； Terra（地球/大地）是面向日常工作的平衡型模型，性能可以与 GPT-5.5 竞争，同时价格便宜一半； Luna（月亮）主打速度和低成本，是 GPT-5.6 系列中最便宜的模型。

作为 OpenAI 最强的一代，GPT-5.6 一口气端出三款型号，名字起得颇有诗意：

OpenAI 称，Sol 在 Terminal-Bench 2.1 上刷新了表现。Terminal-Bench 2.1 测试的是命令行工作流，任务要求模型具备规划、迭代和工具协调能力。

▲🔗 https://openai.com/index/previewing-gpt-5-6-sol/

两周前，Anthropic 停用了其最强模型之一 Fable 5，因为美国政府要求该公司限制美国境内外外国公民使用相关模型，理由是国家安全。而在 GPT-5.6 的发布流程中，第一批使用用户同样不完全由 OpenAI 自己决定。

同时，OpenAI 也强调，自己相信前沿模型应该尽可能广泛地开放，并计划在未来几周内，让 GPT-5.6 Sol、Terra 和 Luna 进入更普遍的可用状态。

一方面，OpenAI 要证明 Sol 在网络安全任务上确实强了众多；另一方面，它也要说明 Sol 还没有达到必须极端限制的风险级别。更讽刺的是，这种压力很大程度上来自 OpenAI 自己参与塑造的 AI 行业炒作叙事。

GPT-5.6 深夜突袭，能力全系霸榜

换句话说，GPT-5.6 的「有限预览」并不只是产品灰度发布，更是一套安全验证流程。OpenAI 需要在能力、风险与开放之间，找到一个可控的平衡点。

Sol Ultra 的成绩，也对应 GPT-5.6 的核心功能。

生物方向上，GPT-5.6 Sol 的提升体现在 GeneBench v1 上。这个评测主要面向长周期基因组学和定量生物分析任务。OpenAI 称，Sol 相比 GPT-5.5 取得了更强结果，而且使用的输出 tokens 更少。

同时，OpenAI 还提到 ExploitGym——一个由 UC Berkeley 联合多家前沿实验室打造的评测体系，用于衡量模型在安全任务中的能力。随着推理能力提升，Sol、Terra、Luna 在这一领域都有明显进步。

GPT-5.6 的发布说明中，安全罕见地占据了较大篇幅。

当然，想要用上还需要一些时日，OpenAI 宣布 GPT-5.6 Sol 将在 7 月登陆 Cerebras，最高速度可达每秒 750 tokens。这个版本初期同样只面向部分客户开放，后续会随着容量扩展逐步放开。

为了避免重蹈覆辙，OpenAI 在自动化红队测试上投入了超过 70 万 A100 等效 GPU 小时，重点寻找通用 jailbreak（越狱），并辅以专家人工测试。OpenAI 还建立快速响应流程，对新漏洞进行复现、评估与修复，并纳入持续评测体系。

作为 OpenAI 迄今最强模型。GPT-5.6 Sol 的能力展示，主要集中在编程、生物信息学和网络安全三个方向。

与此同时，OpenAI 也承认，基准测试无法覆盖所有现实用法。没有任何评测可以代表所有产品配置、多步骤攻击和真实工作流。模型或许被接入其他工具，也可能被放进更复杂的攻击链条里。正是这种不确定性，让 GPT-5.6 的发布方式变得格外谨慎。

不过，OpenAI 对这部分表述明显踩了刹车。

这三类场景有一个共同特征：

同时，GPT-5.6 引入了更可预测的 prompt caching 机制，支持显式 cache breakpoints，并提供至少 30 分钟缓存生命周期。缓存写入按未缓存输入价格的 1.25 倍计费，读取则享受 90% 折扣。

模型层面，系统被训练为拒绝违规网络安全请求，即便用户尝试伪装或绕过。生成阶段引入实时分类器，对高风险内容进行检测与拦截，必要时交由更强模型复核。账号层面则结合跨对话行为与风险信号，识别持续性滥用。

彭博社则报道称，GPT-5.6 首批开放对象约为 20 家合作伙伴，其中一个入口可能是亚马逊的 Bedrock 平台。

OpenAI 在官方博客中披露，在发布前已向美国政府展示 GPT-5.6 的能力与发布计划。根据美国政府要求，模型将以有限预览形式上线，仅向少数可信合作伙伴开放，并且这些合作伙伴的信息已与政府共享。

前沿模型发布节奏，进入新周期

基准测试成绩显示，GPT-5.6 Sol Ultra 在 Terminal-Bench 2.1 上得分 91.9%，GPT-5.6 Sol 得分 88.8%。作为对照，GPT-5.5 为 88.0%，GPT-5.6 Terra 为 82.5%，GPT-5.6 Luna 为 84.3%。

从这命名方式来看，奥特曼私底下没少学习 Anthropic 营销的精髓。而借着 GPT-5.6 的发布，OpenAI 也顺手把命名体系重新梳理了一遍：

这一点对科研场景尤为关键。生物信息学、基因组学和定量生物分析，经常需要模型持续分析数据、解释结果、选择方法、比较假设，并在多轮操作中保持上下文一致。模型能不能完成这类任务很核心，能不能用更低 tokens 成本完成长链条分析同样重要。

对 OpenAI 来说，GPT-5.6 既是一次旗舰模型预览，也是一次政策试探。OpenAI 需要证明 Sol 足够强，也需要证明安全体系足够严密，还要在美国政府审查和商业开放之间找到可执行路径。

一方面，max 级别的推理强度让模型可以投入更多时间进行深度推理；另一方面，新增的 Ultra 模式会调度多个子 Agent，把复杂任务拆分处理，再统一汇总结果。

在 ExploitBench 上，GPT-5.6 Sol 的表现接近 Mythos Preview，但只使用了大约三分之一的输出 tokens。

在真实开发场景里，模型经常需要理解项目结构、读取文件、修改代码、运行命令、分析报错、继续修改。一个复杂任务通常无法靠一次回答完成。Ultra 模式的方向，是让多个子 Agent 分别处理不同环节，再把结果汇总起来，从而提升复杂任务的完成效率。

这套机制被称为分层安全栈，涵盖模型拒答、实时检测、账号审查、差异化访问与持续测试。多层协同用于应对复杂滥用，同时尽量减少对正常工作的干扰。面向企业客户，OpenAI 还提出了隐私保护检测、自主安全控制以及风险分级访问等方案，试图在安全与数据保护之间找到平衡点。

OpenAI 称，Sol 是其迄今最强的网络安全模型，能够推进长周期安全任务的性能和效率边界，包括漏洞调查和 exploitation 相关任务。

按每百万 tokens 计费，Sol 输入 5 美元、输出 30 美元；Terra 输入 2.5 美元、输出 15 美元；Luna 输入 1 美元、输出 6 美元。

网络安全则是 GPT-5.6 Sol 最敏感的能力方向。

数字指出代际，Sol、Terra、Luna 对应不同能力层级，便于区分智能水平、速度与成本。产品定位上，Sol 面向高难复杂任务，Terra 覆盖日常工作流，Luna 主打低成本调用。换句话说，GPT-5.6 不只是一次能力升级，也是 OpenAI 对模型产品线的一次重新分层。

过去，新模型发布主要是公司产品节奏问题。现在，一旦模型在编程、网络安全、生物和代理式工作流上跨过新的能力区间，发布节奏就可能被纳入安全和出口控制讨论。

《华盛顿邮报》的报道提到，美国联邦政府将审核哪些公司可以访问 OpenAI 的最新技术。且目前只有获得美国政府批准的公司可以访问新模型，个人用户没有申请通道。

复杂、长链条、强依赖上下文。模型需要在任务中持续规划、推理、调用工具、修正错误，并不断推进流程。OpenAI 把这种能力称为 agentic capabilities——让模型更像一个能独立执行任务的 agent。

官方强调，Sol 更擅长发现和修复漏洞，还不能稳定完成端到端攻击。在涉及 Chromium 和 Firefox 的评估中，Sol 可以识别 bug 和程序缺陷，也就是漏洞利用的基础组件，但在测试条件下没有自主生成可运行的完整攻击链。

▲System Card 🔗：https://deploymentsafety.openai.com/gpt-5-6-preview/introduction

在编程场景中，GPT-5.6 Sol 已经不再停留在代码补全，而是深入到命令行环境中的复杂操作。

对此，OpenAI 的态度显然是有些模棱两可。OpenAI 在博客中表示，不指出美国政府参与模型访问流程应当成为长期默认机制，因为这会让最好的工具远离用户、开发者、企业、网络防御者和全球合作伙伴。

OpenAI 为 Sol、Terra、Luna 配置了分级防护体系，能力越强，防护越严，目标是在压制攻击性用途的同时保留代码审查、漏洞研究等合法场景。

这一变化背后，是前沿 AI 模型逐渐被纳入国家安全框架。

如果 Sol 能在更少输出 tokens 下取得更强结果，意味着它在专业科研工作流中有更好的成本效率。对实验室、企业研发团队和生物医药场景来说，tokens 消耗直接影响调用成本，也影响模型能否进入大规模工作流。

如此复杂的发布流程，某种程度上也「剧透」了前沿 AI 未来的魔幻走向：当模型能力逼近关键阈值，使用资格与使用方式，将成为比性能更为关注的事项。

此事一出，立即引发了社会各界的广泛讨论和关注。