OpenAI 发布 GPT-5.3-Codex-Spark：首个实时编程模型

February 13, 2026

本文翻译自 Introducing GPT-5.3-Codex-Spark，原载于 Hacker News。

OpenAI 今天发布了 GPT-5.3-Codex-Spark 的研究预览版。这是 GPT-5.3-Codex 的精简版本，也是首个专为实时编程设计的模型。Codex-Spark 标志着 OpenAI 与 Cerebras 合作的首个里程碑——这一合作在今年一月公布。

Codex-Spark 针对超低延迟硬件进行了深度优化，能够提供每秒 1000+ tokens 的推理速度，同时在处理真实编程任务时保持出色的能力。对于开发者来说，这意味着近乎即时的响应体验。

双模式编程体验

OpenAI 最新的前沿模型在长时间运行任务方面表现出色——能够自主工作数小时、数天甚至数周。而 Codex-Spark 则专注于另一个维度：与 Codex 进行实时协作。

现在，Codex 同时支持两种工作模式：

发布时的关键参数：

需要注意的是，在需求高峰期，可能会出现访问限制或临时排队。

Codex-Spark 针对延迟敏感的交互场景进行了优化。你可以：

由于专注于速度，Codex-Spark 采用了轻量级的默认工作风格：

在评估 Agent 软件工程能力的两个基准测试中，Codex-Spark 展现了强劲的性能：

基准测试	表现
SWE-Bench Pro	强劲性能
Terminal-Bench 2.0	强劲性能

更重要的是，Codex-Spark 完成任务的时间仅为 GPT-5.3-Codex 的一小部分。

在训练 Codex-Spark 的过程中，OpenAI 团队意识到模型速度只是实时协作的一部分——还需要降低整个请求-响应管道的延迟。他们对推理框架进行了全面优化，这些改进将惠及所有模型：

核心改进：

性能提升：

WebSocket 路径目前已为 Codex-Spark 默认启用，很快将成为所有模型的默认配置。

Codex-Spark 运行在 Cerebras 的 Wafer Scale Engine 3 上——这是一款专为高速推理定制的 AI 加速器，为 Codex 提供了延迟优先的服务层级。

“让我们最兴奋的是与 OpenAI 和开发者社区合作，探索快速推理带来的可能性——新的交互模式、新的使用场景，以及根本不同的模型体验。这次预览仅仅是个开始。” — Sean Lie，Cerebras CTO 兼联合创始人

架构互补：

GPU 和 Cerebras 可以在单一工作负载中结合使用，以达到最佳性能。

Codex-Spark 正在向 ChatGPT Pro 用户逐步推出，支持：

API 访问目前仅面向少量设计合作伙伴开放，用于了解开发者如何将 Codex-Spark 集成到他们的产品中。未来几周将逐步扩大访问范围。

Codex-Spark 包含与主线模型相同的安全训练，包括网络安全相关训练。经过标准部署流程评估，该模型在网络安全或生物领域不具备达到高危能力阈值的可能性。

Codex-Spark 是迈向双模式 Codex 的第一步：

随着时间推移，这两种模式将逐渐融合——Codex 可以让你保持紧密的交互循环，同时在后台将长时间运行的任务委托给子 Agent，或者在需要广度和速度时并行分配任务给多个模型。

核心洞察： 随着模型能力的提升，交互速度成为明显的瓶颈。超快速推理收紧了这个循环，让 Codex 使用起来更加自然，也为任何将想法转化为可工作软件的人扩展了可能性。

对于国内开发者来说，这次发布最值得关注的是交互式 AI 编程的范式转变——从”提交-等待-接收”到”实时协作-即时反馈”。这可能预示着未来 IDE 集成的方向：AI 不再是后台的智能助手，而是与你并肩工作的实时配对编程伙伴。