GPT-5.3-Codex 深度解析：重新定义 AI 辅助编程 | 小莫的博客园

小莫的博客园

小莫的博客园

记录一些可能有用的东西

OpenAI 正式发布了其迄今为止最强大的编程模型 —— GPT-5.3-Codex。这款模型不仅继承了 GPT-5.2-Codex 的卓越代码能力，还在推理速度、复杂任务执行以及实时互动方面实现了重大突破。

💻 核心技术突破

真正的“代理”能力：GPT-5.3-Codex 不再只是一个写代码的窗口，它具备了完整的计算机操作能力。它可以自主调试代码、管理部署、诊断测试结果，并像同事一样与开发者实时协作。
速度提升 25%：得益于 NVIDIA GB200 NVL72 系统的高效算力支持，模型的推理速度显著提升，让长时间运行的任务更具实用性。
首个“自我训练”模型：OpenAI 透露，Codex 团队在开发过程中大量使用了早期版本的 GPT-5.3-Codex 来协助调试和优化模型本身，实现了 AI 的自我加速进化。

📊 行业顶尖的评测数据

在多项关键基准测试中，GPT-5.3-Codex 刷新了纪录：

SWE-Bench Pro：在涵盖四种语言的软件工程评测中达到 56.8% 的准确率。
Terminal-Bench 2.0：终端操作技能评分高达 77.3%，远超同类竞争对手。
OSWorld：在真实桌面环境下的任务完成率显著提升，标志着其在通用计算机控制方面的进步。

🛠️ 互动与协作

GPT-5.3-Codex 引入了更强大的实时状态反馈。在任务执行过程中，它会不断同步关键决策，允许开发者在最终结果生成前介入引导。这种“边做边说”的互动模式极大提升了复杂项目的交付质量。

🔒 安全与防御

OpenAI 将其归类为“高能力”网络安全模型，并首次直接训练它识别软件漏洞。为了防止滥用，OpenAI 推出了 Trusted Access for Cyber 计划，专门支持良性的安全研究。

目前，GPT-5.3-Codex 已在 ChatGPT Plus 计划中上线，支持 App、CLI 和 IDE 扩展。

本作品采用知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议进行许可