日前,OpenAI方面发布新一代大模型产品GPT-5.3-Codex,并表示这是其迄今最强的智能编程模型。据官方介绍,GPT-5.3-Codex在GPT‑5.2-Codex的前沿编码性能基础上,融合了GPT‑5.2的推理与专业知识能力,同时运行速度提升25%,能够承担涉及研究、工具使用和复杂执行的长期任务。
据了解,GPT-5.3-Codex在多项基准测试中的表现较上一代实现显著提升。例如在SWE-bench Pro(公开版)测试中,GPT-5.3-Codex得分56.8%,超越前代的56.4%;在Terminal-Bench 2.0测试中,GPT-5.3-Codex得分77.3%,超越前代的64.0%;在OSWorld-Verified智能体计算机操作基准测试中得分64.7%,超了越前代的38.2%。

OpenAI方面强调,GPT-5.3-Codex是其首个能够自我构建的模型。据悉,OpenAI使用了GPT-5.3-Codex的早期版本来调试该模型自身的训练过程、管理部署基础设施,并诊断测试结果和评估情况。
对此OpenAI首席执行官Sam Altman表示,“我非常喜欢用这个模型来开发,它带来的进步感受,远远超过基准测试所显示的幅度……看着我们用GPT-5.3-Codex来开发GPT-5.3-Codex,从而把发布速度提升到这么快,真的令人震撼,这毫无疑问预示着未来的发展方向。”
在安全层面,据OpenAI方面透露,GPT-5.3-Codex是其首个在“准备度框架”下被归类为在网络安全相关任务上具备“高能力”的模型,同时也是首个被直接训练用于识别软件漏洞的模型。OpenAI方面强调,“尽管我们尚未发现它可以端到端自动化网络攻击的确凿证据,但我们采取了审慎策略,部署了迄今为止最全面的网络安全防护体系”。
据了解,目前GPT-5.3-Codex已全面向ChatGPT付费用户开放,涵盖Plus、Team及Enterprise等订阅计划,相关用户可通过Codex应用、命令行工具(CLI)、IDE 扩展插件及网页端立即访问。
此外,日前OpenAI还同步推出AI Agent平台OpenAI Frontier,旨在助力企业整合分散的系统与数据,实现AI Agent的一站式构建、部署与管理。
据了解,通过打通企业内部孤立的应用、工单工具与数据仓库,OpenAI Frontier可为AI Agent提供统一的企业业务上下文。而且OpenAI Frontier不仅兼容OpenAI自研的AI Agent,还支持企业自行开发的AI Agent,以及来自谷歌、微软和Anthropic等第三方的AI Agent。
对此OpenAI 应用业务首席执行官Fidji Simo表示,“推出OpenAI Frontier,是因为我们意识到自己无法独自打造所有东西。我们将与生态伙伴携手共建,也欣然接受企业未来会需要众多不同合作伙伴的现实”。
据悉,OpenAI Frontier将先面向少量客户上线,其中包括惠普、Uber、State Farm、Intuit、Thermo Fisher等。
【本文图片来自网络】
