OpenAI发布两款新模型,可实现“用图像思考”

日前,OpenAI方面发布全新推理模型o3和o4-mini,并表示这是其迄今为止最智能、功能最强大的模型,“代表着ChatGPT能力的一次重大飞跃”。OpenAI首席执行官Sam Altman透露,o3和o4-mini已接近、或达到天才水平。


据了解,o3和o4-mini不仅首次将图像融入思维链过程,实现“用图像思考”,还能自主调用工具,解决复杂编程和视觉任务的推理。对此OpenAI方面表示,“这是我们首次推出能够独立使用全部ChatGPT工具的推理模型——包括网页浏览、Python编程、图像理解和图像生成能力。这使得它们在解决复杂的多步骤问题时更加高效,并朝着自主执行任务的方向迈出了真正一步”。

OpenAI发布新模型o3和o4-mini,实现“用图像思考”

性能方面,根据OpenAI公布的相关数据显示,o3在Codeforces、SWE-bench、MMMU等基准测试中刷新SOTA,这意味着其在编程、数学、科学、视觉感知等领域都树立了新标杆。而在外部专家的评估中,o3在处理真实世界任务时严重错误率比o1降低20%,尤其是在编程、商业/咨询和创意构思等领域表现出色。


o4-mini则专为快速、经济高效的推理需求而优化,在数学、编程和视觉任务方面表现出色。其中以数学能力为例,o4-mini是AIME 2024和AIME 2025基准测试中表现最佳的模型。此外,o4-mini支持远超o3的使用额度,被OpenAI称为高并发场景最优选。


而在安全性方面,据悉OpenAI为o3和o4-mini重建了安全训练数据集,新增生物威胁、恶意软件生成和越狱攻击的拒绝提示。


目前,o3和o4-mini已通过Chat Completions API和Responses API向开发者开放。同时,ChatGPT Plus、ChatGPT Pro和ChatGPT Team的用户也可以使用o3、o4-mini。而ChatGPT企业和教育用户将在约一周后获得访问权限,免费用户可在提交查询前选择“思考”来尝试o4-mini。


值得一提的是,日前OpenAI方面透露,未来几周内将会推出o3-pro。据了解,这是o3的一个升级版本,将使用更多计算资源生成回答,但仅向ChatGPT Pro订阅用户开放。


此外需要注意的是,近期OpenAI方面宣布推出并开源AI代理Codex CLI。据悉,这是一款旨在与如o3等模型协同工作的AI代理,可帮助用户完成编程任务,并支持在端侧部署。


【本文图片来自网络】

踩(0)

最新文章

相关文章

大家都在看