北京时间2月28日凌晨,OpenAI方面正式发布新一代大模型GPT-4.5,并表示这是其迄今为止“规模最大、性能最强的聊天模型”。
据了解,相较于GPT-4,GPT-4.5在多个方面进行了优化。具体而言,GPT-4.5在预训练和后训练的扩展方面迈出了新的一步,通过进一步扩展无监督学习技术,该模型在理解模式、建立联系和生成创意方面取得了重大进步。
通过扩大计算资源和数据量、架构和优化方面的创新,以及在微软Azure AI超级计算机上进行训练,GPT-4.5拥有更广泛的知识和对世界更深入的理解,在众多方面减少了幻觉现象、并提高了可靠性。
早期测试显示,在与用户交互中GPT-4.5的表现更加自然,能更好地理解并响应用户的意图,并且“情商”更高。此外据OpenAI方面透露,GPT-4.5还表现出更强的审美直觉和创造力,在写作和设计辅助方面表现出色。而且在人类偏好(Human preference)测试中,更多人愿意选择GPT-4.5而非GPT-4o。
对此OpenAI CEO萨姆・奥尔特曼(Sam Altman)表示,“这是第一个让我感觉像是在和一位善于思考的人对话的模型,有好几次,我惊讶于从AI那里得到了非常好的建议”。
值得一提的是,GPT-4.5并非推理模型,萨姆・奥尔特曼此前曾透露,这将是OpenAI最后一个“非思维链模型”。据了解,相比OpenAI的推理模型,GPT‑4.5并未引入7个全新的前沿能力,并且在大多数准备度能力评估中,其表现低于o1、o3-mini模型。
同时OpenAI方面认为,推理会成为未来AI模型核心能力。对此该公司表示,“我们相信推理将成为未来模型的核心能力,而两种扩展方法——预训练和推理——将相辅相成。随着GPT-4.5等模型通过预训练变得更加智能和知识渊博,它们将成为推理和使用工具的代理的更强大的基础”。
此外需要注意的是,OpenAI方面透露,由于“GPU资源紧缺”,GPT-4.5将面向不同用户分阶段推出。对此萨姆・奥尔特曼表示,“我们一直在快速发展,但现在GPU不够用了……我们将在下周增加数万个GPU…… 这并不是我们理想的操作方式,但很难精确预测导致GPU短缺的增长波动”。
具体而言,目前ChatGPT Pro用户已经可以在ChatGPT官网、App中体验GPT‑4.5。ChatGPT Plus、ChatGPT Team、ChatGPT Enterprise和ChatGPT Edu用户则需等到下周,或更晚些时候才能获得使用权限。
开发者目前则可以在API中调用GPT-4.5,但该模型每百万个输入token为75美元、达到了GPT-4o的30倍,每百万个输出token 150美元、是GPT-4o的15倍。同时OpenAI方面指出,由于GPT‑4.5是一个非常大、且计算密集型的模型,这意味着它比GPT‑4o更昂贵,并且不能替代GPT‑4o,因此其正在评估是否长期在API中提供这一模型。
【本文图片来自网络】