日前,OpenAI方面正式发布全新GPT-4.1系列大模型,其中包括GPT-4.1、GPT-4.1 mini和GPT-4.1 nano。
据了解,GPT-4.1系列均拥有最高100万Token的上下文窗口、是GPT-4o的8倍,这也是OpenAI首次发布长窗口模型。同时,GPT-4.1系列在多模态处理、编码、指令跟随等核心能力上全面超越GPT-4o及GPT-4o mini,并且知识截止日期也已更新至2024年6月。
以GPT-4.1为例,在编码能力测试中,SWEBench评估将该模型置于Python代码库环境,让其探索代码库、编写代码和测试用例。结果显示,GPT-4.1的准确率达到54.6%,而GPT-4o为33%。在衡量指令遵循能力的MultiChallenge基准测试中,GPT-4.1得分为 38.3%,比GPT-4o提升了10.5%。在多模态长上下文理解基准测试Video-MME中,GPT 4.1对30到60分钟无字幕视频进行理解并回答多项选择题,取得72%的成绩,达到当前最佳水平。
在提升性能的同时,GPT-4.1的价格也比GPT-4o更具竞争力。该模型每100万token输入费用为2美元,每100万token输出费用为8美元,较GPT‑4o便宜26%。
而GPT-4.1 nano则是OpenAI的首个nano模型,其在MMLU测试中得分达80.1%,在GPQA测试中得分达50.3%,在Aider多语言编码测试中得分达9.8%。对此OpenAI方面表示,“对于需要低延迟的任务,GPT-4.1 nano 是我们目前速度最快、成本最低的模型……它是分类或自动完成等任务的理想选择”
需要注意的是,目前GPT‑4.1系列仅通过API方式向开发者开放,普通用户暂时无法通过ChatGPT体验。而所有开发者将可获得一周的免费,并且在这之后可以享受大幅折扣优惠。
此外值得一提的是,日前OpenAI方面还宣布,发布于今年2月的GPT-4.5模型将于今年7月14日停用。对此其表示,GPT‑4.5原本就是作为研究预览版推出的,目的是探索和实验一个大规模、计算密集型的大模型,“GPT-4.1在许多关键功能上提供了改进或类似的性能,并且成本和延迟更低”。
【本文图片来自网络】