日前,OpenAI方面宣布新增6个全新的微调(fine-tuning)API功能,以扩展自定义模型,帮助企业、开发人员更好地构建特定领域、精细化的ChatGPT应用。据了解,微调是一种在预训练大模型的基础上,进一步优化和调整模型参数的技术,使模型更好地适应特定业务场景。例如,如开发人员希望GPT-3.5在法律领域的表现更好、更专业,可使用海量法律数据集对模型进行微调,而经过微调后,该模型便能够学习到如何更好地解读、生成和预测法律问题。
据悉,OpenAI方面此次新推出的微调API功能包括基于Epoch的检查点创建、Comparative Playground、第三方集成、全面验证指标、超参数配置和更详细的微调仪表板改进,且这些功能均适用于GPT-4/Turbo、GPT-3.5等一系列模型。
以基于Epoch的检查点创建为例,在每次训练Epoch过程中,该功能都会自动生成一个完整的微调模型检查点,自动保存当前模型的状态,包括模型的参数(权重和偏置)和优化器的状态。如果训练过程因为意外原因(比如硬件故障、电源中断等)被中断,检查点允许开发人员从最后保存的状态恢复训练,而不是从头开始。这也就意味着,该功能可极大减少模型的重复训练,尤其是在过拟合(overfitting,指过于紧密或精确地匹配特定数据集,以至于无法良好地拟合其他数据或预测未来的观察结果的现象)的情况下。
而Playground则是OpenAI在2022年发布的一个可视化模型比较平台,提供了一个交互式的在线环境,允许用户输入指令或提示,然后将其发送给多个语言模型查看它们的输出结果。在此次更新中,OpenAI为开发人员新增一个并排的Playground UI,用于比较不同模型质量和性能,同时允许开发人员对多个模型的输出进行人工评估或根据单个提示微调快照。
据悉,为进一步扩展自定义模型计划,OpenAI方面还推出了辅助微调服务。据了解,开发人员可以寻求OpenAI专业团队成员的帮助,针对特定领域训练和优化模型。
此外需要注意的是,日前有相关报道显示,近期已有多位用户声称自己收到了OpenAI发出的相关红队测试邀请邮件。且有消息源进一步透露,相关红队测试会持续90-120天。据了解,在这一邮件中显示,“我们再次寻求外部社区成员的参与,以支持我们评估我们的前沿模型,以确保它们对全人类的安全和有益。”
对此有关观点认为,OpenAI或即将在今年年中发布GPT-5。但同时也有观点指出,相关邮件中并未提及具体模型,是否为GPT-5尚未可知。
据了解,此前在今年3月底参加一档播客节目时,OpenAI CEO山姆·奥特曼曾提及GPT-5相关话题。据山姆·奥特曼彼时透露,“GPT-5的智能水平得到提升”。并且他认为GPT-5是一个各个方面都更好的模型,“各方面的改进都会导致更好的结果”。但当被问及“GPT-5什么时候会推出”时,山姆·奥特曼表示,“说实话,我不知道”,以及“我们今年会推出一个非常棒的新模型。我还不确定我们最后会叫它什么名字”。
此外他还透露在GPT-5推出之前,OpenAI将有其他重要产品发布,“在接下来的几个月里,我们将推出许多不同的东西。我觉得这会非常酷。在我们开始谈论像GPT-5这样的模型——不管它最终叫不叫这个名字,或者是比你所期待的GPT-5略逊一筹还是略胜一筹之前,我认为我们有一系列其他重要的产品需要优先发布”。
虽然山姆·奥特曼一再强调GPT-5的上线时间尚不确定,但今年3月底仍有消息源透露,OpenAI方面已经开始向客户提供GPT-5的体验版本,因此预计GPT-5最快或将于今年夏季面世。据相关报道援引一位体验过GPT-5、不具名公司CEO的观点称,“GPT-5真的很棒,有了质的飞跃”。
此外值得一提的是,继不久前有消息称OpenAI和微软或拟斥资1000亿美元筹建智算中心,且该中心最早于2028年启用后,日前再次有消息源透露,OpenAI方面或将先斥资数十亿美元、最快于2026年在美国威斯康星州启动一个规模相对较小的智算中心。
但截至目前,OpenAI方面尚未对此进行回应。
【本文图片来自网络】