OpenAI上线安全中心,定期公布安全评估结果

继此前因部分旗舰模型的安全测试流程过快以及未发布其他模型的技术报告,而受到外界质疑与批评后,当地时间5月14日,OpenAI宣布正式上线安全评估中心(Safety Evaluations Hub),用以公布旗下AI模型的安全性评估结果。根据OpenAI方面表示,该安全评估中心将用于持续发布模型相关指标,并计划在未来的重大模型更新后及时更新网页内容。


具体而言,在安全评估中心的网页中,用户可以看到OpenAI的AI模型在生成有害内容、越狱(绕过安全限制生成受限内容)、出现幻觉(hallucination)等各种测试中的评分表现。同时OpenAI方面承诺,随着时间的推移,将在安全评估中心网页中增加更多的评估项目。

OpenAI上线安全中心,将定期公布模型安全评估结果

对此OpenAI方面表示,“随着AI评估科学的不断发展,我们致力于分享我们在开发更具可扩展性的模型能力与安全评估方法方面的进展”,以及“通过在此分享部分安全评估结果,我们希望外界将更容易理解OpenAI系统的安全表现,也期望能够支持整个行业在透明度方面的共同努力”。


此外值得一提的是,继4月OpenAI发布新一代大模型GPT-4.1系列,其中包括GPT-4.1、GPT-4.1 mini和GPT-4.1 nano,但官方表示这一系列大模型仅通过API方式向开发者开放后。日前OpenAI方面宣布,应广大用户的要求,即日起将在ChatGPT中提供GPT-4.1。


同时日前有消息源透露,OpenAI方面或计划在AI聊天机器人ChatGPT中推出一项名为Record的全新功能,旨在提升在线会议的智能化体验。据称通过该功能,用户可以通过“拖动说话”(drag to talk)的方式让ChatGPT参与会议互动,并要求其对会议内容进行录音,以及将音频内容快速转为文本,形成详细的会议报告。


【本文图片来自网络】

踩(0)

最新文章

相关文章

大家都在看