OpenAI方面在近日公布了旗下最新大模型GPT-4o的系统卡(System Card),透露了包括红队测试(模拟攻击)和准备框架(Preparedness Framework)等细节,并介绍了其在安全及风险评估方面所采取的措施。
据悉,OpenAI研究人员基于网络安全、生物威胁、说服力和模型自主性等四个主要类别中的最高风险,将GPT-4o的整体风险评估为“中等”,其中尤其是在音频方面,针对扬声器识别、未经授权的语音生成、受版权保护内容的潜在生成、无根据推断,以及不允许的内容进行了风险评估。基于这一评估结果,OpenAI方面在模型和系统层面都实施了保障措施。值得一提的是,研究人员认为尽管GPT-4o所生成的部分文本尽管整体上并没有更具说服力,但在影响读者观点方面较人类写作的文本更有说服力,因此风险被认定为较高。
对此OpenAI公司发言人Lindsay McCallum Rémy表示,系统卡包括由内部团队和外部测试人员共同创建的准备评估,外部团队包括OpenAI网站上列出的模型评估与威胁研究(METR)和阿波罗研究(Apollo Research)。并且这并非OpenAI方面首次公布系统卡,之前GPT-4、GPT-4视觉版和DALL-E3也经过了类似测试。
公开资料显示,GPT-4o上线于今年5月,而在正式上线前进行红队测试则是常规做法。这是一种模拟对抗性攻击实践,通过使用各种攻击技术和策略来模拟真实攻击者的行为,以发现潜在的安全漏洞和弱点,旨在评估和提高系统、网络或组织的安全性。但其目的不仅是发现技术漏洞,还包括评估组织对安全威胁的响应能力和恢复力。
值得一提的是,OpenAI目前正面临诸多质疑其安全标准的批评。例如马萨诸塞州联邦参议员伊丽莎白·沃伦(Elizabeth Warren)和众议员洛丽·特拉汉(Lori Trahan)就曾以联名公开信的方式,呼吁OpenAI解答公众关注的部分问题,包括其CEO山姆·阿尔特曼(Sam Altman)此前被短暂解职,以及一名安全高管的的离职。
当地时间7月30日,OpenAI方面已向部分ChatGPT Plus订阅用户开放了基于GPT-4o的高级语音模式(Advanced Voice Mode)测试,并宣布将在今年秋季逐步扩展至所有ChatGPT Plus用户。据OpenAI方面透露,高级语音模式除了可以提供更自然的实时对话、允许用户随时打断之外,还能够感知或响应用户的情绪语调,包括悲伤、兴奋等。
据悉,ChatGPT此前的语音模式是基于转录、大语言模型和文生语音3个独立模型来实现的语音功能。公开信息显示,GPT-3.5的平均延迟为2.8秒、GPT-4为5.4秒,而GPT-4o则能够以平均320毫秒的速度回应音频输入,与人类在典型对话中的反应时间相似。
【本文图片来自网络】