在日前举行的2022世界人工智能大会-可信AI论坛上,中国信通院、清华大学、蚂蚁集团联合发布了业内首个面向工业场景全数据类型的AI安全检测平台“蚁鉴”,面向AI模型开发者提供从模型对抗测试到防御加固的一站式测评解决方案,并帮助开发者一键识别和挖掘模型漏洞,打造更安全可靠的AI产品。此前在今年8月,该平台还曾获评信通院“2022 年可信人工智能实践案例”标杆案例。
对此,清华大学副教授李琦表示,“人工智能算法的通用自动化检测是研究和解决人工智能安全问题的核心。此次推出的AI安全检测平台,首次全面解决了不同场景下AI算法的系统化和自动化评测,并提供了AI工业级应用的安全量化评价指标,有助于为人工智能算法在工业界的大规模应用提供安全保障”。
据了解,“蚁鉴”基于蚂蚁集团多年的风险对抗实践打造,集1000多件可信AI专利于一身,可以实现文本、图像、表格、序列等不同数据类型的自动化测试、量化评分和安全性增强,且其所搭载的技术能力已在蚂蚁集团的交易安全、核身安全、内容安全等多个场景,得到了有效的应用实践。
具体而言,“蚁鉴”内嵌了蚂蚁集团自研的AI安全计算引擎,将计算性能提升了数十倍,并内置了40余种国内外主流及自研的攻击算法模型,可通过模拟黑产及自动进化攻击手段,对AI模型进行“检测-防御-升级”,从而效发现AI模型漏洞,减少系统性风险。此外,该平台覆盖了对模型未知情况下的“随机噪声”、“迁移攻击”等攻击样本,更符合工业界应用的攻击评测基准。
据蚂蚁集团大安全技术部总裁李俊奎透露,“蚁鉴”还支持零编码测评,用户上传待测模型,选择攻击算法后,即可自动化评估AI安全风险,全面加固模型算法。目前该平台已开放AI模型鲁棒性测评,后续将持续增加模型可解释性、算法公平性、隐私保护等特性的检测服务。
公开资料显示,蚂蚁集团于2015年起投入可信AI技术研究,并于2016年全面启动AI智能风控防御战略。目前已拥有全球范围内数量最多的“AI安全可信关键技术”专利,形成了新一代智能风控体系IMAGE,并已在反欺诈、反洗钱、反盗用、企业联合风控、数据隐私保护等多场景落地。
【本文图片来自网络】