化身“安全黑客”找茬大模型,这个AI平台将亮相人工智能大会


(相关资料图)

“AI安全检测平台蚁鉴2.0”亮相世博展览馆H2馆。本文图片均由澎湃新闻记者 俞凯 摄

7月5日,澎湃新闻(www.thepaper.cn)记者前往世博展览馆的2023世界人工智能大会探营时看到,全新升级的“AI安全检测平台蚁鉴2.0”亮相世博展览馆H2馆。

现场工作人员在演示“AI安全检测平台蚁鉴2.0”进行评测的过程。

在去年WAIC上,蚂蚁推出“蚁鉴AI安全检测平台”,面向全球开发者免费提供AI模型的评测工具。今年世界人工智能大会,蚂蚁集团带来的“蚁鉴AI安全检测平台2.0”,是业内首个产业级支持文本、图像等全数据类型的AI安全检测平台,将其推向通用化和标准化。该平台新增推出AIGC安全性、AI可解释性两项评测能力,针对性护航大模型和AIGC时代的数字化安全,不仅可以支持数字金融,还可以支持教育、文化、医疗、电商等AI、AIGC应用突出的产业对AI安全性检测的需求。

“蚁鉴机器人”可通过智能对抗技术,自动生成海量测试集。

现场展示的装置模拟了蚁鉴2.0对AIGC安全性进行评测的过程,左边的“蚁鉴机器人”通过智能对抗技术,自动生成海量测试集,对右边的“AIGC生成式模型”进行交互诱导,每分钟可调用10余种不同难度系数的对抗手法,生成超过30个诱导问题。它很像一个24小时不眠不休的“安全黑客”在找茬大模型,同时比“安全黑客”更智能化的是,在诱导的同时,会对大模型的回答进行实时、自动化的检测计算,从近200个子类维度,找到大模型存在的弱点和安全问题所在,进行量化计算,最后生成大模型的安全体检报告。

评测后会生成大模型的安全体检报告。

“蚁鉴”应用沉淀的这一套标准,已经在国内乃至国际可信AI标准制定过程中发挥了重要的参考价值,目前已经支持内容安全、数据安全、科技伦理三大类的安全性检测,构建了一套“可靠、可控、可信、可用”的评测标准框架。

关键词:

来源:澎湃新闻
编辑:GY653

免责声明:本网站内容主要来自原创、合作媒体供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

  • 相关推荐

相关词