2023 WAIC聚焦大模型时代AI安全：“产学研用”界共同发起AIGC可信倡议

首页 > 热点 > > 内容

2023 WAIC聚焦大模型时代AI安全：“产学研用”界共同发起AIGC可信倡议

发表时间：2023-07-07 17:39:47 来源：封面新闻

(相关资料图)

7月7日，2023世界人工智能大会（WAIC）“聚焦·大模型时代AIGC新浪潮—可信AI”论坛举行，蚂蚁集团联合清华大学发布AI安全检测平台“蚁鉴2.0”。蚁鉴2.0可实现用生成式AI能力检测生成式AI模型，可识别数据安全、内容安全、科技伦理三大类的数百种风险，覆盖表格、文本、图像等多种数据和任务类型，是业内首个实现产业级应用的全数据类型AI安全检测平台。据了解，该产品还入选了本届大会的“镇馆之宝”。

AIGC安全成为当前人工智能研究发展的重要议题。中国科学院院士何积丰发表《可信人工智能展望》主题演讲。他认为，“不能再将人工智能视为简单的技术工作，而是成为整个组织的变革引擎。可信人工智能要致力于保障数据安全可信、系统行为可追责、算法模型可解释、网络环境可信、法律伦理可信等问题。”

在该论坛上，蚂蚁集团同时宣布，“蚁鉴2.0”全面开放，面向全球开发者免费提供AIGC安全性、AI可解释性、AI鲁棒性三项检测工具，可服务于数字金融、教育、文化、医疗、电商等领域的大规模复杂业务场景。

据了解，“蚁鉴2.0”的两项硬核能力，一是实现了用生成式能力检测生成式模型。检测标准覆盖内容安全、数据安全、伦理安全三大类，可对大模型生成式内容完成包含个人隐私、意识形态、违法犯罪、偏见与歧视等数百个维度的风险对抗检测，并会生成检测报告，帮助大模型更加有针对性地持续优化。

蚂蚁集团大安全事业群技术部总裁李俊奎表示，“生成式大模型是一种‘深黑盒’技术，‘蚁鉴2.0’通过智能博弈对抗技术，模拟黑产以及自动化生成海量测试集，可实现「生成式机器人」对「AIGC生成式模型」的诱导式检测计算，很像一个24小时不眠不休的‘安全黑客’在找茬大模型，从而找到大模型存在的弱点和安全问题所在。这种AI对AI的评测，也是教学相长。好比生成式考官考核生成式运动员，在对抗中双方能力互相提升，进一步提高整个行业的AI安全水位。”

另一项硬核能力是，“蚁鉴2.0”融入了可解释性检测工具。综合AI技术和专家先验知识，通过可视化、逻辑推理、因果推断等技术，从完整性、准确性、稳定性等7个维度及20余项评估指标，对AI系统的解释质量量化分析，帮助用户更清晰验证与优化可解释方案。

据了解，“蚁鉴2.0”集成了蚂蚁近10年可信AI实践、1000余项可信AI专利，支持零编码测评。开发者通过API接口，将AI模型接入蚁鉴，就可以一键识别和挖掘模型漏洞。

蚂蚁集团认为，人工智能的深度应用，不仅对数据、算法、算力提出了更高要求，也对安全、隐私、伦理提出更多挑战。在确保数据安全和隐私保护、健全人工智能伦理与安全的前提下，才能让AI技术真正地释放应用价值。

此次论坛上，中国信通院、上海人工智能实验室、武汉大学、蚂蚁集团等多家单位共同发起的《AIGC可信倡议》。该倡议得到数十家单位参与，围绕人工智能可能引发的经济、安全、隐私和数据治理等问题，提出构建AIGC可信发展的全球治理合作框架，采用安全可信的数据资源、技术框架、计算方法和软件平台等全面提升AIGC可信工程化能力，最大限度确保生成式AI安全、透明、可释。

标签：

2023 WAIC聚焦大模型时代AI安全：“产学研用”界共同发起AIGC可信倡议

2023 WAIC聚焦大模型时代AI安全：“产学研用”界共同发起AIGC可信倡议

华硕巨齿鲨RTX 3060 Ti显卡供电接口已换，支持16pin电源接口

2男2女路边夜宵，一女生情难自禁献舞，网友：她为什么有个小尾巴

澧县：交警进企业宣讲 交通安全记心间

涉及247辆 宝马召回部分进口7系汽车

李玟离世第2天，两个继女同时注销账号，疑似拒绝参加李玟的葬礼

学生信息泄露不只在人大，网上最低1元就能买到200条

“海洋之门”宣布：暂停所有勘探和商业运营！

可叹，可惜，这些TOP100男子选手，无法征战2023年温网（完）

合金投资（000633）：日K线呈现-“曙光初现”形态 后市看多（07-07）

嘉祥县卧龙山街道开展农业机械上门送检活动

文庙街道站前社区开展“心心向党 筑梦启航”活动

广德 旅游

港股地产股下挫 天誉置业跌超5%

桂林临桂区：移民新村奏出和美“交响曲”

新科学校教师与家长因爱而聚，为爱而行

夏日如何养脾胃？

王府井上半年净利润预计大幅增长

我国数据库市场规模超400亿元

皖维高新：7月6日融资买入341.4万元，融资融券余额7.33亿元

快乐班级主题绘画活动方案(通用10篇)

天气

内分泌失调怎么调理（从这五方面入手）

长沙火车南站“行走的思政课”开课 助力暑运高峰

华晨中国有望派特别息 股价逆市大升

好友称李玟不愿和老公离婚殉情自杀，男方闻讯回港见最后一面

段诗

在借贷合同纠纷中保证人应该怎样承担责任？

曝《GTA6》地图会随着更新不断变大！也会改变很多

当农业生产遇到极端天气 如何做好田间管理？

2023 WAIC聚焦大模型时代AI安全：“产学研用”界共同发起AIGC可信倡议

华硕巨齿鲨RTX 3060 Ti显卡供电接口已换，支持16pin电源接口

2男2女路边夜宵，一女生情难自禁献舞，网友：她为什么有个小尾巴

澧县：交警进企业宣讲 交通安全记心间

涉及247辆 宝马召回部分进口7系汽车

广西靖西市两地调整为中风险地区

苏州市多地调整为中风险地区

云南2月14日新增无症状感染者6例

实体书店为什么接二连三遭遇危机？生存之道在哪

卜卦、占星、看手相…… 为什么有的年轻人总想算一卦

一言不合放火烧家 任性女子被判刑

新疆阿克苏地区库车市发生3.4级地震 震源深度7千米

应急管理部：1月全国接报生产安全事故死亡超1100人

江苏省省长：苏州市要把疫情防控作为头等大事、第一要务

广西新增确诊病例降至1例 百色市有序解除管控

澧县：交警进企业宣讲交通安全记心间

涉及247辆宝马召回部分进口7系汽车

合金投资（000633）：日K线呈现-“曙光初现”形态后市看多（07-07）

文庙街道站前社区开展“心心向党筑梦启航”活动

广德旅游

港股地产股下挫天誉置业跌超5%

长沙火车南站“行走的思政课”开课助力暑运高峰

华晨中国有望派特别息股价逆市大升

当农业生产遇到极端天气如何做好田间管理？

澧县：交警进企业宣讲交通安全记心间

涉及247辆宝马召回部分进口7系汽车

一言不合放火烧家任性女子被判刑

新疆阿克苏地区库车市发生3.4级地震震源深度7千米

广西新增确诊病例降至1例百色市有序解除管控