应对AI新安全挑战,首份智能体安全白皮书发布
创始人
2025-07-31 03:20:23
0

随着人工智能(AI)技术的不断进步,AI领域正从大模型时代迈向智能体时代,智能体的越权、过度代理等问题也带来了安全挑战。在29日闭幕的世界人工智能大会WAIC期间,上海人工智能实验室、信通院、蚂蚁、IIFAA联盟联合发布《终端智能体安全2025》白皮书。首次系统梳理了智能体(AI Agent)风险分类、如何发现风险、如何防御风险,并覆盖了单智能体设备、多智能体协同,以及AI终端生态的全面挑战,为终端智能体安全提供风险评估指南。

在AI大模型加速下沉的2025年,智能体正快速渗透进手机、眼镜、耳机、车机等各种终端设备,悄悄成为连接人、设备与环境的关键枢纽。生活、工业、医疗、教育等多个行业,正在被一批更“主动”、更“拟人化”的终端智能体重新定义交互方式。它们不再是传统意义上的智能终端,也不是完全云端运行的智能体,而是一种运行在“端侧”的智能体。

白皮书指出,随着模型越来越懂用户、操作越来越自动,终端智能体的风险边界也在拓展:不再只是“数据泄露”这么简单,而是向模型行为、身份伪造、环境感知误导,甚至算法伦理等深层问题蔓延。

中国信通院华东分院人工智能事业部主任常永波介绍,在AI智能体成为“下一代操作系统”的当下,对安全设施的梳理尤为必要。为了应对这些高度复杂、层层递进的安全风险,白皮书提出了三大防护路径:单智能体安全、多智能体可信互连、AI终端安全,希望作为一份全面且具针对性的、可参考的智能体安全指引。

白皮书首次提出终端智能体安全体系,在技术生态体系的支撑下,单智能体安全技术包括安全护栏、数据去毒、基座对齐和柔性管理,多智能体可信互连技术则包括可信数据流转、可信服务流转、可信身份认证和可信记忆共享,AI终端安全技术可信隐私沙箱、跨设备可信连接等,共同支撑AI/AR眼镜、智能手机助手、智能座驾等行业应用。

数据显示,超过70%的智能体从业者担忧AI幻觉与错误决策、数据泄露等问题,因为AI生成的内容往往包含事实错误,或者对指令产生误解,其中超半数受访者表示,所在企业尚未设立明确的智能体安全负责人。与白皮书发布同时,白皮书编制方之一蚂蚁集团大模型安全解决方案“蚁天鉴”宣布升级,新增智能体安全评测工具,具备智能体对齐、mcp安全扫描、智能体安全扫描及零信任防御等核心功能。据悉,“蚁天鉴”的智能体风险研判准确率达到96%以上,并可支持11个行业的智能体测试。

来源:北京日报客户端

记者:孙奇茹

相关内容

热门资讯

东风汽车集团申请阻燃柔性固态电... 金融界2025年1月31日消息,国家知识产权局信息显示,东风汽车集团股份有限公司申请一项名为“一种阻...
中端性能机大乱斗:加米耀酷真,... 近期,中端手机市场迎来了多款新品,包括一加Ace 5、REDMI K80、荣耀GT、真我Neo 7以...
无机房电梯楼层显示器异常解决指... 电梯 无机房电梯楼层显示器异常怎么办? 别急,本文将为您详细解答。首先,我们要了解无机房电梯楼层显示...
我市特步5G工厂入选国家5G工... 日前,工业和信息化部发布《关于2024年5G工厂名录的公示》,我市特步5G工厂入选国家5G工厂名录,...
卫星化学获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示卫星化学(002648)新获得一项实用新型专利授权,专利名为“...
自动驾驶+跟踪巡逻+现场抓捕 ... 近日,在浙江温州的闹市区,特警巡逻队带着一台球形机器人一起巡街,引来不少路人的关注。 球形“机器警察...
360智脑张向征:构建安全可信... 人工智能的加速发展,有力推动了社会的数智化转型;与此同时,带来的相关安全风险也日益凸显。近日,在北京...
原创 3... 一、iQOO 12 参考价格:2659元(12G+256G)。 性能强劲,游戏无忧 首先不得...
联想宣布旗下AIPC个人智能体... DoNews2月7日消息,近日,联想宣布个人智能体“小天”已接入DeepSeek,除了目前可以在联想...
2025年消脂设备产业数据报告 消脂仪是医学美容领域的医疗器械。 它使用激光和微波等设备根据其波长向真皮/皮下平面发射能量; 通过加...