人工智能专题：国际人工智能安全报告-英文版_前沿科技

创始人

2025-02-11 02:00:17

0次

今天分享的是：人工智能专题：国际人工智能安全报告-英文版

报告共计：298页

这是首份《国际人工智能安全报告》，96位国际人工智能专家参与撰写。报告聚焦通用人工智能，探讨其能力、风险及风险管理技术，旨在为政策制定提供科学依据，助力国际社会更好地理解和应对人工智能风险。

1. 通用人工智能的能力

- 发展方式：基于深度学习，通过数据收集与预处理、预训练、微调、系统集成、部署和部署后监测等阶段开发。自中期报告发布后，多步推理能力因微调技术得到提升。

- 当前能力：能完成如辅助编程、生成图像等多种任务，但在执行有用的机器人任务、始终避免错误陈述等方面仍存在不足。自中期报告发布后，科学推理和编程测试表现显著提高。

- 未来能力：未来能力发展速度不确定。开发者正推进科学、工程和“智能体”能力的发展，且通用人工智能在软硬件开发中应用日益广泛。

2. 风险

- 恶意使用风险：包括通过虚假内容伤害个人、操纵舆论、网络攻击、生物和化学攻击等。通用人工智能使恶意行为更易实施，自中期报告发布后，其在恶意使用相关领域的能力有所增强。

- 故障风险：存在可靠性问题，如产生幻觉、推理失败等；存在偏见，对不同群体产生不公平影响；可能出现失控情况，专家对其发生可能性看法不一。自中期报告发布后，对偏见和失控风险有了新的认识。

- 系统性风险：涉及劳动力市场、全球研发差距、市场集中与单点故障、环境、隐私、版权侵权等方面的风险。自中期报告发布后，在劳动力市场影响、隐私和版权方面出现了新的情况和担忧。

- 开放权重模型的影响：开放权重模型利于研究创新，但也存在被恶意使用和传播模型缺陷的风险。目前，评估其风险应考虑边际风险。

3. 风险管理的技术方法

- 风险管理概述：风险管理面临挑战，需采用“系统安全”方法和“深度防御”策略。目前存在风险识别和评估困难、难以确定责任和激励有效行动等问题。

- 通用挑战：技术上，人工智能体可能增加风险，使用场景广泛、模型内部运作难以理解等问题增加了安全保障难度；社会层面，技术发展迅速使治理难以跟上，竞争压力可能导致开发者忽视风险，责任难以确定等。

- 风险识别和评估：虽有多种技术用于风险识别和评估，但现有方法存在局限性，全面评估需要综合多种方法、大量资源和更好的信息获取途径。目前缺乏明确标准和严格评估，政策制定者面临挑战。

- 风险缓解和监测：训练更可靠的模型有一定进展，但现有方法无法完全防止不安全行为；监测和干预可预防故障和恶意使用，但现有工具易被规避；有多种保护隐私的方法，但许多方法因人工智能系统的计算要求而无法应用。

以下为报告节选内容