《国际AI安全报告》第二版关键更新发布--先锋科技

后台-系统设置-扩展变量-手机广告位-内容正文顶部

蒙特利尔2025年11月26日美通社－－《国际AI安全报告》（International AI Safety Report）第二版关键更新现已发布，及时更新了通用AI的风险管理与技术缓和措施。

该报告由图灵奖得主、计算机科学家Yoshua Bengio主持，汇集了百余位国际专家的参与，并获得包括欧盟、经合组织和联合国在内的30多个国家和国际组织的支持。

鉴于该领域发展速度过快，单一年度报告已无法及时反映进展，因此推出“关键更新”系列，以更短、更聚焦的形式呈现关键动态。本次更新延续了首版关键更新，首版已于2025年10月15日发布。这些更新确保决策者能够获得最新的文献综述，为循证决策提供依据。

第二版关键更新涵盖了提升可靠性与防范滥用的技术方法概述，以及风险管理领域新兴的制度化方法。其核心重点包括：

在训练模型抵御恶意攻击方面虽有所进展，但仍存在不足。 尽管AI模型及系统抵御攻击的能力有所提升，但技术娴熟的黑客仍能在约50％的案例中仅用10次尝试即可突破防护，并通过向训练数据中注入少至250条恶意文档来投毒并破坏模型。
开源鸿沟正在缩小。 开放权重模型如今与行业领先产品的差距已不足一年，虽然这有助于提升技术普及度，但同时也使预防故障和滥用的难度加大。
行业在安全方面的承诺有所增加，但其成效仍不明确。 尽管2025年采用风险管理框架的AI企业数量增加一倍有余，但其实际效果仍存在不确定性。

《报告》主编、蒙特利尔大学（Université de Montréal）终身教授、LawZero科学总监兼Mila － Quebec AI Institute科学顾问Yoshua Bengio表示：

“在持续关注AI能力与风险动态的同时，我们必须同步规划清晰的风险管理路径，确保采取恰当有效的风险管控措施与技术缓和方案。本次关键更新概述了这些领域的最新进展，同时指出了仍然存在的不足之处与尚待把握的机遇。我们的目标是持续向全球决策者提供有关AI发展的及时更新，而第二份《国际AI安全报告》计划于2026年初发布，并将在印度举办的AI影响力峰会之前推出。”

关于

《国际AI安全报告》是对先进AI系统能力及相关风险证据的综合性汇编分析。该报告旨在为全球决策者提供证据基础，从而为知情决策提供支持。该报告由100多名独立专家组成的多元团队撰写，并获得专家咨询委员会的支持。该委员会由来自30多个国家及国际组织（包括欧盟、经合组织和联合国）的提名代表组成。该报告认可AI所具备的巨大潜在效益，但其重点在于识别风险并评估缓和策略，以确保AI能够安全地开发和使用，进而造福全人类。该报告由英国政府委托编写，其秘书处设于英国AI安全研究所。

联系方式：Mila Medias（medias＠mila.quebec）；DSIT媒体垂询（press＠dsit.gov.uk）