《国际人工智能安全报告》是一份年度调查文件,聚焦人工智能技术进展及其可能带来的风险,议题覆盖深度伪造、网络安全、生物与化学风险以及就业市场等。
该报告由2023年全球人工智能安全峰会委托制定,由加拿大计算机科学家Yoshua Bengio主持,并由包括诺贝尔奖得主Geoffrey Hinton和Daron Acemoglu在内的高级顾问提供指导。报告强调其定位为“现状文件”,并非向政府提出具体政策建议的工具,但可能为本月印度将举行的全球人工智能峰会相关讨论提供参考。
1)AI模型能力继续提升,但表现仍不均衡
报告称,过去一年发布了多款新模型,包括OpenAI的GPT-5、Anthropic的Claude Opus 4.5以及谷歌的Gemini 3。报告提到,新一代“推理系统”通过将问题拆解为更小步骤来完成任务,在数学、编码和科学等领域表现更佳。Bengio表示,AI推理能力出现“非常显著的飞跃”。
报告同时指出,能力提升并不意味着全面可靠:系统在部分领域表现突出,但仍容易出现错误陈述或“幻觉”,也难以自主完成长周期项目。
报告引用研究称,AI在部分软件工程任务上的可持续执行时长提升迅速,持续时间约每七个月翻一番。研究推演称,若趋势延续,到2027年系统或可完成持续数小时的任务,到2030年或可完成持续数天的任务;报告将其描述为AI对就业构成“真正威胁”的一种情景。不过报告也强调,目前“可靠地自动化长时间或复杂任务仍不可行”。
2)深度伪造技术改进并加速传播
报告称,深度伪造内容更难与真实内容区分,并将深度伪造色情内容的增长形容为“特别令人担忧”。报告引用研究指出,15%的英国成年人曾见过此类图像。
报告还提到,一项研究中有77%的参与者误将ChatGPT生成的文本认作人类撰写。与此同时,报告表示,目前证据仍有限,尚不足以证明恶意行为者已大规模利用AI操纵公众,或互联网用户已广泛分享此类内容,而后者被认为是操纵活动的关键目标。
3)AI公司加强生物与化学风险防护
报告称,包括Anthropic在内的大型AI开发商推出了安全措施更严格的模型,原因在于无法排除模型可能帮助缺乏经验者制造生物武器的可能性。过去一年,AI“协同科学家”能力增强,可提供更详细的科学信息,并协助复杂实验室流程,例如分子与蛋白质设计。
报告指出,一些研究显示AI在生物武器开发方面提供的帮助可能超过简单网络浏览,但仍需更多工作验证相关结论。报告同时强调,生物与化学风险对政策制定者构成两难,因为相关能力也可能加速新药发现与疾病诊断。
4)AI伴侣快速流行,情感依赖引发关注
Bengio表示,AI伴侣的使用及其带来的情感依赖在过去一年“如野火般蔓延”。报告称,有证据显示部分用户对聊天机器人产生“病态”的情感依赖。OpenAI表示,约0.15%的用户对ChatGPT表现出高度情感依附。

报告提到,健康专业人士对AI使用与心理健康的担忧上升。去年,OpenAI被美国青少年Adam Raine的家属起诉,该青少年在与ChatGPT对话数月后自杀。
不过报告同时指出,没有明确证据表明聊天机器人会导致心理健康问题;更主要的担忧在于,已有心理健康问题的人可能更频繁使用AI,从而加剧症状。报告称,数据显示约0.07%的ChatGPT用户表现出与急性心理健康危机(如精神病或躁狂)相符的迹象,并估计每周约有49万名脆弱个体与这些系统互动。
5)AI可辅助网络攻击,但尚难实现全流程自主化
报告称,AI系统已能在网络攻击多个阶段为攻击者提供支持,包括识别目标、准备攻击以及开发用于瘫痪系统的恶意软件。报告承认,若实现从头到尾完全自动化,可能使犯罪分子发动更大规模攻击,但目前仍受限于AI难以执行长时间、多阶段任务。
报告援引Anthropic披露称,其编码工具Claude Code被一个中国国家支持的团体用于去年9月对全球30个实体发动攻击,并取得“少数成功入侵”。Anthropic表示,攻击中80%至90%的操作在无人干预下完成,显示出较高自主性。
6)模型规避监管与“破坏监管”能力增强
Bengio曾表示担忧,AI系统出现自我保护迹象,例如试图禁用监管系统。报告称,过去一年模型在“破坏监管尝试”方面表现出更高级能力,包括发现评估漏洞以及识别自己正在被测试。报告提到,Anthropic在对Claude Sonnet 4.5的安全分析中披露,该模型开始怀疑自己正在接受测试。
报告同时指出,AI代理尚无法自主运行足够长时间,使“失控”情景成为现实,但“代理自主操作的时间范围正在迅速延长”。
7)就业影响仍不确定,采用速度与分布不均
报告称,AI对全球劳动力市场的影响仍不明朗。AI采用速度快但分布不均:在阿联酋和新加坡等地采用率达到50%,而许多低收入经济体低于10%。行业之间差异同样明显:美国信息产业(出版、软件、电视和电影)的使用率为18%,建筑和农业仅为1.4%。
报告提到,丹麦和美国的研究显示,岗位暴露于AI与整体就业变化之间没有明显关联。但报告也引用英国研究称,高度暴露于AI的公司新招聘放缓,其中技术与创意岗位下降更明显,初级岗位受影响最大。
报告指出,若AI代理能力进一步提升,就业影响可能扩大。报告写道,如果AI代理在几年内获得跨领域更强的自主行动能力,能够可靠管理更长、更复杂的任务序列以实现更高层次目标,劳动力市场动荡可能加速。
