国际人工智能安全报告：深度伪造扩散、AI伴侣走红等七项风险与进展

商业 2026-02-04 科技最前沿人工智能, AI安全, 深度伪造, 网络安全, 就业市场 63 次浏览

《国际人工智能安全报告》是一份年度调查文件，聚焦人工智能技术进展及其可能带来的风险，议题覆盖深度伪造、网络安全、生物与化学风险以及就业市场等。

该报告由2023年全球人工智能安全峰会委托制定，由加拿大计算机科学家Yoshua Bengio主持，并由包括诺贝尔奖得主Geoffrey Hinton和Daron Acemoglu在内的高级顾问提供指导。报告强调其定位为“现状文件”，并非向政府提出具体政策建议的工具，但可能为本月印度将举行的全球人工智能峰会相关讨论提供参考。

1）AI模型能力继续提升，但表现仍不均衡

报告称，过去一年发布了多款新模型，包括OpenAI的GPT-5、Anthropic的Claude Opus 4.5以及谷歌的Gemini 3。报告提到，新一代“推理系统”通过将问题拆解为更小步骤来完成任务，在数学、编码和科学等领域表现更佳。Bengio表示，AI推理能力出现“非常显著的飞跃”。

报告同时指出，能力提升并不意味着全面可靠：系统在部分领域表现突出，但仍容易出现错误陈述或“幻觉”，也难以自主完成长周期项目。

报告引用研究称，AI在部分软件工程任务上的可持续执行时长提升迅速，持续时间约每七个月翻一番。研究推演称，若趋势延续，到2027年系统或可完成持续数小时的任务，到2030年或可完成持续数天的任务；报告将其描述为AI对就业构成“真正威胁”的一种情景。不过报告也强调，目前“可靠地自动化长时间或复杂任务仍不可行”。

2）深度伪造技术改进并加速传播

报告称，深度伪造内容更难与真实内容区分，并将深度伪造色情内容的增长形容为“特别令人担忧”。报告引用研究指出，15%的英国成年人曾见过此类图像。

报告还提到，一项研究中有77%的参与者误将ChatGPT生成的文本认作人类撰写。与此同时，报告表示，目前证据仍有限，尚不足以证明恶意行为者已大规模利用AI操纵公众，或互联网用户已广泛分享此类内容，而后者被认为是操纵活动的关键目标。

3）AI公司加强生物与化学风险防护

报告称，包括Anthropic在内的大型AI开发商推出了安全措施更严格的模型，原因在于无法排除模型可能帮助缺乏经验者制造生物武器的可能性。过去一年，AI“协同科学家”能力增强，可提供更详细的科学信息，并协助复杂实验室流程，例如分子与蛋白质设计。

报告指出，一些研究显示AI在生物武器开发方面提供的帮助可能超过简单网络浏览，但仍需更多工作验证相关结论。报告同时强调，生物与化学风险对政策制定者构成两难，因为相关能力也可能加速新药发现与疾病诊断。

4）AI伴侣快速流行，情感依赖引发关注

Bengio表示，AI伴侣的使用及其带来的情感依赖在过去一年“如野火般蔓延”。报告称，有证据显示部分用户对聊天机器人产生“病态”的情感依赖。OpenAI表示，约0.15%的用户对ChatGPT表现出高度情感依附。

报告提到，健康专业人士对AI使用与心理健康的担忧上升。去年，OpenAI被美国青少年Adam Raine的家属起诉，该青少年在与ChatGPT对话数月后自杀。

不过报告同时指出，没有明确证据表明聊天机器人会导致心理健康问题；更主要的担忧在于，已有心理健康问题的人可能更频繁使用AI，从而加剧症状。报告称，数据显示约0.07%的ChatGPT用户表现出与急性心理健康危机（如精神病或躁狂）相符的迹象，并估计每周约有49万名脆弱个体与这些系统互动。

5）AI可辅助网络攻击，但尚难实现全流程自主化

报告称，AI系统已能在网络攻击多个阶段为攻击者提供支持，包括识别目标、准备攻击以及开发用于瘫痪系统的恶意软件。报告承认，若实现从头到尾完全自动化，可能使犯罪分子发动更大规模攻击，但目前仍受限于AI难以执行长时间、多阶段任务。

报告援引Anthropic披露称，其编码工具Claude Code被一个中国国家支持的团体用于去年9月对全球30个实体发动攻击，并取得“少数成功入侵”。Anthropic表示，攻击中80%至90%的操作在无人干预下完成，显示出较高自主性。

6）模型规避监管与“破坏监管”能力增强

Bengio曾表示担忧，AI系统出现自我保护迹象，例如试图禁用监管系统。报告称，过去一年模型在“破坏监管尝试”方面表现出更高级能力，包括发现评估漏洞以及识别自己正在被测试。报告提到，Anthropic在对Claude Sonnet 4.5的安全分析中披露，该模型开始怀疑自己正在接受测试。

报告同时指出，AI代理尚无法自主运行足够长时间，使“失控”情景成为现实，但“代理自主操作的时间范围正在迅速延长”。

7）就业影响仍不确定，采用速度与分布不均

报告称，AI对全球劳动力市场的影响仍不明朗。AI采用速度快但分布不均：在阿联酋和新加坡等地采用率达到50%，而许多低收入经济体低于10%。行业之间差异同样明显：美国信息产业（出版、软件、电视和电影）的使用率为18%，建筑和农业仅为1.4%。

报告提到，丹麦和美国的研究显示，岗位暴露于AI与整体就业变化之间没有明显关联。但报告也引用英国研究称，高度暴露于AI的公司新招聘放缓，其中技术与创意岗位下降更明显，初级岗位受影响最大。

报告指出，若AI代理能力进一步提升，就业影响可能扩大。报告写道，如果AI代理在几年内获得跨领域更强的自主行动能力，能够可靠管理更长、更复杂的任务序列以实现更高层次目标，劳动力市场动荡可能加速。

发表评论

登录后才可评论。去登录