人工智能安全

美国财长与美联储主席紧急约见银行高管：就Anthropic最新AI模型发出网络安全警告

AI 2026-04-15

美国财政部长与美联储主席本周在华盛顿紧急召集多家大型银行CEO，就Anthropic最新AI模型可能带来的金融系统网络安全风险进行闭门讨论。该模型具备高效发现软件漏洞和生成攻击代码的能力，被视为一把既能防御也能进攻的“双刃剑”。

联邦遗忘：在强化数据隐私与引入安全风险之间的微妙平衡

科学 2026-04-15

联邦遗忘被视为保护数据隐私的重要技术，但在提升“被遗忘权”的同时，也可能打开新的网络安全漏洞与国家安全隐患。

Anthropic新AI系统Mythos曝出数千个零日漏洞后，美国高官与银行巨头紧急磋商

科学 2026-04-14

美国最大银行高层与美联储主席和财政部长在华盛顿闭门会谈，重点讨论Anthropic新AI系统Claude Mythos在大规模挖掘零日漏洞后带来的金融与基础设施安全风险。

律师警示生成式人工智能卷入大规模伤亡案件风险快速上升

商业 2026-04-07 科技最前沿

多起正在诉讼或调查中的案件显示，生成式人工智能聊天机器人不仅与自杀事件相关，也被指在大规模伤亡策划中发挥作用。相关律师和研究机构称，技术发展速度已明显快于安全防护。

小型天线即可窃取AI模型蓝图：KAIST团队揭示新型侧信道威胁

科学 2026-04-06

KAIST联合多国研究团队展示了一种利用小型天线远程窃取AI模型结构的技术，可穿墙获取GPU电磁信号重建模型蓝图，并提出相应防御方案。

OpenAI收购AI安全初创公司Promptfoo 强化企业级代理安全能力

商业 2026-03-31 科技最前沿

OpenAI宣布收购成立于2024年的AI安全公司Promptfoo，并计划将其技术整合进面向企业的AI代理平台OpenAI Frontier，以提升自动化安全测试和风险监控能力。

研究揭示：少数关键神经网络权重同时驱动性能与隐私泄露

科学 2026-03-29

新研究发现，神经网络中仅有少量权重既是模型性能的核心，也构成隐私泄露的主要来源。基于这一发现，研究团队提出了一种在不显著牺牲性能的前提下强化隐私保护的新方法。

报道：Anthropic首席执行官指责OpenAI就五角大楼合同“撒谎”

商业 2026-03-25 科技最前沿

据《The Information》报道，因未就使用边界达成一致，Anthropic放弃与美国国防部的新合同，随后OpenAI与五角大楼签署协议，引发两家公司在AI安全与军方合作问题上的公开分歧。

Tumbler Ridge事件后：OpenAI的“安全承诺”指向的不是AI监管，而是用户监控

科学 2026-03-24

Tumbler Ridge枪击案后，OpenAI向加拿大政府作出一系列安全承诺，但这些举措更多是对用户的监控，而非对人工智能系统本身的监管。

英国研究：核危机模拟中，大模型频繁选择“核威慑”，几乎从不让步

AI 2026-03-23

英国伦敦国王学院通过核危机情景模拟，对多款前沿大模型的决策行为进行分析。结果显示，这些模型在展现出复杂战略推理能力的同时，也高度倾向于使用核威慑手段，且从未选择过“让步”或“投降”。

OpenAI披露与美国国防部合作协议更多细节

商业 2026-03-20 科技最前沿

OpenAI在与美国国防部达成合作后，围绕安全边界、部署架构及与同行差异等问题作出进一步说明。

电网“振动”预警：AI在两秒内识别电力网络攻击

科学 2026-03-18

研究人员提出一种结合图神经网络与Transformer的时空AI检测方法，可在不到两秒内识别针对电力供应网络的复杂网络攻击，准确率超过93%。