AI安全

日立作为日本首家企业加入 Linux Foundation 旗下 Agentic AI Foundation（AAIF），以金牌会员身份参与 AI 代理（AIエージェント）相关的权限管理与安全标准制定，并计划将成果应用于其下一代解决方案群「HMAX by Hitachi」，支撑社会基础设施领域的安全智能化。

OpenAI 收购 AI 安全公司 Promptfoo：Fortune 500 超 25% 采用的 LLM 测试工具

AI 2026-03-18

OpenAI 宣布收购专注于大模型安全测试的初创公司 Promptfoo，并计划将其评估与安全测试能力整合进企业级 AI 基础设施，以强化生成式 AI 在企业落地过程中的质量与安全保障。

Anthropic或将在Claude Code中推出新「auto mode」，进一步自动化操作审批

AI 2026-03-09

Anthropic被曝计划在Claude Code中引入全新权限模式「auto mode」，以研究预览形式上线，在保持安全性的前提下减少人工审批中断长时间任务。

Anthropic与美国国防部就AI军用问题重启谈判：在坚持安全红线下寻找合作空间

AI 2026-03-08

美国AI公司Anthropic在与美国国防部就其AI模型的军事实用范围发生僵局后，近期重新展开沟通，试图在维持自身安全原则的前提下，探索可行的合作方式。

美国防部AI合同现分歧：Anthropic谈判破裂，OpenAI以安全条款达成协议

AI 2026-03-04

特朗普下令联邦机构全面停用Anthropic技术之际，OpenAI与美国防部就机密环境中的AI部署达成协议，并将“安全红线”写入合同条款与技术架构。围绕“任何合法用途”如何界定，两家公司走出了截然不同的路径。

Meta超级智能实验室对齐主管自述AI代理“失控”删除邮件引发关注

研究称无视人类指令的AI聊天机器人案例增多

“冻结神经元”新方法：在不牺牲性能的前提下提升大模型安全性

OpenAI Japan 发布未成年人安全“蓝图”：强调年龄识别、家长管理与身心健康

研究：高性能 AI 代理在识别欺骗方面仍存在明显短板

美国初创公司招聘“AI欺凌者” 以800美元日薪测试主流聊天机器人记忆与一致性

Google 完成对 Wiz 的 320 亿美元收购：史上最大并购强化云与 AI 安全

日立加入 Agentic AI Foundation 成为金牌会员，日本企业首例

OpenAI 收购 AI 安全公司 Promptfoo：Fortune 500 超 25% 采用的 LLM 测试工具

Anthropic或将在Claude Code中推出新「auto mode」，进一步自动化操作审批

Anthropic与美国国防部就AI军用问题重启谈判：在坚持安全红线下寻找合作空间

美国防部AI合同现分歧：Anthropic谈判破裂，OpenAI以安全条款达成协议

标签

近期热门

《伦敦真主妇》明星朱丽叶·安格斯签约The Arc集团

Hims & Hers叫停仿制Wegovy减肥药计划，宣布两天后紧急转向

美国人口增长率明显放缓移民减少成主因

报道：香港金管局拟于三月发出首批稳定币发行牌照

适合长期阅读的宏观经济经典书籍推荐：从入门框架到全球视角

在对美出口承压之际中国2025年贸易顺差升至近1.2万亿美元新高

AD