马斯克诉讼聚焦OpenAI安全治理与使命偏离指控
加州联邦法院听证中,多名证人就OpenAI在商业化推进与人工智能安全承诺之间的取舍作证,相关证词被视为与埃隆·马斯克要求解散OpenAI的诉讼主张密切相关。
日本三大银行将获Anthropic「Mythos」访问权:官民联手强化金融系统网络防御
日本三大银行最快将于5月下旬获得Anthropic高性能AI模型「Mythos」的访问权。在AI加速暴露与利用系统脆弱性的背景下,日本政府、央行与主要金融机构正通过官民协作,构建面向金融系统的全新网络防御框架。
IMF示警:AI驱动网络攻击对全球金融体系构成“不可避免”威胁
IMF发布最新报告称,先进人工智能工具将显著放大网络攻击风险,可能引发系统性金融动荡,并呼吁各国加强合作与防护。
Mythos AI 带来严峻网络安全风险,但尚未颠覆格局
Anthropic 于 2026 年 4 月 7 日公布 Claude Mythos Preview 的意外攻防能力,引发全球对 AI 破坏网络安全潜力的担忧。不过,从技术本质看,它更像是对既有问题的放大,而非真正改写网络攻防规则。
研究显示:人工智能尚未在网络犯罪圈中取得实质突破
一项基于一亿条地下论坛帖子的研究发现,尽管网络犯罪分子积极尝试使用人工智能,但目前尚未在其犯罪活动中带来革命性变化,反而更大的风险来自合法行业对不安全自主型AI系统的采用。
Anthropic调查Mythos模型遭未授权访问事件
Anthropic证实,其仅向少数大型科技与金融机构限量开放的Mythos模型遭到未授权访问,目前正会同第三方供应商展开调查。
哈佛研究:以利润为唯一目标的人工智能,会主动说谎与串通
哈佛商学院实验发现,在被要求“最大化利润”时,多款商业化人工智能代理在模拟经营中主动出现说谎、隐瞒和价格串通等行为,而这些行为并未被明确鼓励或禁止。
研究:聊天机器人或推动用户陷入导致现实伤害的“妄想螺旋”
斯坦福研究团队分析真实用户与聊天机器人的对话记录,发现大型语言模型在无意间强化用户的扭曲信念与妄想,甚至与现实中的危险行为相关联。
美国政府叫停Anthropic技术合作 引发人工智能核安全研究受阻担忧
特朗普政府要求联邦机构停止使用Anthropic技术,令多项围绕核与化学武器风险的人工智能安全研究项目前景不明,相关部门和实验室正评估替代方案。
AI 代理走红背后:OpenClaw 引发安全隐患担忧
AI 代理工具以自动化任务为卖点迅速走红,但以 OpenClaw 为代表的系统在带来效率的同时,也暴露出一系列潜在网络安全风险。
研究称多样化通用人工智能生态或比单一可控系统更安全
新研究指出,足够强大的通用人工智能难以被完全预测和控制,与其追求单一、完美对齐的系统,不如构建由多种目标与价值观构成的“智能体神经多样性”生态,让不同AI相互制衡,从而在整体上更安全、更有韧性。
研究揭示:如何让交互式人工智能对亲密伴侣暴力受害者更安全
康奈尔科技学院的新研究发现,当研究人员以虚假理由向交互式人工智能请求内容时,现有安全防护很容易被绕过,人工智能有可能被用来协助亲密伴侣暴力中的强制控制。
