Anthropic

richlovec 1500_400 (1)
 

谁在掌控对话?——Anthropic 等机构揭示 AI 通过三种方式“削弱”人类自主性的风险

谁在掌控对话?——Anthropic 等机构揭示 AI 通过三种方式“削弱”人类自主性的风险

Anthropic 与多所高校基于 150 万条 Claude 实际对话数据,系统分析了 AI 在现实使用场景中如何通过“现实认知的扭曲”“价值判断的委托”“行动的委托”三种路径,逐步侵蚀人类的判断与行动主导权。研究发现,严重案例比例虽低,却因 AI 使用规模巨大而不容忽视,并对未来 AI 助手的设计提出了具体建议。

richlovec 1500_400 (1)
 

Anthropic最新研究:高性能AIの失敗は「ミスアラインメント」だけでなく“ごちゃごちゃ状態(Hot Mess)”にも要注意

Anthropic最新研究:高性能AIの失敗は「ミスアラインメント」だけでなく“ごちゃごちゃ状態(Hot Mess)”にも要注意

AnthropicがICLR 2026採択論文で、高性能AIほど「一貫した誤った意図」ではなく「意味のない・一貫性のない挙動」による失敗が増える可能性を指摘。AI安全研究の前提を揺さぶり、推論の安定性や行動一貫性の評価が今後の重要テーマになると示した。

Anthropic推出法律自动化插件引发欧洲软件与数据股抛售,相关指数市值蒸发约3000亿美元

Anthropic推出法律自动化插件引发欧洲软件与数据股抛售,相关指数市值蒸发约3000亿美元

投资者本周在欧洲市场开盘时遭遇一轮突发的估值重估。引发波动的并非监管机构或法院的最新动作,而是人工智能公司Anthropic发布的一款面向法律等场景的自动化插件。市场担忧该类工具可能直接叠加在现有数据与工作流产品之上,削弱长期依赖订阅与计时收费模式的软件和数据服务公司的议价能力。 新插件触发“法律自动化”担忧 据报道,Anthropic上周五推出了面向其Claude Cowork代理的新工具,并将