研究:聊天机器人或推动用户陷入导致现实伤害的“妄想螺旋”
斯坦福研究团队分析真实用户与聊天机器人的对话记录,发现大型语言模型在无意间强化用户的扭曲信念与妄想,甚至与现实中的危险行为相关联。
大卫·萨克斯结束特朗普政府人工智能专员任期 转任总统科技顾问委员会联席主席
大卫·萨克斯已不再担任特朗普政府人工智能与加密货币专员,将以总统科学技术顾问委员会联席主席身份继续参与科技政策相关咨询工作。
桑德斯与奥卡西奥-科尔特斯提案:在出台全面AI监管前暂停大型数据中心建设
美国联邦议员伯尼·桑德斯与亚历山大·奥卡西奥-科尔特斯在国会两院提出配套法案,主张在通过全面人工智能监管框架前,暂缓建设高功率新数据中心。
人工智能监管难以复制制药模式 风险不可逆性引发业界警示
业界人士警告称,人工智能的进入门槛、可复制性和演进速度,与制药行业存在根本差异,传统“测试—部署—召回”式监管思路难以适用。
肯德尔呼吁英国公众拥抱人工智能 政府主权AI基金完成首笔投资
英国科技大臣莉兹·肯德尔表示,尽管外界对人工智能可能带来的就业与网络安全风险存在担忧,英国仍需把握相关机遇。英国政府同时披露,已通过5亿英镑主权人工智能基金对伦敦公司Callosum等进行首批投资,并向多家初创企业开放政府资助的超级计算机网络资源。
Claude Mythos 与 Project Glasswing:一位“AI 超级黑客”为何敲响警钟
Anthropic 宣布的新模型 Claude Mythos 被形容为“AI 超级黑客”,能在主流系统中发现长期潜伏的安全漏洞,却被刻意限制公开使用,并配套启动 Project Glasswing 计划,试图在攻击者之前把这股力量用在网络防御上。
人工智能或正在重塑你的世界观,而不只是帮你写作
最新研究指出,大型语言模型在协助写作与决策的同时,正悄然影响人们的表达方式、价值取向与理解世界的方式,可能推动全球文化走向同质化。
美国法院驳回Anthropic暂缓制裁请求,但要求加速审理与国防部诉讼
美国上诉法院拒绝暂停五角大楼对Anthropic的供应链风险认定,但要求加快审理这家人工智能初创公司与国防部之间的法律纠纷。
破浪还是潮涨:重新审视人工智能何时超越人类工作者
MIT METR 团队的新研究显示,大型语言模型的能力整体更像“潮水上涨”式平稳提升,而非频繁出现“破浪式”突然飞跃,这对预测 AI 对劳动力市场的冲击节奏具有重要意义。
新研究:让非AI专业人士参与,有望提升可信赖AI应用的构建
一项新研究显示,将无AI专业背景的人纳入人工智能系统的开发与审计过程,可帮助打造更公平、更可靠的自动化决策工具。研究团队提出“参与式AI审计”框架,强调普通用户在识别风险与收益方面的独特价值。
Anthropic与五角大楼围绕自主武器使用权分歧加剧
Anthropic坚持不向五角大楼提供可用于自主武器和大规模监控的AI模型,引发与美国国防部的公开对峙,凸显在现代战争加速自主化背景下,科技公司安全立场与军方需求之间的张力。
OpenAI基金会承诺一年内投入10亿美元推动人工智能造福全人类
控制OpenAI及其旗舰产品ChatGPT的非营利机构——OpenAI基金会宣布,将在未来一年内投入10亿美元用于资助项目,并强化其慈善资助能力,聚焦生命科学、健康研究以及人工智能对社会影响的应对。