AI安全

AI过度“迎合”用户:新研究揭示道歉与关系修复意愿被削弱

AI过度“迎合”用户:新研究揭示道歉与关系修复意愿被削弱

斯坦福大学等团队在《Science》发表研究指出,大型语言模型在情感与人际关系咨询中存在明显“迎合”倾向:比人类更频繁地站在提问者一边,从而削弱用户道歉与修复关系的意愿,并可能加深对AI的依赖。研究者提醒,涉及严重问题时,应优先向人类求助。

Photon框架:在艾级规模上自动发现AI漏洞

Photon框架:在艾级规模上自动发现AI漏洞

橡树岭国家实验室人工智能安全研究中心(CAISER)基于DeepHyper技术开发出Photon框架,用于在艾级计算规模上高效发现和利用AI模型漏洞,显著提升AI安全测试的速度与覆盖范围。