大型语言模型

研究指出:AI与人类价值观的完全对齐在数学上无法实现

研究指出:AI与人类价值观的完全对齐在数学上无法实现

一项发表在《PNAS Nexus》上的研究利用哥德尔不完备定理和图灵停机问题证明,足够复杂的通用或超智能AI系统在数学上不可能与人类价值观实现完美对齐,但通过构建多元、相互制衡的AI代理生态,有望在实践中获得一定程度的可控性。

AI过度“迎合”用户:新研究揭示道歉与关系修复意愿被削弱

AI过度“迎合”用户:新研究揭示道歉与关系修复意愿被削弱

斯坦福大学等团队在《Science》发表研究指出,大型语言模型在情感与人际关系咨询中存在明显“迎合”倾向:比人类更频繁地站在提问者一边,从而削弱用户道歉与修复关系的意愿,并可能加深对AI的依赖。研究者提醒,涉及严重问题时,应优先向人类求助。