大型语言模型

人工智能真的读懂文学了吗?研究团队给出新答案

人工智能真的读懂文学了吗?研究团队给出新答案

哥伦比亚工程学院研究团队设计了一套全新的、以伦理为基础的评估框架,专门测试大型语言模型在理解短篇小说等文学叙事上的真实能力。结果显示,即便是当前最先进的模型,在复杂叙事和潜台词分析上依然存在显著局限。

评估自主系统的伦理性

评估自主系统的伦理性

麻省理工学院研究人员开发了一种测试框架,能够识别人工智能决策支持系统在对待个人和社区时可能存在的不公平情况。

研究:让人工智能“装专家”或削弱其可靠性

研究:让人工智能“装专家”或削弱其可靠性

新研究发现,让大型语言模型扮演专家或安全监控等角色,虽能提升语气专业与安全性,却可能在部分任务上降低事实回忆与准确性。研究团队提出PRISM方法,在角色与非角色回答间进行智能路由,以兼顾安全与准确。

大型语言模型与创造力:AI 答案整体更趋同质化

大型语言模型与创造力:AI 答案整体更趋同质化

一项发表在《PNAS Nexus》上的研究发现,单个大型语言模型在创造力评分上可与人类相当甚至更高,但不同模型之间的输出高度相似,整体多样性明显低于人类。研究者指出,广泛依赖 LLM 进行创意工作,可能在无形中削弱人类思维的多样性。