当人工智能被用于支持或直接做出医疗保健、公共管理等领域的重要决策时,了解系统是如何得出结论的就显得尤为关键。来自哥德堡大学的一篇新博士论文,提出了一种设计方法,使人工智能系统能够解释其结论背后的依据。
当下广泛使用的人工智能助手多依赖大型语言模型,这类模型通过学习海量文本中的统计模式来生成回答。但它们也存在“幻觉”问题:会给出听起来合理、实则错误的信息。一个典型案例是,瑞典副首相埃巴·布什曾分享过一段引文,人工智能声称在两个不同来源中都找到了这段话,然而该引文实际上是凭空捏造的。
在博士论文中,亚历山大·伯曼展示了如何构建一种人工智能系统,使其能够像人类一样,与用户进行对话,并说明支撑其结论的事实、规则或观察结果,从而为自己的推理“辩护”。
伯曼指出,与传统语言模型的一个关键区别在于,这种系统给出的解释真实反映了其内部推理过程,而不是仅仅生成听起来有说服力的说法。
透明度为何重要
这项方法并不把语言模型当作唯一核心,而是让系统能够直接访问支撑结论的证据信息,并在向用户解释推理链条时使用这些信息。

语言模型仍然可以作为系统中的一个组件,例如用来理解用户问题、进行自然语言交互,或根据具体情境调整表述方式,但不会左右系统的实际推理和可靠性。
伯曼强调,当人工智能系统被用于重要决策时,可靠性与透明度缺一不可,用户必须有机会判断这些决策是否建立在充分且合理的依据之上。
他希望,这项研究能推动真正值得信赖的人工智能系统的发展,并为可解释人工智能领域带来更多后续研究。
这篇论文题为《你基于什么得出这个结论?将可解释人工智能建立在人类对话策略之上》,将于6月4日上午10:15在哥德堡Renströmsgatan 6号Humanisten大楼的Jubileumssalen举行公开答辩。
发表评论
登录后才可评论。
去登录
