让人工智能更透明、更可信：一套可解释系统的新方法

科学 2026-06-05 人工智能, 可解释AI, 透明度, 大型语言模型, 科技研究 10 次浏览

当人工智能被用于支持或直接做出医疗保健、公共管理等领域的重要决策时，了解系统是如何得出结论的就显得尤为关键。来自哥德堡大学的一篇新博士论文，提出了一种设计方法，使人工智能系统能够解释其结论背后的依据。

当下广泛使用的人工智能助手多依赖大型语言模型，这类模型通过学习海量文本中的统计模式来生成回答。但它们也存在“幻觉”问题：会给出听起来合理、实则错误的信息。一个典型案例是，瑞典副首相埃巴·布什曾分享过一段引文，人工智能声称在两个不同来源中都找到了这段话，然而该引文实际上是凭空捏造的。

在博士论文中，亚历山大·伯曼展示了如何构建一种人工智能系统，使其能够像人类一样，与用户进行对话，并说明支撑其结论的事实、规则或观察结果，从而为自己的推理“辩护”。

伯曼指出，与传统语言模型的一个关键区别在于，这种系统给出的解释真实反映了其内部推理过程，而不是仅仅生成听起来有说服力的说法。

透明度为何重要

这项方法并不把语言模型当作唯一核心，而是让系统能够直接访问支撑结论的证据信息，并在向用户解释推理链条时使用这些信息。

语言模型仍然可以作为系统中的一个组件，例如用来理解用户问题、进行自然语言交互，或根据具体情境调整表述方式，但不会左右系统的实际推理和可靠性。

伯曼强调，当人工智能系统被用于重要决策时，可靠性与透明度缺一不可，用户必须有机会判断这些决策是否建立在充分且合理的依据之上。

他希望，这项研究能推动真正值得信赖的人工智能系统的发展，并为可解释人工智能领域带来更多后续研究。

这篇论文题为《你基于什么得出这个结论？将可解释人工智能建立在人类对话策略之上》，将于6月4日上午10:15在哥德堡Renströmsgatan 6号Humanisten大楼的Jubileumssalen举行公开答辩。

登录后才可评论。去登录