刁钻提问测试6款主流聊天机器人:均出现“幻觉”并给出自信回答
多款主流聊天机器人在面对特定、细节化问题时被观察到出现“幻觉”现象:在缺乏事实依据的情况下生成看似权威的答案,并以较高确定性表述。根据一组针对六款产品的测试与公开研究/报道案例,这些系统分别在法律、科学、政治与历史等领域编造或误述信息,包括虚构法院判例、错误描述天文里程碑、捏造政治人物引语、生成不存在的地方官员履历,以及混淆重大历史事件的关键细节。 ChatGPT:被指虚构最高法院判例细节 在一次
多款主流聊天机器人在面对特定、细节化问题时被观察到出现“幻觉”现象:在缺乏事实依据的情况下生成看似权威的答案,并以较高确定性表述。根据一组针对六款产品的测试与公开研究/报道案例,这些系统分别在法律、科学、政治与历史等领域编造或误述信息,包括虚构法院判例、错误描述天文里程碑、捏造政治人物引语、生成不存在的地方官员履历,以及混淆重大历史事件的关键细节。 ChatGPT:被指虚构最高法院判例细节 在一次