画像の出典:GPTZero{target=”_blank”}
AI生成コンテンツの検出ツールを提供する GPTZero 于 2026 年 1 月 21 日发布分析结果称,在对 AI 研究顶级国际会议 NeurIPS 2025 的採択論文进行大规模检查后,确认发现了分布在 51 篇論文中的合计 100 处「ハルシネーション(幻覚引用)」。本次分析对象为 NeurIPS 2025 已被採択并在会议上发表的論文,其中 4,841 篇被纳入具体检查范围。
## 在 4,841 篇採択論文中,51 篇确认存在 100 处「幻覚引用」根据 GPTZero 的说明,此次所称的「幻覚引用」,是指論文参考文献列表中出现了并不存在或与事实不符的文献,但其书目信息(标题、作者、期刊、年份等)看起来十分「像真的」。
具体情形包括:
- 将真实存在的論文标题和作者名进行重新组合,形成并不存在的文献;
- 给出不存在的 DOI 或 URL;
- 标注的 arXiv ID 实际指向的是另一篇完全不同的論文;
- 整体格式、风格都像正规引用,但无法在任何公开数据库中找到对应记录。
GPTZero 表示,他们先通过专用工具「Hallucination Check」自动筛出无法在线匹配的引用条目,再由人工逐一核查,只有在确认确属「虚构或错误引用」后,才计入本次统计,以尽量避免误判。
## 将「vibe citing(雰囲気引用)」作为核心概念,同时提醒存在误检可能GPTZero 将这类由生成 AI 产出的、以真实文献为蓝本、但在作者、标题、刊物、年份等信息上被混合拼接而成的引用,定义为「vibe citing(雰囲気引用)」,并将其作为本次分析的核心概念。
所谓「雰囲気引用」,并非完全凭空捏造,而是生成模型在训练语料的「整体气质」基础上,生成出看似合理、却无法在现实世界中对应到具体文献的引用条目。这类引用往往格式规范、内容可信度高,如果不做交叉检索,很难被肉眼识别。
同时,GPTZero 也强调,「无法在线检索到」并不必然等同于「幻覚引用」。例如:

- 尚未公开的内部资料或技术报告;
- 未被主流数据库收录的旧文献或纸质档案;
- 仅在特定机构或本地存档中存在的文献。
因此,GPTZero 提醒,最终判断仍需人工参与,不能简单将「检索不到」直接视为 AI 幻觉。
## 投稿量激增推高査読负荷,NeurIPS 官方统计亦显示压力上升根据 NeurIPS 组委会公开的官方数据,NeurIPS 2025 共收到有效投稿 21,575 篇,其中 5,290 篇被採択,採択率为 24.52%。
近年来投稿数量持续大幅增长,意味着:
- 单篇論文可分配到的査読时间被进一步压缩;
- 査読者需要面对更多使用生成 AI 辅助写作的稿件;
- 对引用、数据、方法等细节进行逐条核查的难度显著上升。
GPTZero 在评论此次结果时强调,这并非针对某位作者或査読者的指责,而是指出:在投稿规模急剧扩张、生成 AI 工具快速普及的背景下,传统査読流程正面临前所未有的压力和新型风险。
## LLM 使用政策:内容准确性由作者负责,严重问题可被追责NeurIPS 已就論文写作中使用大规模语言模型(LLM)的行为制定了官方政策{target=”_blank”},明确规定:
- 作者可以在一定范围内使用 LLM 辅助写作,但論文内容的准确性和可靠性最终由作者本人负责;
- 一旦发现存在严重破坏科学诚信的问题,即便論文已经被接收,也可能启动调查程序,并采取相应措施。
这意味着,如果因生成 AI 带来的「幻覚引用」影响到論文的科学有效性,作者可能在会后仍面临撤稿或更正等后续处理。
## GPTZero:在作者、査読、编辑与运营各环节引入工具检查针对本次发现的大量「幻覚引用」案例,GPTZero 建议,在学术出版流程的多个关键节点引入自动化工具进行辅助检查,包括:
- 作者投稿前,对参考文献进行批量核查,提前发现潜在的「雰囲気引用」;
- 査読阶段,为査読者提供一键验证引用有效性的工具,减轻人工检索负担;
- 编辑与会议/期刊运营方,在最终定稿前增加一轮引用一致性与可检索性检查。
GPTZero 表示,将继续开发和完善相关检测工具,协助学术界提升出版流程的透明度和可信度,降低生成 AI 带来的隐性风险。
