预印本平台arXiv拟对完全依赖AI生成论文作者实施一年禁发

商业 2026-06-16 科技最前沿 arXiv, 学术出版, 人工智能, 科研诚信, 预印本 2 次浏览

arXiv这一广泛使用的开放预印本存储库，正进一步收紧对大型语言模型在科学论文中不当使用的管控措施。

arXiv（发音为“archive”）长期以来是计算机科学、数学等领域研究成果在正式同行评审前传播的重要渠道，该平台本身也被广泛用作分析科研趋势的数据来源。随着利用大型语言模型撰写论文的情况增多，平台上低质量AI生成内容的比例引发关注。

为此，arXiv此前已采取多项举措，包括要求首次投稿者须获得资深作者推荐等。该平台在由康奈尔大学托管逾20年后，正转型为独立非营利机构。根据平台方面的说法，这一架构调整将有助于其筹集更多资源，以应对包括AI生成内容质量在内的运营与技术问题。

在最新发布的措施中，arXiv计算机科学分区主席Thomas Dietterich周四发表声明指出，一旦在投稿中发现“不可辩驳的证据”表明作者未对大型语言模型生成的结果进行核查，“这意味着我们无法信任论文中的任何内容”。

Dietterich表示，此类“不可辩驳的证据”可能包括“虚构的参考文献”以及与大型语言模型的评论式对话记录等。一旦确认存在这些问题，相关作者将面临最长一年不得在arXiv投稿的处罚。禁发期结束后，其后续提交的论文需先被“权威同行评审期刊”接收，方可上传至arXiv。

Dietterich强调，这一规定并非全面禁止使用大型语言模型，而是重申作者对论文内容负有完全责任，“无论内容如何生成”。他指出，如果研究人员直接复制粘贴大型语言模型生成的“不当语言、抄袭内容、偏见内容、错误、失误、不正确的引用或误导性内容”，则仍需由作者本人承担相应责任。

据Dietterich向404 Media介绍，上述措施将按“一次犯错”原则执行，但需经过平台内部程序：首先由版主标记可疑内容，再由分区主席确认证据后作出处罚决定。作者有权就相关决定提出申诉。

近期有同行评审研究显示，生物医学研究领域中“虚构引用”的情况有所增加，研究认为这可能与大型语言模型的使用有关。不过，相关报道也指出，科研人员并非唯一被发现使用AI生成虚构引用的群体。

登录后才可评论。去登录