arXiv这一广泛使用的开放预印本存储库,正进一步收紧对大型语言模型在科学论文中不当使用的管控措施。
arXiv(发音为“archive”)长期以来是计算机科学、数学等领域研究成果在正式同行评审前传播的重要渠道,该平台本身也被广泛用作分析科研趋势的数据来源。随着利用大型语言模型撰写论文的情况增多,平台上低质量AI生成内容的比例引发关注。
为此,arXiv此前已采取多项举措,包括要求首次投稿者须获得资深作者推荐等。该平台在由康奈尔大学托管逾20年后,正转型为独立非营利机构。根据平台方面的说法,这一架构调整将有助于其筹集更多资源,以应对包括AI生成内容质量在内的运营与技术问题。
在最新发布的措施中,arXiv计算机科学分区主席Thomas Dietterich周四发表声明指出,一旦在投稿中发现“不可辩驳的证据”表明作者未对大型语言模型生成的结果进行核查,“这意味着我们无法信任论文中的任何内容”。

Dietterich表示,此类“不可辩驳的证据”可能包括“虚构的参考文献”以及与大型语言模型的评论式对话记录等。一旦确认存在这些问题,相关作者将面临最长一年不得在arXiv投稿的处罚。禁发期结束后,其后续提交的论文需先被“权威同行评审期刊”接收,方可上传至arXiv。
Dietterich强调,这一规定并非全面禁止使用大型语言模型,而是重申作者对论文内容负有完全责任,“无论内容如何生成”。他指出,如果研究人员直接复制粘贴大型语言模型生成的“不当语言、抄袭内容、偏见内容、错误、失误、不正确的引用或误导性内容”,则仍需由作者本人承担相应责任。
据Dietterich向404 Media介绍,上述措施将按“一次犯错”原则执行,但需经过平台内部程序:首先由版主标记可疑内容,再由分区主席确认证据后作出处罚决定。作者有权就相关决定提出申诉。
近期有同行评审研究显示,生物医学研究领域中“虚构引用”的情况有所增加,研究认为这可能与大型语言模型的使用有关。不过,相关报道也指出,科研人员并非唯一被发现使用AI生成虚构引用的群体。
