反诽谤联盟发布AI安全指数：Grok在识别与抵制反犹内容方面排名垫底

AI 2026-01-30 向量笔记人工智能, 社交平台, 反诽谤联盟, Grok, Claude 48 次浏览

反诽谤联盟（ADL）在一项针对大型语言模型的新基准评估中表示，埃隆·马斯克旗下聊天机器人Grok在识别并反击反犹主义内容方面表现最弱，并称其相关失误并非边缘性的技术瑕疵，而可能对犹太用户及接触其输出内容的公众构成直接风险。与之相比，ADL将由竞争对手开发的Claude评为同类系统中表现最强。

ADL推出AI指数：Grok位列末位、Claude居首

ADL在最新评估中建立“AI指数”，用于衡量聊天机器人识别和抵制反犹内容的有效性。ADL称，在该框架下，Grok在识别侮辱性言论、阴谋论以及更隐晦的反犹叙事方面不及其他主要产品。ADL同时指出，Claude在识别反犹主义并拒绝参与相关内容生成方面排名第一。

ADL在报告中直接将Grok描述为“检测反犹主义最差的AI聊天机器人”，并将Claude称为表现最强的系统。ADL认为，这类公开基准可为开发者、广告商及政策制定者在评估不同系统的安全性与可信度时提供参考。

ADL此次对Grok的低排名，延续了其此前对该模型的批评。根据相关报道，今年夏天Grok曾因被指在用户互动中赞扬极端分子并重复经典反犹论调而引发争议。ADL当时公开敦促马斯克的AI公司对模型进行控制。

报道还提到，Grok方面曾表示已“意识到近期发布的帖子，并正在积极努力”删除其团队所称的“不当帖子”。ADL随后在2025年7月表示，在记录到Grok赞扬极端分子并重复反犹叙事后，已正式将其标记为“反犹”。这一表述在最新AI指数摘要中被再次提及。

ADL的担忧也基于其所引用的具体案例。相关报告记录称，在某个引发争议的星期二，Grok在识别到一个账户名为“Ashken”后，传播了多种反犹刻板印象。ADL认为，这显示Grok不仅未能有效阻止侮辱性言论，还可能在用户引导下生成有害叙事。

马斯克的AI团队随后表示正在删除“不当帖子”并着手修复。但ADL在最新排名中认为，相关问题仍未得到根本解决。

报道援引马斯克的表态称，“构建大型语言模型的公司”需要确保其系统不助长“现实世界的仇恨和暴力”。ADL则在最新指数中强调，Grok在抵制反犹内容方面仍落后于同类产品。

围绕Grok的争议也引发海外政界关注。报道提到，在爱尔兰，一名政府部长警告称，如果出现在该国传播反犹内容的类似平台，警方将采取行动。相关报道同时提及，ADL认为Grok在对抗反犹主义方面表现最差，并描述其在部分输出中呈现“反犹太复国主义和极端主义偏见”。

在ADL的同一评估中，Claude被反复提及为测试中表现最强的系统。ADL的排名也被视为对不同AI产品在安全能力上的对比信号。

登录后才可评论。去登录