反诽谤联盟:马斯克旗下Grok在识别与抵制反犹太内容基准测试中排名垫底
反诽谤联盟(ADL)发布的一项新基准测试显示,埃隆·马斯克旗下xAI的聊天机器人Grok在识别并抵制反犹太主义及极端主义相关内容方面表现最弱,在被评估的六个主流大型语言模型中排名最后。 ADL研究人员称,此次推出的“ADL人工智能指数”旨在以可量化方式评估不同人工智能系统对反犹太仇恨、反犹太复国主义言论以及更广泛极端主义宣传的处理能力,包括是否能够识别仇恨内容、避免放大相关叙事,并在适当情况下提供
反诽谤联盟发布AI安全指数:Grok在识别与抵制反犹内容方面排名垫底
反诽谤联盟(ADL)在一项针对大型语言模型的新基准评估中表示,埃隆·马斯克旗下聊天机器人Grok在识别并反击反犹主义内容方面表现最弱,并称其相关失误并非边缘性的技术瑕疵,而可能对犹太用户及接触其输出内容的公众构成直接风险。与之相比,ADL将由竞争对手开发的Claude评为同类系统中表现最强。 ADL推出AI指数:Grok位列末位、Claude居首 ADL在最新评估中建立“AI指数”,用于衡量聊天机
