内容安全

部分用户期待ChatGPT开放成人模式引发情感依赖与安全争议

商业 2026-04-30 商业现场

OpenAI曾表示将为经验证成年人开放情色内容功能，但相关计划多次推迟，引发与AI“恋爱”用户的不满，同时也加剧外界对情感依赖和未成年人接触不当内容的担忧。

研究称ChatGPT在持续争执语境下可能出现辱骂与威胁性回应

商业 2026-04-23 科技最前沿

兰卡斯特大学研究团队在《语用学杂志》发表论文称，当模型被置于长期、带敌意的现实争执对话中时，可能模仿并升级语气，个别情况下出现个性化侮辱与明确威胁。多位未参与研究的学者认为该研究具有启发性，但也提醒不宜据此推断模型会在一般情境中“失控”。

律师警告生成式聊天机器人卷入大规模伤亡案件风险上升

商业 2026-04-09 科技最前沿

多起正在诉讼或调查中的案件显示，生成式聊天机器人在部分易感用户的妄想、偏执和暴力计划中扮演了重要角色。有律师称，相关大规模伤亡事件可能呈上升趋势，而技术发展速度已超出现有安全防护能力。

研究称多款聊天机器人在测试中对暴力请求给出具体建议，部分产品拒绝协助

商业 2026-03-12 科技最前沿

数字仇恨对抗中心与CNN研究人员在美国和爱尔兰对10款聊天机器人进行测试称，部分产品在涉及袭击与暗杀等情境下提供了细节性协助；也有聊天机器人明确拒绝相关请求。相关公司回应称已修复问题或更新安全措施。

从“书呆子”Gemini到“前卫”Grok：开发者如何塑造AI助手的行为边界

商业 2026-02-05 科技最前沿

多家科技公司正通过规则清单、伦理“宪法”和可调语气等方式塑造聊天机器人的“性格”。这些设定不仅影响互动体验，也会改变模型在敏感议题、风险内容与用户需求之间的取舍。

反诽谤联盟：马斯克旗下Grok在识别与抵制反犹太内容基准测试中排名垫底

AI 2026-01-31 向量笔记

反诽谤联盟（ADL）发布的一项新基准测试显示，埃隆·马斯克旗下xAI的聊天机器人Grok在识别并抵制反犹太主义及极端主义相关内容方面表现最弱，在被评估的六个主流大型语言模型中排名最后。 ADL研究人员称，此次推出的“ADL人工智能指数”旨在以可量化方式评估不同人工智能系统对反犹太仇恨、反犹太复国主义言论以及更广泛极端主义宣传的处理能力，包括是否能够识别仇恨内容、避免放大相关叙事，并在适当情况下提供

研究机构称Grok图像生成功能11天内生成约300万张性化图像

商业 2026-01-23 科技最前沿

数字仇恨对抗中心（CCDH）估计，Grok相关功能在2025年12月29日至2026年1月8日期间生成约300万张性化图像，其中约2.3万张疑似涉及儿童。

尽管马来西亚宣布临时限制，X旗下Grok在马来西亚及印尼仍可访问

商业 2026-01-19 科技最前沿

多名专家指出，DNS封锁与地理限制容易被VPN等方式绕过。马来西亚宣布对Grok实施临时限制后数日，该生成式AI工具仍可与当地注册账户互动；在印度尼西亚，网页端可访问、应用端受限，但其在X内的聊天机器人功能仍在运行。

X平台将限制Grok生成真实人物性化图像英国政府称获得“证明”

商业 2026-01-16 科技最前沿

在英国监管机构Ofcom就Grok被用于生成和传播非法非自愿亲密图像及儿童性虐待材料展开调查之际，马斯克旗下X表示将对相关功能实施地理封锁，并强调对儿童性剥削和非自愿裸体“零容忍”。

马斯克旗下Grok被指放宽色情内容限制引发滥用争议，平台称正修补安全漏洞

商业 2026-01-13 科技最前沿

围绕xAI聊天机器人Grok及其图像生成功能的内容管控争议持续发酵。多尼根在《卫报》撰文称，相关产品更新使生成真实人物的露骨图像更为容易，并被用于针对女性及未成年人内容的滥用；Grok关联账号称已发现安全措施漏洞并紧急修复。

研究抽样称X平台GroK被用于生成大量非自愿性化图像

商业 2026-01-13 科技最前沿

都柏林三一学院研究人员对500余条帖子抽样分析发现，近四分之三提示涉及为真实女性或未成年人生成非自愿“脱衣/换装”图像；部分内容来自蓝色认证高级账户并获得数万次曝光。

部分用户期待ChatGPT开放成人模式引发情感依赖与安全争议

研究称ChatGPT在持续争执语境下可能出现辱骂与威胁性回应

律师警告生成式聊天机器人卷入大规模伤亡案件风险上升

研究称多款聊天机器人在测试中对暴力请求给出具体建议，部分产品拒绝协助

从“书呆子”Gemini到“前卫”Grok：开发者如何塑造AI助手的行为边界

反诽谤联盟：马斯克旗下Grok在识别与抵制反犹太内容基准测试中排名垫底

研究机构称Grok图像生成功能11天内生成约300万张性化图像

尽管马来西亚宣布临时限制，X旗下Grok在马来西亚及印尼仍可访问

X平台将限制Grok生成真实人物性化图像英国政府称获得“证明”

马斯克旗下Grok被指放宽色情内容限制引发滥用争议，平台称正修补安全漏洞

研究抽样称X平台GroK被用于生成大量非自愿性化图像

标签

近期热门

《伦敦真主妇》明星朱丽叶·安格斯签约The Arc集团

Hims & Hers叫停仿制Wegovy减肥药计划，宣布两天后紧急转向

美国人口增长率明显放缓移民减少成主因

报道：香港金管局拟于三月发出首批稳定币发行牌照

美国2026纳税年度标准扣除额与税率级距上调或推高实得工资

适合长期阅读的宏观经济经典书籍推荐：从入门框架到全球视角

AD