OpenAI推出“可信联系人”功能 应对聊天中潜在自残风险
OpenAI宣布在ChatGPT中上线可选的“可信联系人”功能,当系统识别到对话可能涉及自残内容时,将鼓励用户联系其预先指定的第三方,并向该联系人发送提醒。
TikTok的AI审核工具错误惩罚独立电影制作者
独家报道:TikTok在其AI驱动的内容审核工具错误地将三位原创内容创作者踢出创作者奖励计划后,已恢复了他们的收入。
研究发现:法律压力显著提升平台移除非自愿裸露内容的效率
密歇根大学团队审计X平台发现,以版权侵权为由举报AI生成裸露图像,比依据平台非自愿裸露政策举报,移除速度快得多,凸显法律压力在内容治理中的关键作用。
短视频新闻应用SaySo上线 主打经审核创作者内容以提升信任
短视频应用SaySo在北美iOS平台上线,主打经审核创作者和独立记者制作的新闻内容,并通过强制标注信息来源和多重审核机制回应用户对错误信息和生成式内容的担忧。
研究称马斯克将推特更名为X凸显“所有者主导”平台治理风险
曼彻斯特大学与德国研究机构团队在《新媒体与社会》发表研究,梳理马斯克收购后1500余个事件,认为X呈现由个人集中控制并服务特定政治议程的“平台非自由主义”治理特征。
Instagram在全球推广受电影分级启发的青少年内容限制设置
Instagram宣布,将此前在少数国家试行的青少年内容限制设置扩展至全球所有青少年账户,收紧对暴力、性及毒品相关内容的展示与推荐。
前Facebook高管创立Moonbounce:获1200万美元融资,聚焦AI时代内容审核
前Facebook业务诚信负责人Brett Levenson创立内容安全公司Moonbounce,提出“政策即代码”理念,将平台内容审核规则转化为可执行逻辑,并在最新一轮融资中获得1200万美元,用于扩展其面向AI应用的安全控制引擎。
匿名社交应用Fizz在沙特阿拉伯意外走红
源自美国校园的匿名社交应用Fizz在沙特阿拉伯低调上线后迅速登顶当地App Store,总榜排名第一,成为该公司首次海外扩张的重要试点。
X对未披露AI生成战争视频的创作者实施90天收益分成禁令
X宣布,未标注为AI生成的战争视频将触发最长90天的创作者收益分成资格暂停,且屡犯者或被永久移出分成计划。
研究:大型语言模型在内容审核中暗藏政治偏见
昆士兰大学团队发现,大型语言模型在扮演不同政治角色时,会在不显著影响整体准确率的前提下,引入稳定的一致性意识形态偏见,从而影响在线仇恨内容审核的公正性。
Reddit推行“人类验证”机制应对可疑机器人账户
Reddit宣布将对疑似自动化账户启动“人类验证”流程,并引入第三方工具核验账户背后是否为真人,以遏制平台上的垃圾信息和操纵行为。
Meta推出新一代内容执法系统 拟降低对第三方审核依赖
Meta宣布部署更先进的内容执法人工智能系统,用于打击恐怖主义、儿童剥削、毒品和诈骗等违规内容,并计划在系统表现优于现有方法后减少对第三方供应商的依赖。
