Anthropic被曝批量购入二手书扫描后销毁,用于训练Claude模型
在人工智能行业争夺训练数据的背景下,一家开发大模型的初创公司被曝将目光投向二手印刷书籍,并以工业化方式将其转化为训练语料:批量购书、高速扫描,随后将实体书送往造纸厂粉碎处理。相关做法引发图书馆界、作者群体与技术行业之间的关注与争议,焦点集中在纸质知识载体在数字化过程中应被保存还是被消耗。 报道所指公司为Anthropic。该公司开发了聊天机器人Claude。据披露,Anthropic投入数百万美元
在人工智能行业争夺训练数据的背景下,一家开发大模型的初创公司被曝将目光投向二手印刷书籍,并以工业化方式将其转化为训练语料:批量购书、高速扫描,随后将实体书送往造纸厂粉碎处理。相关做法引发图书馆界、作者群体与技术行业之间的关注与争议,焦点集中在纸质知识载体在数字化过程中应被保存还是被消耗。 报道所指公司为Anthropic。该公司开发了聊天机器人Claude。据披露,Anthropic投入数百万美元