Veritone公司(纳斯达克代码:VERI)表示,已将自动化编辑软件Veritone Redact与Veritone数据精炼(Veritone Data Refinement,VDR)进行联合部署,用于在数据进入处理与精炼流程前,自动移除个人身份信息(PII)及其他敏感数据。公司称,此举旨在在将非结构化数据转化为可供AI使用的数据资产的同时,强化对隐私与知识产权(IP)保护的要求,并维护数据所有者权益。
Veritone指出,随着AI部署与应用规模扩大,企业及超大规模云服务商面临更高要求,需要确保用于AI训练的数据获得适当授权,并在使用前完成PII及敏感信息清理。公司称,VDR的目标是帮助数据从源头保持“清洁”,以支持企业满足更严格的行业合规与隐私标准,并在此基础上开展AI相关创新。
Veritone首席执行官Ryan Steelberg在声明中表示,公司致力于帮助数据驱动型组织保护其重要资产,并确保数据以“清洁且合乎伦理”的方式被使用。他称,Redact此前主要服务于公共部门客户,包括司法部以及州和地方警察机构,用于在数据精炼前保护PII。

据介绍,Veritone Redact主要面向公共安全与执法场景,可将音频、视频与图像证据中的敏感信息(包括PII)自动化编辑移除。公司称,该工具可减少人工编辑工作量、提升准确性并降低错误率,帮助相关机构满足期限要求。Veritone还表示,去年已对Redact进行功能增强,包括AI驱动的语音掩码、反向模糊以及支持64种语言的转录功能,以满足法律、执法与企业环境中的隐私、合规与效率需求。
在数据规模与合规风险方面,Veritone援引斯坦福人机智能研究院(Stanford HAI)《2025年AI指数报告》引用的Epoch AI研究称,随着模型规模持续增长,训练数据集约每八个月翻一番,进入AI系统的数据量不断上升。报告同时提到,围绕训练数据集的竞争引发了对法律与伦理风险的关注。
此外,Veritone引用由康奈尔大学支持的第三方协作者社区arXiv对1800多个文本数据集的审计结果称,在广泛使用的数据集托管网站上,许可分类存在频繁错误,许可遗漏率超过70%。Veritone并表示,公司观察到内容所有者与超大规模云服务商对VDR的需求明显增加:2025年下半年处理的数据量较上半年增长3.5倍,反映出市场对“清洁、合规且伦理来源”的AI就绪数据集需求上升。