AI数据标注初创公司 Handshake 已收购数据标注审核初创公司 Cleanlab。两家公司向科技媒体 TechCrunch 证实了这一交易。
Handshake 成立于 2013 年,最初定位为面向大学毕业生的招聘平台,约在一年前开始面向基础模型公司提供人工数据标注服务。Cleanlab 成立于 2021 年,主营业务为提供提升人工标注数据质量的软件工具。
据介绍,此次收购的核心目的在于人才引进。通过交易,Handshake 将吸纳包括三位联合创始人在内的九名 Cleanlab 关键员工,加入其内部研究团队。三位联合创始人 Curtis Northcutt、Jonas Mueller 和 Anish Athalye 均拥有麻省理工学院计算机科学博士学位。交易的具体财务条款未被披露。
公开信息显示,Cleanlab 此前已从 Menlo Ventures、TQ Ventures、Bain Capital Ventures 和 Databricks Ventures 等投资方处累计融资 3000 万美元,在公司发展高峰期员工人数超过 30 人。
Cleanlab 的研究团队主要致力于开发可在无需第二位人工审核的情况下识别错误标注数据的算法,目标是提升人工标注数据的整体质量。Handshake 计划将这一能力用于改进其为 AI 实验室提供的数据产品。

Handshake 首席战略与创新官 Sahil Bhaiwala 在接受 TechCrunch 采访时表示,公司拥有一个内部研究团队,专注于评估模型的薄弱环节以及应当生产何种数据和数据质量标准。他称,Cleanlab 团队多年来一直围绕这一问题开展研究。
Cleanlab 首席执行官 Northcutt 被业内视为自动化数据标注审核技术的早期推动者。他表示,公司曾收到多家 AI 数据标注企业的收购意向,但最终选择与 Handshake 达成交易。Northcutt 称,包括 Mercor、Surge 和 Scale AI 在内的多家数据标注竞争对手经常通过 Handshake 平台,寻找医生、律师和科学家等专业人士参与其数据标注项目。
Northcutt 对 TechCrunch 表示,如果在潜在买家中作出选择,“可能应该选择源头,而不是中间商”。
根据此前报道,Handshake 在 2022 年的估值约为 33 亿美元。公司预计,到 2025 年底其年化经常性收入(ARR)将达到 3 亿美元,并据称今年有望实现“数亿高位”的 ARR。Handshake 已为包括 OpenAI 在内的八家顶级 AI 实验室提供数据服务。
