Origin Lab获800万美元种子轮融资 搭建游戏数据与世界模型实验室交易平台

richlovec 1500_400 (1)
 

随着人工智能系统开始更多地与物理世界交互,一批新兴实验室正专注于构建可驱动物理机器人或模拟物理环境的“世界模型”。与依托海量文本数据训练的大型语言模型不同,这类模型缺乏现成的大规模数据来源,相关机构在组建训练数据集方面面临压力。

在此背景下,一家初创公司试图从视频游戏行业挖掘新的数据供给。Origin Lab近日宣布完成800万美元种子轮融资,由Lightspeed Ventures领投,SV Angel、Eniac、Seven Stars和FPV参投。Twitch联合创始人Kevin Lin和Cruise创始人Kyle Vogt以天使投资人身份参与本轮融资。

Origin Lab联合首席执行官兼联合创始人Anne-Margot Rodde在接受TechCrunch采访时表示,当前正在开发的人工智能系统需要理解物理世界的运行方式以及物体的运动规律,而这类数据在视频游戏中大量存在。公司另外两位联合创始人为Antoine Gargot和Colin Carrier。

根据介绍,Origin Lab计划搭建一个数据交易市场,面向专注世界模型研发的人工智能实验室,例如Yann LeCun的AMI Labs和Fei-Fei Li的World Labs,提供高质量、已获授权的数据。另一端,视频游戏公司可以通过出售其既有数字资产获取额外收入。

在具体操作上,Origin Lab将负责把游戏资产转换为适合训练用途的数据形式。这一过程可能包括对游戏内容进行渲染输出,或对数小时游戏实况录像进行自动化处理,以满足模型训练的技术要求。

Rodde表示,视频游戏行业掌握着极具价值的数据资源,但此前缺乏将人工智能实验室与游戏公司有效连接的机制和基础设施。Origin Lab的目标是充当这一“桥梁”,在合规授权的前提下促成数据流通。

长期以来,研究机构和企业一直关注将视频游戏画面和录像作为训练数据的可能性,但在实际应用中,授权和数据质量问题频繁成为掣肘因素。2024年12月,OpenAI首个Sora视频生成模型被指在输出内容中出现与热门视频游戏及主播画面高度相似的片段,引发外界讨论。有观点认为,这可能与模型训练阶段使用Twitch直播流有关。亚马逊此前也公开表示,正考虑利用Twitch录像训练模型。

Origin Lab本轮融资被视为训练数据市场扩张的一部分,也反映出为大型人工智能实验室提供数据服务的初创企业正受到资本关注。主导本轮投资的Lightspeed合伙人Faraz Fatemi在接受TechCrunch采访时提到,Scale AI等公司的发展显示,为头部实验室提供数据供应的业务具有显著增长潜力。

Fatemi表示,主要人工智能实验室通常资金实力雄厚,但在模型开发过程中普遍面临数据获取方面的瓶颈,这为专注数据供给和处理的公司创造了机会。


分享:


发表评论

登录后才可评论。 去登录