在旧金山一栋外观低调的建筑内,初创公司 Physical Intelligence 正在训练其自称为“机器人版 ChatGPT”的系统:价格相对低廉的机械臂反复尝试折叠裤子、翻转衬衫、削西葫芦,并将过程中的数据回流,用于迭代通用机器人基础模型。
低调办公环境中的“机器人实验场”
公司总部内部是一个开阔的混凝土空间,摆放着浅色木质长桌,一部分用于员工日常用餐,另一部分则堆满显示器、备用机器人零件、电缆和处于不同测试阶段的机械臂。记者到访时,一只机械臂在尝试折叠一条黑色裤子,进展缓慢;另一只在努力将一件衬衫翻面;第三只则快速削着西葫芦,并将削下的碎屑放入容器中。
联合创始人之一、加州大学伯克利分校副教授 Sergey Levine 表示,这些场景是公司持续测试循环的一部分。数据不仅来自总部,还来自仓库、家庭等不同环境中的机器人站点,用于训练通用机器人基础模型。新模型训练完成后会被送回这些站点进行评估,例如测试是否能在不同蔬菜之间泛化削皮动作,以应对此前从未见过的食材。
公司在这栋楼及其他地点还设有测试厨房,使用现成硬件让机器人接触多样化环境和任务。办公室内的一台复杂浓缩咖啡机并非为员工准备,而是用于让机器人学习操作。Levine 称,任何一次打泡拿铁的过程,都是可用于训练的数据。
低成本硬件与“用智能补足机械”
Physical Intelligence 目前使用的机械臂单价约为 3,500 美元。Levine 称,这一价格已包含供应商“巨额加价”,如果自行制造,材料成本可降至 1,000 美元以下。他表示,几年前机器人专家可能会对这些硬件能完成任何任务感到惊讶,而公司正是希望通过更强的智能能力来弥补硬件层面的不足。
公司现有员工约 80 人,并计划继续扩张,但联合创始人兼首席执行官 Lachy Groom 表示,希望“尽可能慢”地扩张。他认为,硬件是公司面临的最大挑战之一:硬件容易损坏,交付周期长,影响测试进度,安全要求也显著提高了复杂度。
从天使投资人到机器人创业者
现年 31 岁的 Groom 出生于澳大利亚,13 岁时创办并在 9 个月后出售了第一家公司。加入支付公司 Stripe 后,他作为早期员工工作数年,离职后在约五年时间里从事天使投资,早期投资项目包括 Figma、Notion、Ramp 和 Lattice 等。他表示,从未打算长期做全职投资人,投资更多是保持活跃和结识创业者的方式,最终目标始终是再次亲自创业。
Groom 称,他在关注到 Sergey Levine 和 Chelsea Finn 的学术成果后,开始对机器人学习领域产生浓厚兴趣。Finn 曾是 Levine 在伯克利的博士生,现任斯坦福机器人学习实验室负责人,两人在机器人研究领域频繁出现于重要进展之中。得知他们有意创办公司后,Groom 又确认了谷歌 DeepMind 研究员、斯坦福教师 Karol Hausman 也将参与其中。他表示,在那次会面结束时,便认定这就是自己要投入的项目。
在此之前,Groom 已于 2021 年投资了机器人公司 Standard Bots,这被他视为重拾童年对乐高 Mindstorms 机器人兴趣的契机。他称,自己花了五年时间寻找“Stripe 之后要去创办的公司”,认为“好点子、好时机、好团队”极为罕见,执行力固然重要,但“再努力执行一个坏点子,它仍然是坏点子”。
融资逾10亿美元 估值约56亿美元
Physical Intelligence 成立约两年,已筹集超过 10 亿美元资金。Groom 表示,公司目前资金消耗并不算高,主要开支集中在计算资源上。他称,在合适条件和合作伙伴出现时,愿意继续融资,“我们可以投入的资金没有上限,总有更多计算资源可以投入解决问题”。
据 Groom 介绍,公司投资方包括 Khosla Ventures、红杉资本和 Thrive Capital 等,当前估值约为 56 亿美元。他表示,自己并未向投资人承诺明确的商业化时间表,“这有点不寻常,但他们容忍这一点”。他同时指出,这种容忍并不意味着会无限持续,因此公司需要在当前阶段保持资金充裕。

押注“任何平台、任何任务”的通用模型
另一位联合创始人、来自谷歌 DeepMind 的 Quan Vuong 表示,公司策略围绕“跨形态学习”和多样化数据源展开。其目标是让模型能够在不同硬件平台之间迁移:如果未来出现新的机器人平台,无需从零开始收集数据,而是可以将现有模型的知识迁移过去,从而显著降低为新平台引入自主能力的边际成本。
Vuong 称,公司已与少数几家来自不同垂直领域的企业合作,包括物流、杂货零售以及街对面的一家巧克力制造商,用于测试系统在现实场景中的自动化能力。他表示,在部分场景中,系统已经达到可用水平。公司希望通过“任何平台、任何任务”的方法,在不针对单一场景定制的前提下,完成当下已经具备自动化条件的任务。
Groom 表示,公司按照内部研究需求运作,“研究人员有需求,我们就去收集支持该需求的数据——或新硬件,或其他——然后执行,而不是由外部驱动”。公司曾制定 5 至 10 年的路线图,团队认为那是可以实现的目标,而在约 18 个月后,进展已超出最初预期。
与 Skild AI 路线分化
在通用机器人智能领域,Physical Intelligence 并非唯一参与者。总部位于匹兹堡的 Skild AI 成立于 2023 年,本月刚以 140 亿美元估值完成 14 亿美元融资,采取了与 Physical Intelligence 明显不同的策略。
Physical Intelligence 目前主要聚焦研究,而 Skild AI 已将其“全身”系统 Skild Brain 商业化部署。Skild AI 称,该系统在过去数月内已在安全、仓储和制造等领域创造了 3,000 万美元收入。
Skild AI 还在公司博客中公开批评竞争对手,称多数“机器人基础模型”只是“伪装”的视觉-语言模型,缺乏“真正的物理常识”,原因在于过度依赖互联网规模的预训练,而非基于物理的仿真和真实机器人数据。这一表述凸显出业内在技术路径上的分歧:Skild AI 押注通过商业部署形成数据飞轮,以现实用例不断提升模型;Physical Intelligence 则选择在短期内淡化商业化,集中资源构建更通用的智能能力。
业内普遍认为,这种路线之争的结果可能需要多年时间才能显现。
在质疑声中推进长期路线
在 Physical Intelligence 总部,记者离开时,机械臂仍在反复练习:裤子尚未完全折好,衬衫依旧未能顺利翻面,西葫芦碎屑则已整齐堆积。围绕这类场景,外界存在诸多疑问:是否真的需要在厨房中部署削蔬菜的机器人?如何确保安全?家用环境中机器人对宠物等是否会造成干扰?大量时间和资金投入是否对应足够大的问题,还是会引出新的问题?
针对公司愿景能否实现、押注通用智能而非具体应用是否合理等质疑,Groom 未给出明确回应。他表示,自己与在该领域耕耘数十年的研究人员合作,而这些人认为时机已经成熟,这对他而言已是重要信号。
自行业早期以来,硅谷资本市场长期支持类似 Groom 这样的创业者,在缺乏清晰商业化路径、时间表和未来市场形态的情况下,仍给予其较大自由度。Physical Intelligence 当前的融资规模和估值,显示出这一模式在通用机器人智能领域仍在延续。
