【导语】
专注于提升人工智能推理效率的初创公司 Gimlet Labs 近日完成 8000 万美元 A 轮融资,融资由 Menlo Ventures 领投。公司称,其开发的软件可在多种不同架构的芯片上同时运行 AI 工作负载,旨在提高现有数据中心硬件资源的利用率。
融资情况与投资方构成
Gimlet Labs 由斯坦福大学兼职教授、连续创业者 Zain Asgar 联合创立。本轮 8000 万美元 A 轮融资由 Menlo Ventures 领投,其他投资方包括 Factory(领投种子轮)、Eclipse Ventures、Prosperity7 和 Triatomic 等。
包括本轮在内,Gimlet Labs 迄今共筹集资金 9200 万美元。天使投资人阵容中包括 Sequoia 的 Bill Coughran、斯坦福教授 Nick McKeown、前 VMware 首席执行官 Raghu Raghuram 以及 Intel 首席执行官 Tan Lip-Bu 等。
公司目前员工约 30 人。
“多硅推理云”产品定位
Gimlet Labs 称,其已构建出首个也是目前唯一的“多硅推理云”(multi-silicon inference cloud)。这一软件层可将 AI 应用的不同任务分配到多种硬件类型上,包括传统 CPU、面向 AI 优化的 GPU 以及高内存系统等。
Asgar 在接受 TechCrunch 采访时表示,该软件“基本上可以在任何可用的不同硬件上运行”。
Menlo Ventures 合伙人 Tim Tully 在一篇介绍本轮投资的博客文章中指出,一个单一的 AI 代理往往会串联多个步骤,而这些步骤对硬件的要求并不相同:推理环节计算密集,解码环节内存密集,工具调用则更依赖网络。他认为,目前尚无单一芯片能够同时在这些维度上做到最优。
Tully 在文中写道,随着新硬件不断推出以及旧 GPU 被重新部署,“多硅芯片阵列已经准备就绪——只缺少让它们协同工作的软件层”,而这正是 Gimlet Labs 试图提供的能力。
技术路径与性能目标
Asgar 表示,目前应用程序仅在“15% 到 30%”的时间内真正使用已部署的硬件资源。他认为,这意味着大量算力处于闲置状态,“换句话说,你正在浪费数千亿美元,因为你让资源闲置”。

在此背景下,他与联合创始人 Michelle Nguyen、Omid Azizi 和 Natalie Serrino 着手开发一套编排软件,将代理工作负载拆分并分布到不同硬件上并行执行。
Gimlet Labs 称,其技术可以在相同成本和功耗条件下,将 AI 推理速度提升 3 至 10 倍。公司还表示,该软件不仅能在不同芯片之间分配任务,还可以将底层模型本身切分,使模型的不同部分在不同架构上运行,从而为各部分匹配更合适的芯片类型。
与多家芯片厂商建立合作
Gimlet Labs 已与多家芯片制造商建立合作关系,包括 NVIDIA、AMD、Intel、ARM、Cerebras 和 d-Matrix。公司表示,其“多硅推理云”可在上述厂商的硬件上协同调度 AI 工作负载。
Gimlet 的产品以软件或 API 形式提供,并可通过公司自有的 Gimlet Cloud 接入。公司目标客户并非普通 AI 应用开发者,而是大型 AI 模型实验室以及运营大规模基础设施的数据中心。
业务进展与客户情况
Gimlet Labs 于去年 10 月正式对外发布产品。公司称,发布时即实现了八位数收入(至少 1000 万美元)。
Asgar 表示,过去四个月内公司客户数量已翻倍,目前客户包括一家大型模型制造商和一家极大型云计算公司,但他未透露具体名称。
创业背景与融资过程
Gimlet Labs 的联合创始团队此前曾在初创公司 Pixie 共事。Pixie 专注为 Kubernetes 开发开源可观测性工具,在完成由 Benchmark 领投的 900 万美元 A 轮融资两个月后,于 2020 年被 New Relic 收购。Pixie 的技术目前已并入管理 Kubernetes 的开源组织。
Asgar 回忆称,大约一年前,他在一次偶然机会中结识了 Menlo Ventures 的 Tim Tully,并获得其作为斯坦福教授身份的天使投资。此后,风险投资机构开始主动接洽。
在 Gimlet 产品发布后,一份投资意向书很快送达 Asgar 桌面。当部分投资者得知他在考虑多份报价时,本轮融资迅速出现超额认购。Asgar 表示,这一过程带来了“规模较大的融资热潮”。
行业背景
根据麦肯锡的估算,如果当前增加计算资源的趋势持续,到 2030 年数据中心相关支出可能接近 7 万亿美元。在此背景下,如何提高已部署硬件的利用率成为业界关注的方向之一。Gimlet Labs 表示,其目标是让 AI 工作负载的运行效率“比以往任何时候都高效 10 倍”。