Gimlet Labs完成8000万美元A轮融资推出多硅推理云提升AI算力利用率

商业 2026-04-18 科技最前沿人工智能, 芯片与半导体, 风险投资, 数据中心, 企业服务 28 次浏览

【导语】

专注于提升人工智能推理效率的初创公司 Gimlet Labs 近日完成 8000 万美元 A 轮融资，融资由 Menlo Ventures 领投。公司称，其开发的软件可在多种不同架构的芯片上同时运行 AI 工作负载，旨在提高现有数据中心硬件资源的利用率。

融资情况与投资方构成

Gimlet Labs 由斯坦福大学兼职教授、连续创业者 Zain Asgar 联合创立。本轮 8000 万美元 A 轮融资由 Menlo Ventures 领投，其他投资方包括 Factory（领投种子轮）、Eclipse Ventures、Prosperity7 和 Triatomic 等。

包括本轮在内，Gimlet Labs 迄今共筹集资金 9200 万美元。天使投资人阵容中包括 Sequoia 的 Bill Coughran、斯坦福教授 Nick McKeown、前 VMware 首席执行官 Raghu Raghuram 以及 Intel 首席执行官 Tan Lip-Bu 等。

公司目前员工约 30 人。

“多硅推理云”产品定位

Gimlet Labs 称，其已构建出首个也是目前唯一的“多硅推理云”（multi-silicon inference cloud）。这一软件层可将 AI 应用的不同任务分配到多种硬件类型上，包括传统 CPU、面向 AI 优化的 GPU 以及高内存系统等。

Asgar 在接受 TechCrunch 采访时表示，该软件“基本上可以在任何可用的不同硬件上运行”。

Menlo Ventures 合伙人 Tim Tully 在一篇介绍本轮投资的博客文章中指出，一个单一的 AI 代理往往会串联多个步骤，而这些步骤对硬件的要求并不相同：推理环节计算密集，解码环节内存密集，工具调用则更依赖网络。他认为，目前尚无单一芯片能够同时在这些维度上做到最优。

Tully 在文中写道，随着新硬件不断推出以及旧 GPU 被重新部署，“多硅芯片阵列已经准备就绪——只缺少让它们协同工作的软件层”，而这正是 Gimlet Labs 试图提供的能力。

技术路径与性能目标

Asgar 表示，目前应用程序仅在“15% 到 30%”的时间内真正使用已部署的硬件资源。他认为，这意味着大量算力处于闲置状态，“换句话说，你正在浪费数千亿美元，因为你让资源闲置”。

在此背景下，他与联合创始人 Michelle Nguyen、Omid Azizi 和 Natalie Serrino 着手开发一套编排软件，将代理工作负载拆分并分布到不同硬件上并行执行。

Gimlet Labs 称，其技术可以在相同成本和功耗条件下，将 AI 推理速度提升 3 至 10 倍。公司还表示，该软件不仅能在不同芯片之间分配任务，还可以将底层模型本身切分，使模型的不同部分在不同架构上运行，从而为各部分匹配更合适的芯片类型。

与多家芯片厂商建立合作

Gimlet Labs 已与多家芯片制造商建立合作关系，包括 NVIDIA、AMD、Intel、ARM、Cerebras 和 d-Matrix。公司表示，其“多硅推理云”可在上述厂商的硬件上协同调度 AI 工作负载。

Gimlet 的产品以软件或 API 形式提供，并可通过公司自有的 Gimlet Cloud 接入。公司目标客户并非普通 AI 应用开发者，而是大型 AI 模型实验室以及运营大规模基础设施的数据中心。

业务进展与客户情况

Gimlet Labs 于去年 10 月正式对外发布产品。公司称，发布时即实现了八位数收入（至少 1000 万美元）。

Asgar 表示，过去四个月内公司客户数量已翻倍，目前客户包括一家大型模型制造商和一家极大型云计算公司，但他未透露具体名称。

创业背景与融资过程

Gimlet Labs 的联合创始团队此前曾在初创公司 Pixie 共事。Pixie 专注为 Kubernetes 开发开源可观测性工具，在完成由 Benchmark 领投的 900 万美元 A 轮融资两个月后，于 2020 年被 New Relic 收购。Pixie 的技术目前已并入管理 Kubernetes 的开源组织。

Asgar 回忆称，大约一年前，他在一次偶然机会中结识了 Menlo Ventures 的 Tim Tully，并获得其作为斯坦福教授身份的天使投资。此后，风险投资机构开始主动接洽。

在 Gimlet 产品发布后，一份投资意向书很快送达 Asgar 桌面。当部分投资者得知他在考虑多份报价时，本轮融资迅速出现超额认购。Asgar 表示，这一过程带来了“规模较大的融资热潮”。

行业背景

根据麦肯锡的估算，如果当前增加计算资源的趋势持续，到 2030 年数据中心相关支出可能接近 7 万亿美元。在此背景下，如何提高已部署硬件的利用率成为业界关注的方向之一。Gimlet Labs 表示，其目标是让 AI 工作负载的运行效率“比以往任何时候都高效 10 倍”。

发表评论

登录后才可评论。去登录