AI应用快速扩张的同时,企业在底层基础设施上的资源浪费问题日益突出。GPU闲置、工作负载过度配置以及云成本上涨,正成为多家机构面临的共性挑战。初创公司 ScaleOps 认为,当前困境更多源于资源管理效率不足,而非单纯的算力短缺。
周一,ScaleOps宣布完成1.3亿美元C轮融资,公司估值约8亿美元。本轮融资由 Insight Partners 领投,现有投资方 Lightspeed Venture Partners、NFX、Glilot Capital Partners 和 Picture Capital 跟投。公司表示,其软件可通过实时自动化管理和重新分配计算资源,将云和AI基础设施成本最多降低约80%。
ScaleOps 成立于2022年,由曾在 GPU 编排初创公司 Run:ai 任职的工程师 Yodar Shafrir 共同创立。Run:ai 此前已被英伟达收购。Shafrir 在 Run:ai 工作期间接触了大量企业客户,观察到随着AI工作负载日趋复杂,企业在管理生产环境中的资源时面临明显困难。
他指出,Kubernetes 等工具虽然有助于在大规模集群上运行应用,但高度依赖静态配置,难以及时响应快速变化的业务需求,导致 GPU 利用率偏低、性能波动以及由此产生的高昂成本。
“在 Run:ai 的工作中,我接触了许多客户,尤其是 DevOps 团队,”ScaleOps 首席执行官 Shafrir 在接受 TechCrunch 采访时表示。“他们很认可 Run:ai 提供的能力,但在管理生产工作负载时依然遇到挑战,尤其是在推理工作负载在 AI 时代变得更普遍之后。当我从更高层面审视问题时,发现挑战不仅在于 GPU,还涉及计算、内存、存储和网络,相同的问题模式不断出现,团队难以高效管理这些资源。”
据介绍,DevOps 团队在处理相关问题时,往往需要协调多个内部利益相关方,但收效有限。现有工具多以可视化为主,能够暴露问题,却难以给出可执行的解决方案。Shafrir认为,这一缺口带来了较大的市场空间。
ScaleOps 表示,其平台通过在实时层面连接应用需求与基础设施决策,提供端到端、全自动的基础设施管理能力。

“ Kubernetes 是一个非常灵活、可高度配置的系统,但这同时也是问题所在,”Shafrir 称。“它严重依赖静态配置,而如今的应用高度动态,需要团队不断手动调整。你需要的是一种能够理解每个应用上下文——包括需求、行为以及环境变化——的解决方案。”
在这一领域,市场上已出现 Cast AI、Kubecost 和 Spot 等多家参与者。Shafrir指出,尽管不少公司推出了自动化工具,但由于缺乏完整上下文,这些工具在某些情况下可能引发性能问题甚至停机,影响生产环境团队的采用意愿。
ScaleOps 称,其平台自设计之初即面向生产环境,强调“完全自主”和“上下文感知”,并可在无需手动配置的情况下直接投入使用,这被公司视为与竞争对手的主要差异点之一。
公司总部位于纽约,主要服务全球企业客户,重点面向运行在 Kubernetes 基础设施上的组织,客户包括大型机构以及欧洲和印度的企业。ScaleOps 表示,其平台已被 Adobe、Wiz、DocuSign、Salesforce 和 Coupa 等企业采用。
此次C轮融资距离 ScaleOps 于2024年11月完成5800万美元B轮融资约一年半。Shafrir 称,在此期间,公司观察到市场对自动化云基础设施管理解决方案的需求持续增强,目前仍处于业务增长的早期阶段。根据公司发言人提供的数据,ScaleOps 累计融资总额约为2.1亿美元。
ScaleOps 还表示,公司年同比增长率超过450%,过去12个月员工人数增长了三倍,并计划在今年年底前再增长三倍以上。
对于新一轮融资的用途,ScaleOps 称将用于推出新产品并扩展现有平台。公司表示,在AI推动算力需求持续上升的背景下,将继续专注于构建完全自主的基础设施管理能力。