CoreWeave, Inc.(纳斯达克代码:CRWV)宣布推出“CoreWeave灵活容量计划”(CoreWeave Flexible Capacity Program),新增Flex Reservations与Spot两类容量产品,旨在适应现代人工智能工作负载在生产环境中的动态需求。公司表示,该计划将帮助客户不再局限于“预留容量”与“按需容量”的二元选择。
CoreWeave指出,AI训练周期通常相对可预测,但生产级推理的流量峰值与使用波动更为明显,团队在资源规划上往往面临“过度配置”或“延迟风险”的取舍。灵活容量计划提供面向可中断任务的低成本选项,并希望在容量保障与价格灵活性之间提供更多控制手段。
CoreWeave产品与工程执行副总裁Chen Goldberg在声明中表示,在生产规模下,基础设施的规划与部署同样关键。她称,公司通过在关键时刻提供有保障的容量、并在需求变化时提供灵活定价,推动AI云的容量供给方式向更贴合实际工作负载的方向演进。
在此次发布中,CoreWeave将其面向AI的容量供给梳理为统一框架,包含四类模式:

- 预留容量(Reserved Capacity):面向稳定工作负载,提供可预测、持续在线的容量。
- Flex Reservations:CoreWeave称其为“保证峰值容量模型”,面向波动或不均匀扩展的工作负载。客户以较低的全天候持有费锁定容量上限,仅在实例激活时支付全额使用费。
- Spot:面向可中断工作(如批量分析或补充任务)的低成本选项。CoreWeave表示,Spot提供明确的抢占信号,便于工程师进行检查点保存并在中断后恢复任务。
- 按需容量(On-demand Capacity):面向即时增量需求,提供尽力访问。
CoreWeave表示,上述框架允许客户将稳定需求以预留方式覆盖,在需要时保障峰值容量,并将可中断任务进行弹性调配,从而使成本与确定性更贴近实际需求模式。
inference.net首席技术官Ibrahim Ahmed在声明中称,其公司通过定制调度与编排软件,帮助团队在未充分利用的GPU容量上训练与部署专用大型语言模型;他表示,CoreWeave的Spot实例为其客户以较低成本获取将定制模型推向生产所需的计算资源提供了支持。
CoreWeave称,Flex Reservations目前已通过公司账户团队在符合条件的地区与SKU中提供预览,Spot已全面上线。
此外,CoreWeave还表示,其AI云通过端到端技术栈优化现代AI工作负载,并在MLPerf基准测试中保持领先;公司称其为唯一获得SemiAnalysis ClusterMAX™ 1.0与2.0“双重白金排名”的AI云,该评估覆盖性能、效率与可靠性等维度。
