Standard Kernel表示,公司已完成2000万美元种子轮融资。本轮由Jump Capital领投,General Catalyst、Felicis、Cowboy Ventures、Link Ventures、Essence VC参投;天使投资人与战略合作伙伴包括David M. Siegel、Jeff Dean、Jonathan Frankle、Michael Carbin、Sachin Katti、Walden Yan,以及CoreWeave和Ericsson Ventures。
Standard Kernel称,其正在构建一套可自动生成“超优化GPU软件”的AI系统,核心做法是由AI自主生成高度专用化的GPU内核(kernel),以提升AI工作负载的运行效率。公司强调,该方法旨在在不更改模型或硬件的前提下,通过软件层面的优化释放硬件性能。
该公司指出,随着全球对AI基础设施的投入加速,企业正在投入数千亿美元建设GPU集群,但不少硬件在实际使用中未能达到理论峰值性能。要从现代加速器中获得更高效率,往往需要对硬件架构、编译器行为以及底层系统优化具备深厚经验;而当前大量性能关键代码仍依赖人工编写与调优,难以跟上芯片迭代和AI工作负载复杂度提升的速度。
Standard Kernel表示,其路径是深入系统堆栈并将优化推进到本地芯片指令层面,用针对特定工作负载与硬件配置定制的代码,替代静态的通用库,从而提升端到端性能。
在合作伙伴测试中,Standard Kernel称其在NVIDIA H100 GPU上的端到端工作负载性能提升介于80%至4倍之间,并在部分场景下超过NVIDIA的cuDNN库。

公司同时提到,内核生成近期成为大型语言模型的热门基准任务,但多数现有方法更偏向高层抽象或较简单的工作负载;要生成可与最佳人工设计实现相匹配甚至超越的指令级、硬件专用内核,仍被视为尚未解决的挑战。Standard Kernel称,其目标是将这一过程自动化,以实现新硬件平台“首日峰值性能”,并减少漫长的人工调优周期。
Jump Capital合伙人Saaya Pal在声明中表示,Standard Kernel将AI应用于系统堆栈中最依赖人工且技术门槛最高的层级;在硬件创新加速的背景下,自动化指令级优化有望改变AI基础设施的扩展方式。
CoreWeave联合创始人兼首席战略官Brian Venturo表示,Standard Kernel正尝试在系统堆栈深层推动优化,并称CoreWeave Ventures投资该公司是基于其技术方向与团队能力。
SemiAnalysis创始人Dylan Patel表示,内核生成是提升AI硬件性能与效率的关键,随着AI硬件用户规模扩大及硬件多样性增加,相关能力在部署中的重要性将上升。
Standard Kernel表示,将利用本轮融资加速自主内核生成平台的开发,扩大与AI原生及企业合作伙伴的部署,并继续推进适应性系统软件,使其能够随新模型与新硬件持续提升性能。
