ElastixAI Inc. 周二宣布结束隐秘研发状态,推出一套面向生成式人工智能(GenAI)推理的软硬件协同方案。公司表示,该方案可将现成的基于FPGA的服务器转化为高效能AI超级计算机,以应对当前大语言模型推理在基础设施层面的低效与高成本问题。
ElastixAI称,公司由前苹果和Meta的机器学习研究人员创立,并已获得1800万美元种子轮融资支持。
公司在发布中指出,AI推理市场预计到2030年将达到2550亿美元,但现有基础设施与生成式AI推理需求存在结构性错配。其说法是,大语言模型推理主要受内存限制,而标准GPU架构更偏向计算密集型任务(如训练),在推理阶段可能出现计算利用率偏低,从而带来资本与能源消耗的浪费。与此同时,定制芯片从架构设计到投产周期较长,难以及时跟进机器学习技术迭代。公司以4位量化为例称,在缺乏原生支持的硬件上,理论上可将性能翻倍的技术在实际中往往只能带来约10%的性能提升。

ElastixAI联合创始人Mohammad Rastegari博士表示,行业在硬件难以跟上机器学习进步的情况下会出现显著性能损失。公司称,其思路是通过面向FPGA的专有训练后优化,让硬件更好适配模型需求,而非让模型受限于通用硬件。
在产品能力方面,ElastixAI表示其方案可作为传统GPU工作流程的替代选择,并在保持工作流程兼容性的同时提升效率。公司披露的指标包括:在大语言模型推理场景下,总拥有成本(TCO)最多可降低50倍;功耗可减少80%,其方式是仅激活推理所需电路以减少“暗硅”带来的能耗;同时通过可重构硬件与软件优化缩短硬件能力与AI创新之间的时间差。
ElastixAI称,目前该方案已向部分企业合作伙伴、数据中心运营商及AI模型提供商开放,并可通过公司网站申请演示与获取技术信息。
