随着依赖人工智能的企业对算力稳定性的担忧上升,本地可运行的小型模型正受到更多关注。
近期,风险投资机构Lux Capital在一份面向投资组合公司的建议中指出,私营企业违约率已超过9.2%,为多年高位。在此背景下,该机构建议依赖人工智能基础设施的公司,应以书面形式确认算力承诺,认为在金融不稳定波及人工智能供应链的情况下,仅凭口头协议已不足以保障服务连续性。
在减少对外部算力依赖的路径中,直接在终端设备上运行的小型模型被视为一种替代方案。西班牙初创公司Multiverse Computing正围绕这一方向推进产品落地。
推出本地聊天应用与API门户
Multiverse Computing近日宣布,在对包括OpenAI、Meta、DeepSeek和Mistral AI等多家主要人工智能实验室的模型进行压缩后,已推出一款展示其压缩技术能力的应用程序,以及一个面向开发者和企业的自助API门户。
该应用名为CompactifAI,与公司采用的量子启发压缩技术同名,形态上类似ChatGPT或Mistral的Le Chat,为一款对话式人工智能工具。用户通过自然语言提问,由模型生成回答。公司在应用中嵌入了名为Gilda的小型模型,据称可在本地离线运行,无需依赖数据中心或云服务提供商。
Multiverse表示,在终端设备满足条件的情况下,CompactifAI可实现“边缘人工智能”体验:数据不离开设备,也不需要网络连接。公司同时指出,该模式对设备性能有一定要求,用户的移动设备需具备足够的内存和存储空间,部分较旧型号的iPhone无法满足本地运行条件。
当设备资源不足时,应用会通过API自动切换至云端模型。Multiverse称,本地与云端之间的路由由一套名为“Ash Nazg”的系统自动完成。公司同时承认,一旦切换至云端,应用在隐私方面的主要优势将不再适用。
应用当前的市场渗透仍有限。应用分析机构Sensor Tower的数据显示,CompactifAI在过去一个月的下载量不足5,000次。报道指出,该应用更像是技术展示窗口,而非面向大众市场的大规模消费产品。
面向企业开放压缩模型
Multiverse此次发布的重点之一是面向企业和开发者的自助API门户。公司表示,通过这一门户,用户可以直接访问其压缩模型,而无需通过AWS Marketplace等第三方平台。

“CompactifAI API门户现在为开发者提供了直接访问压缩模型的途径,具备在生产环境中运行所需的透明度和控制能力,”Multiverse首席执行官Enrique Lizaso在声明中表示。
公司介绍称,实时使用监控是该API的一项核心功能。对于企业用户而言,部署小型模型的主要考量之一是降低计算成本,尤其是在边缘部署场景下。Multiverse认为,透明的使用数据有助于企业评估成本与性能之间的权衡。
小型模型能力持续提升
近期,小型模型在功能上的限制正逐步收窄。本周早些时候,Mistral发布了其小型模型系列的更新版本Mistral Small 4,称该模型针对通用聊天、代码生成、代理任务和推理等多类场景进行了优化。同时,Mistral推出了Forge系统,允许企业构建定制模型,并在不同体量模型之间按具体用例选择取舍。
Multiverse最新发布的压缩模型也被公司视为缩小与大型语言模型差距的一个例证。该公司称,其最新压缩模型HyperNova 60B 2602基于gpt-oss-120b——一个OpenAI公开了底层代码的模型。Multiverse表示,压缩后的模型可在更低成本下提供更快响应,尤其适用于“代理编码工作流”,即由人工智能自主完成复杂、多步骤编程任务的流程。
本地运行与云端协同
如何在移动设备上运行足够小且仍具实用性的模型,是业界面临的技术难题之一。苹果在其智能助手中采用了设备端模型与云端模型结合的方式,以平衡性能与资源限制。
Multiverse表示,其CompactifAI应用同样可以通过API将请求路由至gpt-oss-120b等云端模型,但公司强调,该应用的主要目标是展示Gilda及其后续本地模型在成本之外的潜在优势。
公司认为,对于在关键领域工作的用户而言,能够在本地运行且无需连接云端的模型,有助于提升隐私保护和系统韧性。Multiverse同时指出,更大的潜在价值在于由此带来的商业应用空间,例如在无人机、卫星及其他网络连接不稳定或无法保证持续连接的环境中嵌入人工智能能力。
客户基础与融资动向
Multiverse称,目前已为包括加拿大央行、博世(Bosch)和Iberdrola在内的100多家全球客户提供服务。公司认为,进一步扩大企业客户基础,有助于其在资本市场上获得更多支持。
根据此前公开信息,Multiverse在去年完成了2.15亿美元的B轮融资。市场传闻显示,该公司正在筹备新一轮规模约5亿欧元的融资,相关交易对公司估值的讨论水平超过15亿欧元。公司方面尚未就这一传闻作出进一步公开说明。