微型初创公司推出超大开源模型
美国初创公司 Arcee AI 宣布推出通用基础大语言模型 Trinity。该模型参数规模为 4000 亿,采用 Apache 许可证完全开源。公司称,Trinity 是美国公司训练并公开发布的最大开源基础模型之一。
Arcee AI 目前员工约 30 人。公司表示,Trinity 在几乎未进行后期训练的基础模型状态下,在多项基准测试中与 Meta 的 Llama 4 Maverick 400B 以及由中国清华大学相关团队参与开发的 Z.ai GLM-4.5 模型表现相当。
模型定位与技术路线
Arcee 称,Trinity 与其他前沿大模型类似,重点针对代码生成和多步骤流程(例如智能代理)进行了优化。在当前阶段,Trinity 仅支持文本输入,不具备多模态能力,因此尚未覆盖图像等其他模态场景。
Arcee 联合创始人兼首席技术官(CTO) Lucas Atkins 在接受 TechCrunch 采访时表示,公司正在研发视觉模型,并规划语音转文本版本。相比之下,Meta 的 Llama 4 Maverick 已支持文本和图像等多模态输入。
在扩展模态能力之前,Arcee 表示,将优先打磨高质量的基础大语言模型,以面向其主要目标用户——开发者和学术界。公司管理层称,希望为美国企业提供可选方案,减少其对来自中国的开源模型的依赖。
Atkins 表示:“最终,决定胜负、赢得用户的唯一方式,是拥有最优秀的开源权重模型。要赢得开发者,就必须提供最好的产品。”
基准表现与产品矩阵
根据 Arcee 公布的基准测试结果,在当前仍处于预览阶段、后期训练尚在进行中的情况下,Trinity 基础模型在编码、数学、常识、知识和推理等测试中整体保持竞争力,并在部分项目上略高于 Llama 系列模型。
此次发布的大型 Trinity 模型,是在此前两款小型模型基础上的扩展:
- Trinity Mini(26 亿参数):一款经过完整后期训练的推理模型,面向网页应用、智能代理等多种任务场景;
- Trinity Nano(6 亿参数):一款实验性模型,旨在探索小参数规模下对话能力的上限。
Arcee 表示,所有 Trinity 系列模型均可免费下载使用。最大规模的 Trinity 模型将以三种形式提供:
- Trinity Large Preview:轻度后期训练的指令模型,经过对齐以更好地遵循人类指令,适用于通用对话和指令跟随场景;
- Trinity Large Base:未进行指令对齐的基础模型,保留原始预训练形态;
- Trinity Large TrueBase:不包含任何指令数据或后期训练,便于企业和研究机构在此基础上进行完全自定义,无需先移除既有规则或假设。
Arcee 计划在约六周内推出 Trinity 通用发布版本的托管服务,并通过 API 对外提供访问。公司称,API 定价将“具有竞争力”,并会在此期间持续改进模型的推理训练。
目前,Trinity Mini 的 API 价格为每千次调用 0.045 美元和 0.15 美元两个档位,并提供限速免费套餐。Arcee 仍将继续提供后期训练和定制化服务。

训练成本与融资情况
Arcee 称,在约六个月时间内,使用 2048 块英伟达 Blackwell B300 GPU 完成了 Trinity 系列模型的训练,总成本约 2000 万美元。
公司联合创始人兼首席执行官(CEO) Mark McQuade 表示,Arcee 迄今已累计融资约 5000 万美元。他称,这一规模的资金“对公司来说已经很多”,但与大型实验室在同类项目上的投入相比仍有差距。
Atkins 指出,六个月的训练周期是经过规划的时间表。他回忆称,团队成员在此期间经历了大量加班和高强度工作,以完成模型训练任务。
从模型定制到自研基础模型
McQuade 曾是开源模型平台 Hugging Face 的早期员工。他表示,Arcee 创立之初并未计划成为新的美国 AI 实验室,而是主要为大型企业客户(包括 SK Telecom 等)提供模型定制服务。
“我们一开始只做后期训练,会在他人已有成果基础上工作:使用 Llama、Mistral、Qwen 等开源模型,再通过后期训练提升其在特定企业场景下的表现,其中包括强化学习等方法。”McQuade 说。
随着客户数量增加,Atkins 表示,团队逐渐意识到需要拥有自主可控的基础模型。与此同时,许多性能领先的开源模型来自中国,一些美国企业对此持谨慎态度,甚至在政策上被禁止采用。
McQuade 称,决定自研并发布大规模基础模型“是一个紧张的决定”。他表示,全球范围内,曾预训练并发布与 Arcee 目标规模和水平相当模型的公司“可能不到 20 家”。
Arcee 最初规模较小,先与训练公司 DatologyAI 合作,开发了一个 45 亿参数的小模型。该项目的成功,为后续更大规模模型的训练提供了信心。
与 Llama 的差异与开源策略
在美国已有 Llama 系列模型的背景下,Arcee 仍选择推出 Trinity。Atkins 表示,关键差异在于许可证类型。Trinity 采用 Apache 许可证,Arcee 承诺将模型“永久开源”。
他指出,Llama 采用的是由 Meta 控制的专用许可证,包含商业和使用限制,因此在部分开源组织看来,Llama 并不符合严格意义上的“开源”标准。
McQuade 表示,Arcee 的目标,是为美国市场提供一个在当前技术前沿水平上具有竞争力、并且在许可证上永久开放的替代方案。
