专注于AI模型可解释性研究的实验室Goodfire表示,公司已完成1.5亿美元B轮融资,投后估值为12.5亿美元。本轮融资由B Capital领投,现有投资者Juniper Ventures、Menlo Ventures、Lightspeed Venture Partners、South Park Commons和Wing Venture Capital参投;新投资者包括DFJ Growth、Salesforce Ventures以及Eric Schmidt等。
Goodfire称,此次融资距离其A轮融资不到一年。公司计划将资金用于推进前沿研究项目、开发下一代核心产品,并扩大在AI代理(AI agents)与生命科学领域的合作伙伴关系。
Goodfire将“可解释性”定义为研究神经网络内部工作机制的科学,关注如何通过调整模型内部机制影响其行为,例如通过改变推理模型的内部概念来影响其思考与响应方式。公司同时表示,可解释性也可用于从强大AI模型中提取新见解,实现AI向人类的知识转移。
公司提到,近期其将可解释性技术应用于Prima Mente构建的表观遗传模型,识别出一类新的阿尔茨海默病生物标志物,并称这是自然科学领域首次通过对基础模型进行逆向工程获得的重要发现。
B Capital普通合伙人Yan-David“Yanda”Erlich在声明中表示,当前业界在构建影响深远的技术的同时,仍缺乏对如何按预期设计模型的充分理解。他提到,在Weights & Biases期间观察到大量机器学习团队能够追踪实验与监控模型,但难以解释模型表现背后的原因,并称弥合这一差距是下一阶段的重要方向。
Goodfire表示,目前多数AI模型构建公司仍将模型视为“黑箱”,而深入理解模型底层机制对于构建与部署安全、强大的AI系统至关重要。公司目标是将AI转变为可理解、可调试,并能够像编写软件一样进行有意设计的技术。

Goodfire首席执行官Eric Ho在声明中称,可解释性为新兴科学领域提供了一套工具,用于提出假设、开展实验,并最终实现对智能的“设计”。他表示,AI正处于需要基础科学支撑工程化发展的关键阶段。
公司将自身定位为以研究为先的“新实验室”之一,强调其关注训练模型的新突破,而非OpenAI和Google DeepMind等“规模实验室”的路径。Goodfire称,迄今已在科学发现与模型设计两方面展示了可解释性方法的应用价值。
在科学发现方面,Goodfire表示已与梅奥诊所(Mayo Clinic)、Arc Institute和Prima Mente等机构合作,解读科学基础模型,并识别出用于阿尔茨海默病检测的新型生物标志物。公司称,鉴于AI模型在材料发现、蛋白质折叠等领域的能力已超出人类直观理解,研究模型工作机制有助于提取新见解并拓展知识边界,并计划继续扩大与新合作伙伴的科学发现管线。
在模型设计方面,Goodfire称其专注于通过模型内部机制直接“教导”模型,并开发了通过精确定位模型内部部分来更高效地重新训练模型行为的方法。公司表示,其中一项应用使大型语言模型的幻觉现象减少了一半,并认为该方法有望推动AI构建范式转变,使模型行为能够被更精准、高效地引导。
Goodfire表示,本轮融资将用于打造“模型设计环境”,即一个用于理解、调试并有意设计大规模AI模型的平台。公司称,该平台将利用可解释性技术帮助用户深入模型内部,识别影响行为的关键部分,并对相关子单元进行特定训练或干预。公司同时表示,将继续开展基础模型理解与新型可解释性方法的研究。
在团队方面,Goodfire称其成员包括来自DeepMind与OpenAI的AI研究人员,以及哈佛、斯坦福等高校学者和来自OpenAI、谷歌的机器学习工程人才。公司提到的成员包括OpenAI可解释性团队核心贡献者Nick Cammarata、Google DeepMind可解释性团队创始人兼联合创始人Tom McGrath,以及加州大学圣地亚哥分校教授Leon Bergen(休假中)。
