可解释性

科学 2026-04-27

布朗大学团队发现，多种主流语言模型在内部表征中，已经自发形成与人类对事件合理性判断高度一致的结构化模式，显示出一种基础层面的“现实世界理解”。

科学 2026-04-08

研究团队通过在训练阶段直接引入公平性约束，利用多目标模糊遗传机器学习构建既重视准确性又兼顾公平性的人工智能模型，并在多项现实数据集上取得优于传统方法的表现。

AI 2026-03-09

一种新方法有望帮助用户在医疗诊断和自动驾驶等安全关键领域判断是否信任模型的预测结果。

AI 2026-02-07 小A聊AI

Goodfire宣布完成1.5亿美元B轮融资，由B Capital领投，估值达12.5亿美元。公司表示，资金将用于推进可解释性研究、开发下一代产品，并拓展在AI代理与生命科学领域的合作。