研究:用于排名最新大型语言模型的平台可能不够可靠
仅移除极少部分众包数据就能显著改变在线排名平台的结果,影响模型选择的准确性。
Impulse AI 发布自主机器学习平台:Kaggle 竞赛排名进入前2.5%
Impulse AI 宣布推出自主机器学习平台,称可帮助团队在无需编写代码或雇佣专业机器学习工程师的情况下构建、部署并监控生产级 AI 模型。该公司表示,其 AI 代理在 Kaggle 一项重点竞赛中位列前2.5%。
人工智能能否助力寻找标准模型之外的新物理
人工智能在物理研究中的角色正从“数据处理工具”转向更主动的参与者:不仅承担粒子碰撞分类、探测器噪声清理等繁琐工作,也被用于在海量数据中寻找可能指向新现象的细微结构。研究人员对其寄予的期待之一,是借助机器的模式识别与搜索能力,在标准模型高度稳固、显著实验异常罕见的背景下,挖掘被忽视的偏差并更系统地探索广阔的理论空间。 从自动化处理到“发现伙伴” 长期以来,机器学习在高能物理等领域主要用于提升数据处理
安东尼奥·托拉尔巴及三位麻省理工校友荣膺2025年ACM会士称号
托拉尔巴的研究领域涵盖计算机视觉、机器学习及人类视觉感知。
提升大型语言模型能力的新方法
MIT-IBM Watson AI实验室的研究人员开发了一种表达性更强的架构,能够在大型语言模型中实现更好的状态跟踪和长文本的顺序推理。
引导学习助力“不可训练”神经网络发挥潜能
麻省理工学院CSAIL团队发现,即使是被认为“不可训练”的神经网络,在另一网络的内在偏置引导下,也能实现有效学习。
麻省理工科学家研究临床人工智能时代的记忆风险
最新研究揭示了如何测试人工智能模型,确保其不会通过泄露匿名化患者健康数据而危害隐私。
人工智能如何优化电力网?三大关键问题解析
尽管人工智能日益增长的能源需求令人担忧,但某些技术手段也能助力电网更清洁高效。
为何必须超越过度汇总的机器学习指标
最新研究揭示了隐藏的错误相关性证据,并提出了提升模型准确性的方法。
人工智能方法推动定制酶设计进展
格拉茨工业大学与格拉茨大学研究团队在《自然》发表研究,提出Riff-Diff方法,可围绕活性中心从零构建蛋白质结构,实验显示所设计酶具备更高活性与更强稳定性。
新方法让人工智能像人类般推理,无需额外训练数据
加州大学河滨分校团队提出“测试时匹配”(TTM)方法,在不引入新训练数据的前提下,大幅提升多模态模型的组合推理能力,并在部分基准上超越更大规模模型。
研究:大型语言模型呈现人类式“我们与他们”群体偏见
新研究发现,多种主流大型语言模型会从训练文本中“继承”人类社会中的“我们与他们”偏见,并在默认与角色设定等不同条件下表现出对内群体更积极、对外群体更消极的语言模式。研究团队还提出了名为 ION 的缓解方法,可显著降低相关情感差异。
