ADeLe:高精度预测大型语言模型在全新任务上的表现
瓦伦西亚理工大学VRAIN与ValgrAI团队参与开发了ADeLe,一种可在模型部署前,以约90%准确率预测大型语言模型在未见过任务上能否成功的新方法,并能刻画其推理能力边界。
研究称浣熊为“解谜而解谜” 或助其适应城市环境
一项发表在《动物行为》期刊的研究显示,浣熊在没有额外食物奖励的情况下仍会持续破解装置,研究人员认为这反映出其出于信息探索的内在动机,有助于解释其在城市环境中的适应能力。
实验显示倭黑猩猩或具备“假装游戏”能力
一项以圈养倭黑猩猩Kanzi为对象的实验显示,其在区分真实与“想象”果汁和葡萄时表现出稳定偏好,被研究人员视为猿类具备想象力线索之一。
