Anthropic最新研究:高性能AIの失敗は「ミスアラインメント」だけでなく“ごちゃごちゃ状態(Hot Mess)”にも要注意
AnthropicがICLR 2026採択論文で、高性能AIほど「一貫した誤った意図」ではなく「意味のない・一貫性のない挙動」による失敗が増える可能性を指摘。AI安全研究の前提を揺さぶり、推論の安定性や行動一貫性の評価が今後の重要テーマになると示した。
Anthropic 发布旗舰模型「Claude Opus 4.6」,企业级 AI 代理「Cowork」引发欧美 SaaS 股价大跌
Anthropic 推出新一代顶级大模型 Claude Opus 4.6,并加速布局企业级 AI 代理产品 Cowork。随着 Cowork 插件体系开放、与各类业务工具深度集成,市场对「AI 代理将侵蚀传统 SaaS 模式」的担忧升温,欧洲多家软件与 SaaS 企业股价承压下跌。
Impulse AI 发布自主机器学习平台:Kaggle 竞赛排名进入前2.5%
Impulse AI 宣布推出自主机器学习平台,称可帮助团队在无需编写代码或雇佣专业机器学习工程师的情况下构建、部署并监控生产级 AI 模型。该公司表示,其 AI 代理在 Kaggle 一项重点竞赛中位列前2.5%。
Apollo.io任命Matt Curl为首席执行官,创始人Tim Zheng继续担任董事会主席
Apollo.io宣布由Matt Curl即日起出任首席执行官。公司称,在其运营领导下,Apollo年经常性收入接近2亿美元,付费客户数近10万,并在近期实现强劲收入增长。
EdgeLake项目晋级至LF Edge第二阶段“Growth”
Linux基金会旗下LF Edge宣布,EdgeLake项目已从第一阶段“At-Large”晋级至第二阶段“Growth”,并引入模型上下文协议(MCP)实现AI对实时边缘数据的直接访问。
助力AI代理搜索,提升大型语言模型的最佳结果获取能力
EnCompass通过回溯和多次尝试执行AI代理程序,寻找大型语言模型(LLM)生成的最佳输出,帮助开发者更高效地使用AI代理。
Elastic 在推理服务中新增多语言重排序功能
Elastic 宣布在 Elastic 推理服务(EIS)上线两款 Jina 重排序模型,面向混合搜索与 RAG 场景提供低延迟、多语言相关性能力,并以托管 GPU 推理服务形式供用户使用。
法拉第未来成立机器人子公司并推出三款具身智能产品
法拉第未来在拉斯维加斯NADA展会宣布成立FF EAI-Robotics Inc.,发布FF Futurist、FF Master与FX Aegis三款类人及四足机器人,并同步开启销售与预订,首批交付计划于2月底启动。
人工智能能否助力寻找标准模型之外的新物理
人工智能在物理研究中的角色正从“数据处理工具”转向更主动的参与者:不仅承担粒子碰撞分类、探测器噪声清理等繁琐工作,也被用于在海量数据中寻找可能指向新现象的细微结构。研究人员对其寄予的期待之一,是借助机器的模式识别与搜索能力,在标准模型高度稳固、显著实验异常罕见的背景下,挖掘被忽视的偏差并更系统地探索广阔的理论空间。 从自动化处理到“发现伙伴” 长期以来,机器学习在高能物理等领域主要用于提升数据处理
SpaceX收购xAI:马斯克打造AI、火箭、卫星通信与移动通信一体化技术平台
SpaceX宣布收购马斯克旗下AI公司xAI,计划通过火箭、卫星互联网与AI计算的深度整合,在轨构建大规模AI数据中心,利用太阳能突破地面数据中心在电力与冷却上的瓶颈,并将这一基础设施延伸至月球、火星与深空探索。
人工智能用电激增推动能源路线再评估,聚变、地热与氢能等方案加速探索
人工智能训练与推理带来的用电需求正逼近电网承载边界,并由此引发对多种发电与供能路径的重新评估。随着大型模型训练耗电量被形容为可与小城镇用电规模相当,未来数年数据中心负荷增长的预测,促使公用事业公司、科技企业与研究机构加快讨论哪些能源供给方式在成本、部署速度与稳定性上更具可行性。与此同时,推动电力系统承压的算法也被用于聚变、地热、氢能与先进储能等方向的研发,试图将过去更接近“科幻”的选项转化为可用技
人形机器人「Pepper」获吉尼斯认证,软银推出搭载AI接待功能新机型「Pepper+」
软银机器人公司宣布,人形机器人「Pepper」被吉尼斯认定为“全球首款量产型人形服务机器人”,并同步发布强化AI接待与导览功能的新一代机型「Pepper+」。
