CHEEM 框架让已训练 AI 学会新任务且不丢旧本领

科学 2026-05-23 人工智能, 持续学习, 自适应计算, 视觉变换器, CVPR 17 次浏览

新框架让 AI 学新任务不“遗忘”旧任务

一种名为 CHEEM 的新框架，使已经训练好的人工智能模型在学习新任务时，仍能保持在旧任务上的原有表现不下降。同时，CHEEM 还能通过减少执行简单任务时的计算步骤，提升模型整体运行效率。

北卡罗来纳州立大学计算机工程系副教授、论文通讯作者吴天福表示：“CHEEM 解决了人工智能模型长期面临的两个难题：持续学习和自适应智能。”相关研究已发布在 arXiv 预印本平台上。

持续学习与自适应智能的双重挑战

持续学习 指的是人工智能模型在部署后持续吸收新数据、掌握新任务的能力。现实中的难点在于：一旦为了新任务对模型进行再训练，模型在原有任务上的表现往往会明显变差，这被称为“灾难性遗忘”。

自适应智能 则是指模型能根据任务复杂度动态调整自身的计算过程。例如，许多当前流行的 AI 模型（包括大型语言模型）在处理不同难度的任务时，往往都执行同样长度、同样复杂的计算链，这会造成大量不必要的计算开销。理想状态是：简单任务用更少计算，复杂任务用更多计算，但要让模型学会这种按需分配计算资源的能力并不容易。

吴天福指出：“我们认为这两个问题是相互关联的。只要能提升模型的持续学习能力，就有机会在自适应智能上取得突破。这正是 CHEEM 的核心思路。”

CHEEM：持续层次探索-利用记忆

CHEEM 的全称是 Continual Hierarchical-Exploration-Exploitation Memory（持续层次探索-利用记忆）。该框架的关键在于，让模型在学习新任务时可以灵活地“重组”自身的计算结构：

可以直接复用已有层；
可以对已有层进行适度修改；
可以在必要时跳过某些层；
也可以为新任务新增全新的层。

通过这种层级上的“重用—适应—新增—跳过”机制，模型能够在以下几方面取得平衡：

充分利用已有知识；
有效吸收新数据；
根据任务难度合理分配计算资源。

在视觉变换器上的实验验证

为验证 CHEEM 框架的效果，研究团队选择了当前主流的 视觉变换器（Vision Transformer） 作为测试对象。这类模型规模大、结构复杂，已在视觉任务中被广泛应用。

研究人员基于 CHEEM 对视觉变换器进行训练，并采用了两个具有代表性的基准数据集：MTIL 和 VDD。

“这两个基准都非常具有挑战性，因为它们不仅任务数量多，而且任务类型多样，非常适合作为测试案例。”吴天福介绍道。

实验结果显示，在这两个基准上，CHEEM 的表现都明显优于当前最先进的持续学习方法。

“在新任务上，CHEEM 的表现几乎达到了完全微调的上限，也就是说，它的效果接近于为每个新任务单独训练一个专用模型。”吴天福说。

自适应智能的提升：按任务难度“调结构”

除了持续学习性能的提升，CHEEM 还显著增强了模型的自适应智能。模型会根据任务的复杂程度，自动调整自身的计算结构，而且这种调整具有清晰的语义含义：

当新任务与以往任务相似时，模型会大量复用已有的网络层；
当新任务与过去的任何任务都差异较大时，模型则倾向于为该任务新增专门的层来完成学习。

这意味着，模型不仅能“记住”旧任务，还能在结构层面做出有针对性的调整，从而在效率和性能之间取得更好的平衡。

未来方向与会议发表

“我们对 CHEEM 展现出的潜力非常期待。”吴天福表示，“目前，我们正在寻找合作伙伴，帮助我们获得足够的计算资源，以在拥有数十亿参数的大型基础模型上系统评估 CHEEM 的表现。”

这项经过同行评审的研究论文题为：

《CHEEM：通过重用、新增、适应和跳过实现持续学习——一种层次探索-利用方法》

论文将于 2026 年 6 月 3 日至 7 日，在美国科罗拉多州丹佛市举行的 IEEE/CVF 计算机视觉与模式识别会议（CVPR 2026） 上正式发表。

发表评论

登录后才可评论。去登录