CHEEM 框架让已训练 AI 学会新任务且不丢旧本领

richlovec 1500_400 (1)
 

新框架让 AI 学新任务不“遗忘”旧任务

一种名为 CHEEM 的新框架,使已经训练好的人工智能模型在学习新任务时,仍能保持在旧任务上的原有表现不下降。同时,CHEEM 还能通过减少执行简单任务时的计算步骤,提升模型整体运行效率。

北卡罗来纳州立大学计算机工程系副教授、论文通讯作者吴天福表示:“CHEEM 解决了人工智能模型长期面临的两个难题:持续学习和自适应智能。”相关研究已发布在 arXiv 预印本平台上。

持续学习与自适应智能的双重挑战

持续学习 指的是人工智能模型在部署后持续吸收新数据、掌握新任务的能力。现实中的难点在于:一旦为了新任务对模型进行再训练,模型在原有任务上的表现往往会明显变差,这被称为“灾难性遗忘”。

自适应智能 则是指模型能根据任务复杂度动态调整自身的计算过程。例如,许多当前流行的 AI 模型(包括大型语言模型)在处理不同难度的任务时,往往都执行同样长度、同样复杂的计算链,这会造成大量不必要的计算开销。理想状态是:简单任务用更少计算,复杂任务用更多计算,但要让模型学会这种按需分配计算资源的能力并不容易。

吴天福指出:“我们认为这两个问题是相互关联的。只要能提升模型的持续学习能力,就有机会在自适应智能上取得突破。这正是 CHEEM 的核心思路。”

CHEEM:持续层次探索-利用记忆

CHEEM 的全称是 Continual Hierarchical-Exploration-Exploitation Memory(持续层次探索-利用记忆)。该框架的关键在于,让模型在学习新任务时可以灵活地“重组”自身的计算结构:

  • 可以直接复用已有层;
  • 可以对已有层进行适度修改;
  • 可以在必要时跳过某些层;
  • 也可以为新任务新增全新的层。

通过这种层级上的“重用—适应—新增—跳过”机制,模型能够在以下几方面取得平衡:

  • 充分利用已有知识;
  • 有效吸收新数据;
  • 根据任务难度合理分配计算资源。

在视觉变换器上的实验验证

为验证 CHEEM 框架的效果,研究团队选择了当前主流的 视觉变换器(Vision Transformer) 作为测试对象。这类模型规模大、结构复杂,已在视觉任务中被广泛应用。

研究人员基于 CHEEM 对视觉变换器进行训练,并采用了两个具有代表性的基准数据集:MTILVDD

“这两个基准都非常具有挑战性,因为它们不仅任务数量多,而且任务类型多样,非常适合作为测试案例。”吴天福介绍道。

实验结果显示,在这两个基准上,CHEEM 的表现都明显优于当前最先进的持续学习方法。

“在新任务上,CHEEM 的表现几乎达到了完全微调的上限,也就是说,它的效果接近于为每个新任务单独训练一个专用模型。”吴天福说。

自适应智能的提升:按任务难度“调结构”

除了持续学习性能的提升,CHEEM 还显著增强了模型的自适应智能。模型会根据任务的复杂程度,自动调整自身的计算结构,而且这种调整具有清晰的语义含义:

  • 当新任务与以往任务相似时,模型会大量复用已有的网络层;
  • 当新任务与过去的任何任务都差异较大时,模型则倾向于为该任务新增专门的层来完成学习。

这意味着,模型不仅能“记住”旧任务,还能在结构层面做出有针对性的调整,从而在效率和性能之间取得更好的平衡。

未来方向与会议发表

“我们对 CHEEM 展现出的潜力非常期待。”吴天福表示,“目前,我们正在寻找合作伙伴,帮助我们获得足够的计算资源,以在拥有数十亿参数的大型基础模型上系统评估 CHEEM 的表现。”

这项经过同行评审的研究论文题为:

《CHEEM:通过重用、新增、适应和跳过实现持续学习——一种层次探索-利用方法》

论文将于 2026 年 6 月 3 日至 7 日,在美国科罗拉多州丹佛市举行的 IEEE/CVF 计算机视觉与模式识别会议(CVPR 2026) 上正式发表。


分享:


发表评论

登录后才可评论。 去登录