生成式AI新工具Diffusion-DFL:在不确定性中重塑决策优劣格局

生成式人工智能过去主要因生成图像和文本而受到关注,如今它正逐步走向更“务实”的一面——帮助各行各业在不确定环境下做出更优的规划与决策。佐治亚理工学院的研究人员近日提出了一种全新的决策聚焦学习(Decision-Focused Learning,DFL)模型 Diffusion-DFL,并在多项实验中证明其性能明显优于现有方法。

与传统方法相比,Diffusion-DFL 不仅在决策准确性上占优,而且在问题规模增大、结构更复杂时,优势更加突出。更重要的是,它在保持高性能的同时显著降低了对计算资源的依赖,使中小企业和资源有限的团队也有机会使用这一新工具来优化产出、降低成本并控制风险。实验结果显示,该模型在多个不同领域均表现稳定可靠。

Diffusion-DFL 的核心基于扩散模型——这正是驱动 DALL·E 等图像生成系统的关键技术。它是首个将扩散模型系统性引入 DFL 框架的工作。相关研究论文目前已发布在 arXiv 预印本平台上。

项目负责人、佐治亚理工学院博士生赵子豪表示:“任何需要在不确定性下做出高风险决策的人,包括供应链管理者、能源系统运营者和财务规划师,都可以从 Diffusion-DFL 中获益。该模型不再围绕单一预测进行优化,而是同时评估多种可能情景,让决策更贴近真实世界的风险结构,也更加稳健。”

为验证 Diffusion-DFL 的实际效果,研究团队基于真实业务场景设计了多组实验,包括:

  • 工厂生产规划以满足未来产品需求
  • 电网调度以满足波动的能源需求
  • 股票市场投资组合的风险与收益优化

在上述每一种场景中,Diffusion-DFL 都比现有方法给出了更优的决策方案。尤其是在问题规模扩大、约束条件和不确定因素增多时,该模型的优势更加明显。这些结果表明,Diffusion-DFL 能够在噪声较多、信息不完备的环境中,依然做出关键且高质量的决策。

研究还发现,Diffusion-DFL 不仅准确,而且具备较强的工程可行性。由于扩散模型的训练通常需要大量算力和内存,团队专门设计了一种降低内存占用的技术,将训练成本削减了超过 99.7%。这使得更多研究者和行业从业者有机会在有限资源条件下尝试这一方法。

赵子豪介绍:“我们的评分函数估计器将 GPU 内存需求从 60 多 GB 降到约 0.13 GB,同时几乎没有牺牲决策质量,大幅减轻了对超大算力平台的依赖。我希望这能推动 Diffusion-DFL 进一步扩展到医疗等领域,在复杂且高度不确定的环境中实现快速决策。”

从更广泛的角度看,Diffusion-DFL 不仅是一个新的决策工具,也标志着 DFL 技术与生成式 AI 模型应用方式的一次转变。在典型的供应链管理场景中,规划人员需要先预测未来需求,再据此决定库存水平。这类问题本质上就是 DFL 问题:工程师需要让机器学习模型与既定的决策目标(如降低风险、减少成本)保持一致。

传统 DFL 方法的一个关键局限在于,它们往往围绕单一、确定性的预测进行优化,而现实世界充满不确定性和波动。Diffusion-DFL 采取了不同的思路:它不试图给出一个“唯一正确”的未来,而是生成一系列可能结果,并在这些情景之上进行决策,从而避免将全部决策押注在单一预测上。

为实现这一点,Diffusion-DFL 采用扩散模型作为基础。扩散模型是一类生成式 AI 模型,能够从图像、文本、音频等数据中学习分布,并生成高质量样本。其正向过程是不断向真实数据中注入噪声,直至数据完全变为噪声;在训练完成后,模型可以学习如何“逆转”这一过程,从纯噪声出发逐步还原出结构化的信息和洞见。

现实世界的数据往往充满噪声和不确定性,这正是传统 DFL 方法的薄弱环节,而扩散模型恰好擅长在这种环境下建模。因此,Diffusion-DFL 能够在多种可能结果之间进行探索和权衡,选择更具优势的行动方案。类似于图像生成模型可以处理多源复杂数据,Diffusion-DFL 也能支持跨行业、跨数据类型的决策任务。

计算科学与工程学院助理教授王凯指出:“扩散模型在生成式 AI 和图像合成领域已经取得了非常显著的成功,但我们的研究表明,它们的潜力远不止于此。Diffusion-DFL 的独特之处在于,让具体的下游应用来指导模型如何学习处理不确定性。”

他补充说:“无论是为电网调度能源、平衡金融投资组合的风险,还是构建医疗预警系统,我们都可以有针对性地训练这些表达能力极强的模型,使其适应各个领域独特而复杂的不确定性结构。”

Diffusion-DFL 由赵子豪和王凯联合加州理工学院博士生 Christopher Yeh、哈佛大学博士后 Lingkai Kong 共同开发。Kong 于 2024 年在佐治亚理工学院获得计算科学与工程专业博士学位。

王凯将代表团队在 2026 年 4 月 23 日至 27 日于里约热内卢举行的国际学习表征会议(ICLR 2026)上报告这一成果。ICLR 被广泛视为全球最具影响力的人工智能研究会议之一。

“ICLR 是 Diffusion-DFL 的理想发布平台,因为这里汇聚了最需要看到‘生成建模’与现实高风险决策之间桥梁的核心研究群体。”王凯表示。

“通过展示 Diffusion-DFL,我们希望推动社区重新思考扩散模型的传统训练范式,激发更多讨论:如何将生成式 AI 的训练目标,直接与真实世界的下游决策需求对齐。”


分享:


发表评论

登录后才可评论。 去登录