许多工程难题的核心问题在于变量过多且测试机会有限。无论是调试电网还是设计更安全的汽车,每次评估都成本高昂,且可能涉及数百个变量。
以汽车安全设计为例,工程师需整合成千上万个零部件,众多设计选择都会影响车辆碰撞时的表现。传统优化工具在寻找最佳组合时往往力不从心。
麻省理工学院(MIT)的研究人员提出了一种全新方法,重新定义了经典的贝叶斯优化技术,能够处理数百个变量的复杂问题。在电力系统优化等真实工程基准测试中,该方法比现有主流技术快10至100倍找到最优解。
该技术基于一个经过大量表格数据训练的基础模型,能自动识别对性能提升最关键的变量,并反复聚焦以不断优化解决方案。基础模型是训练于海量通用数据上的大型人工智能系统,因而具备适应多种应用的能力。
研究团队的表格基础模型无需在求解过程中频繁重新训练,大幅提升了优化效率。且随着问题复杂度增加,该方法的加速效果更为显著,特别适合材料开发或药物发现等高要求领域。
计算科学与工程专业研究生、该技术论文的第一作者Rosen Yu表示:“现代AI和机器学习模型能够根本改变工程师和科学家构建复杂系统的方式。我们设计的算法不仅能解决高维问题,还具备复用性,可广泛应用于不同问题,无需从零开始。”
论文合作者包括前MIT博士后兼研究科学家Cyril Picard,以及机械工程副教授、MIT计算科学与工程中心核心成员Faez Ahmed。该研究成果将在国际学习表征会议上发布。
优化经典方法的新突破
科学家在面对复杂且评估代价高昂的问题时,常用贝叶斯优化法。该迭代方法通过构建代理模型,估计下一步探索方向,同时考虑预测不确定性,寻找系统最佳配置。
但代理模型需在每轮迭代后重新训练,面对庞大解空间时计算成本迅速攀升。此外,每遇新场景,科学家往往需从头建立模型。
为解决这些问题,MIT团队将生成式AI中的表格基础模型引入贝叶斯优化的代理模型环节。
Yu形象地比喻:“表格基础模型就像电子表格版的ChatGPT。它的输入输出都是表格数据,这在工程领域比语言数据更常见。”
类似于ChatGPT、Claude和Gemini等大型语言模型,该模型预先在海量表格数据上训练,具备处理多种预测任务的能力,且无需额外训练即可直接使用。

为了提升优化的准确性和效率,研究人员设计了一种技巧,使模型能识别设计空间中对结果影响最大的特征。
Yu解释:“汽车可能有300个设计指标,但若目标是提升安全性能,并非所有指标都关键。我们的算法能智能筛选出最重要的特征。”
具体做法是利用表格基础模型评估哪些变量或变量组合对结果影响最大,然后集中搜索这些高影响变量,避免无效探索。例如,若前端缓冲区尺寸增大显著提升安全评级,则该特征很可能是关键因素。
解决更大规模问题,获得更优解
Yu表示,团队面临的最大挑战之一是选出最适合任务的表格基础模型,并将其与贝叶斯优化算法有效结合,实现关键设计特征的识别。
“寻找最显著维度是数学和计算机科学中的经典难题,如何利用表格基础模型的特性解决这一问题尤为棘手。”
在搭建好算法框架后,研究人员将其与五种先进优化算法进行了对比测试。
在涵盖电网设计、汽车碰撞测试等60个基准问题中,该方法始终比其他算法快10至100倍找到最优解。
Yu补充:“随着问题维度增加,我们的算法优势愈发明显。”
不过,该方法并非在所有问题上都优于基线算法,比如机器人路径规划问题表现一般,可能是该场景在模型训练数据中覆盖不足。
未来,研究团队计划探索提升表格基础模型性能的新方法,并将技术应用于维度达到数千甚至数百万的超大规模问题,如海军舰船设计。
Ahmed指出:“这项工作标志着基础模型应用的更广泛转变——不仅用于感知或语言,而是作为科学工程工具中的算法引擎,使传统贝叶斯优化扩展到此前难以实现的规模。”
西北大学机械工程系主任、工程设计威尔逊-库克教授Wei Chen评价:“结合预训练基础模型与高维贝叶斯优化的做法,创新且极具潜力,显著降低了基于仿真的设计对数据的高需求,是推动先进设计优化更易于实际应用的重要一步。”
