新研究显示,基于大量通用时间序列数据训练的“基础模型”可能在缺乏或没有当地水文记录的情况下,仍能对河流流量作出较为准确的预测,从而为数据有限地区的洪水预警、干旱规划和水资源管理提供支持。
这项研究发表在《Machine Learning: Earth》期刊,由德克萨斯大学奥斯汀分校与Hydrotify LLC的研究人员共同完成。

研究人员指出,在全球许多地区,河流测量站点数量有限、记录不完整,监测网络也难以长期维护。由于缺少可靠的长期数据集,一些社区在洪水来临前几乎没有预警,对干旱风险的掌握也较为有限,同时缺乏用于指导水资源分配与基础设施规划的工具。在气候压力加剧的背景下,如何在不依赖大量本地历史记录的前提下提供可用预测,重要性进一步上升。
在方法上,团队评估了多种被称为时间序列基础模型(TSFMs)的人工智能模型。这些模型最初使用能源、交通、气候等领域的时间序列数据进行训练,随后在一个覆盖美国500多个流域的大型河流数据集上进行测试。

结果显示,其中一款名为Sundial的模型表现几乎与一种在数十年河流流量记录上完全训练的长短期记忆(LSTM)模型相当。研究还发现,相关人工智能模型在季节性特征显著的流域中表现更为突出,例如以融雪驱动为主的径流过程。
德克萨斯大学奥斯汀分校及Hydrotify LLC的亚历山大·孙博士表示,可靠的水资源信息对全球社区至关重要,但许多地区仍缺乏传统预测方法所需的长期记录;此类新型人工智能工具展示了弥合数据缺口、扩大基于数据预测能力覆盖面的可能性。他同时指出,在更复杂的河流系统中仍有改进空间,但相关工作指向了在长期被忽视地区实现更好预测的方向。

作者还提到,时间序列基础模型的能力会随着训练数据规模扩大而提升。随着未来几代TSFMs纳入更多地球科学数据(包括水文与气候记录),其在实际水资源预测中的应用价值可能进一步增强。
研究团队成员还包括德克萨斯大学奥斯汀分校本科生Albert Sun。