近日发表在《科学》(Science)杂志上的一项研究显示,在极端天气预报方面,当前多款领先的人工智能(AI)天气模型整体表现仍不及传统的基于物理的数值预报模型。
研究比较多款主流AI模型
研究作者之一、日内瓦大学统计学教授塞巴斯蒂安·恩格尔克(Sebastian Engelke)表示,这些AI模型在许多预报任务上表现良好,但在极端事件这一对社会影响最大的领域仍存在明显不足。
该研究将包括 GraphCast 和 Pangu-Weather 在内的多款主流 AI 天气模型,与一个涵盖近期极端天气事件的数据库进行对比测试,以评估其在极端情形下的预报能力。
极端高温、强风和破纪录低温预测偏差明显
研究以 2020 年初西伯利亚破纪录高温热浪为例指出,这次热浪引发了大范围野火和永久冻土融化。研究显示,AI 模型在这一事件中往往低估了高温程度。此前有研究认为,在没有气候变化的情况下,这类热浪几乎不可能发生,全球变暖使其发生的可能性增加了 600 倍。
在极端风力和破纪录低温等情形下,AI 模型的预报准确性同样低于传统物理模型。研究认为,这一差距在极端、尤其是破纪录事件上表现尤为突出。
训练数据限制被指是关键原因
恩格尔克指出,当前 AI 天气模型主要基于数十年的历史观测数据进行训练,通过经验方式学习“今天的天气对应明天可能出现的天气”。
他表示,这类模型本质上是在复制过去出现过的情形,而破纪录极端事件往往在历史数据中缺乏先例或样本极少,训练集中缺乏相关信息,使得模型在此类情形下难以给出准确预报。
研究还指出,所评估的是一年前版本的 AI 模型,此后部分模型已引入概率预报等改进方法,以提升对多种可能结果的刻画能力。但研究认为,只要模型仍主要依赖既有历史数据进行训练,这一结构性问题在极端事件预测上仍难以完全消除。
相比之下,传统的基于物理的数值天气预报模型通过复杂数学方程模拟大气物理过程,更容易在理论上适应未在历史中出现过的新情形。研究同时强调,传统模型在极端天气预测方面也并非完美,但整体表现仍优于当前 AI 模型。

常规天气和一般极端事件中AI表现突出
研究同时指出,在更常见的天气预报任务,或在不超出历史观测范围的一般极端天气情形下,AI 模型可以优于传统物理模型。
今年早些时候,英伟达(NVIDIA)发布了其 AI 天气预报模型 Atlas,并展示了该模型在一个未专门训练过的极端事件——快速增强的风暴 Dennis(影响英国的气旋)上的表现。
英伟达气候模拟研究主管迈克·普里查德(Mike Pritchard)表示,通过对风速和气压梯度大小的可视化,可以清楚看到该模型能够真实捕捉强烈风暴和造成破坏的强烈气旋结构。他称,该模型在飓风路径预测方面也表现出较高准确度。
据介绍,一些气象机构、天气数据公司(如 Weather Company)以及保险公司,已开始将此类 AI 模型与传统物理模型结合使用,用于业务决策和风险评估。
探索提升极端天气预测能力的路径
针对当前 AI 模型在极端事件预测上的不足,研究人员正在探索改进方向。其中一条思路是向训练数据集中加入更多关于破纪录事件可能形态的信息。
普里查德表示,可以通过物理天气模型有针对性地生成特别极端的模拟事件,并将这些模拟结果与真实观测数据混合,纳入 AI 模型的训练集,以增强模型在“外推”到前所未见情形时的能力。
恩格尔克认为,相关技术正在快速发展。随着新一代模型不断推出,有必要对其进行系统的基准测试和独立评估。他指出,目前许多模型由科技公司开发,而这些模型将对公众生活产生重要影响,因此透明、可比的评估尤为关键。
研究结论显示,在可预见的阶段内,传统基于物理的天气预报方法仍难以被完全取代,尤其是在关系重大风险管理和公共安全的极端天气预测领域。
