联系方式 Contact

南京天气在线气象科技有限责任公司

地址:北京市海淀区海淀西大街36号9层

电话:010-58995339

手机:18611808504

传真:010-58995339

网址:www.weatheron.cn

搜索 Search
你的位置:首页 > 新闻动态 > 热点新闻

重磅!GenCast:基于机器学习的全球中期天气预测新突破

 2024-01-04 14:06:31  点击:

转载于 ClimAI智慧气象

这篇文章名为《GenCast: Diffusion-based ensemble forecasting for medium-range weather》。它介绍了GenCast,这是一种基于机器学习的生成模型,用于天气预测的集合。GenCast采用了一种新颖的基于扩散的方法来生成全球范围的15天集合预测,并展示了机器学习在概率天气预测中的潜力。

GenCast通过模拟天气状态在时间和空间上的联合概率分布,生成的全球15天集合预测比欧洲中期天气预报中心(ECMWF)的运行集合预测更准确,且速度更快。

一:引言

过去30年,天气预报从单一最佳猜测的确定性系统转变为基于数值天气预报(NWP)的随机集合预报。尽管这些集合预报在许多领域至关重要,但它们仍存在偏差和错误,并且计算成本很高。近年来,机器学习在中期预测方面取得了显著进展,但大多侧重于确定性预测和最小化均方根误差(RMSE),而相对忽视了不确定性量化和概率建模。

二:数据及其方法

GenCast使用的数据来自欧洲中期天气预报中心(ECMWF)的ERA5存档。所使用变量如下:

1 数据集中的ECMWF变量

GenCast是一种基于机器学习的概率天气预测模型。其核心是使用扩散模型,这是一种生成式机器学习模型,用于从给定数据分布中生成新样本。GenCast的过程开始于从一个噪声分布中抽样,然后通过学习去噪器迭代变换该样本,直到它接近目标分布的样本。

GenCast的特点在于它不是直接采样天气状态,而是采样与最近天气状态的残差,并通过加到最近状态来恢复当前状态。这种方法允许模型有效地生成多步天气预测,并通过生成多个预测样本来形成集合预测,从而提高预测的精确性和可靠性。

时间步长与预测范围: GenCast处理的每个天气状态包含特定时间间隔(12小时)内的数据,预测的时间范围为15天。

数据的空间表达: 使用1度经纬网格来表示数据,包括大气和地表变量。

概率分布的采样: 利用基于扩散模型的神经网络来模拟天气状态的联合概率分布,并从中进行采样。

2 GenCast示意图

三:结果

GenCast的预测能力通过与现有模型(如ECMWFENS)进行比较进行评估。总体而言,GenCast在多个方面显示出其优越性。

3 GenCastGraphCast状态可视化对比

4展示了GenCastGraphCast在特定湿度700hPa层的预测结果对比。结果显示,即便在长期预测中,GenCast生成的预测较为清晰。在连续排序概率得分(CRPS)和集合均值均方根误差(RMSE)方面,GenCast表现优于ENS,尤其是在超过36小时的预测时段。

此外,GenCast在极端事件预测上也显示了优势,其Brier分数优于ENS,展现了其在稀有事件预测方面的能力。

4 GenCastENSGraphCast-Perturbed三个模型在不同预测时长的球谐功率谱和风速变量上的表现

GenCast在长期预测中有效地保持了高频分量,而GraphCast-Perturbed则在长期预测中丧失了这些高频内容。在物理合理性方面,GenCast的预测能够更准确地模拟实际数据的高频特征,避免了模糊不清的预测结果,展现了其在细节保留上的优势。

5 GenCastENSGraphCast-Perturbed集合预测的可靠性和分散度评估

5表明GenCast在短期预测中略微过分散,但总体上与ENS相当,并且优于GraphCast-Perturbed

四:结论及其思考

GenCast是一个新型的全球中期(最长15天)天气预测方法,使用扩散模型从天气轨迹的联合分布中抽取集合样本。在关键技能指标(集合均值RMSECRPSBrier分数)上,GenCast的表现一致优于ECMWFENS系统。

GenCast能够在预测轨迹中很好地保持高频空间结构和物理一致性。其集合预测的可靠性高于或等同于ENSGenCast在计算效率上也表现出色,可以在短时间内生成大规模集合预测。尽管GenCast在分辨率和计算成本上还有提升空间,但它在基于机器学习的天气预测方面代表了重要的进步。