「预测神器」：基于深度学习的各种天气预报模型研究-天气在线（北京）气象科技有限公司-人工智能AI短临预报-AI模式修订与评估-气象大数据-气象数据服务

「预测神器」：基于深度学习的各种天气预报模型研究

2023-03-07 15:06:13 点击：

原创塔努什里·申外气象学家

基于深度学习的各种天气预报模型研究

由于其对全球人类生活的影响，天气预报引起了几位不同研究领域研究人员的兴趣。由于最近深度学习技术的发展，海量天气观测数据的广泛可用性以及信息和计算机技术的出现，许多研究的动机是探索大量天气预报天气数据集中隐藏的分层模式。ML技术已被应用于预测极端天气事件，识别观测和建模大气条件下的极端天气和气候模式，并为恶劣天气提供操作指导和风险评估。在过去的几年里，基于深度学习的天气预报模型得到了发展，如MetNet-2，WF-UNet，ClimaX，GraphCast，Pangu-Weather等。本文简要讨论了这些模型，以深入了解这些模型如何快速击败传统的气象模式。

ClimaX：天气与气候的基础模型

基于物理学的数值大气模型是当今天气和气候预报软件的支柱。这些技术模拟了非线性动力学和复杂的多变量相互作用，使它们的近似仍充满了挑战。以高精度空间和时间分辨率对大气过程进行数值模拟对计算要求很高。基于机器学习的最新数据驱动技术通过在深度神经网络中训练数据驱动的函数映射，直接处理下游预测或预测任务。这些网络缺乏数值模型的通用性，因为它们是在离散时空任务的有限和一致的气候数据上进行训练的。

微软自治系统和机器人研究，微软研究院AI4Science和加州大学洛杉矶分校的新研究提出了ClimaX，这是一种用于天气和气候科学的深度学习模型，可以在具有不同变量，空间和时间覆盖范围以及物理基础的不同数据集上进行训练。ClimaX使用CMIP6气候数据集进行无监督训练。为了在保持广泛可用性的同时增加计算能力，ClimaX 用新颖的编码和聚合块扩展了 Transformer。

在初始训练之后，climaX可能会被微调以执行广泛的气候和天气工作，包括那些涉及大气变量和不同时间和空间尺度的工作。即使在较低的分辨率和较少的计算预算下进行预训练，ClimaX 的通用性使其在天气预报和气候预测基准上的表现优于数据驱动的基线。

研究人员认为，这种方法的普遍性可能使其可用于更多样化的目的。这可能包括预测极端天气事件和评估人为气候变化，这是地球系统科学任务的两个例子，可以从已经预先训练的ClimaX骨干中受益。农业、人口学和精算科学也是有趣的候选人，因为它们与天气和气候密切相关。

盘古-全球天气预报

华为云计算团队推出基于深度学习的全球天气预报系统Pangu-Weather。该团队从 ECMWF 的第五代再分析 (ERA5) 中收集了 43 年的每小时全球气象数据，以创建数据驱动的环境并训练几个具有 2.56 亿个参数的深度神经网络。

这是第一种基于人工智能的方法，在所有变量（如地势、比湿度、风速、温度等）和所有时间尺度（从一小时到一周）的准确性方面优于尖端的数值天气预报（NWP）技术。使用分层时间聚合策略和将高度（压力水平）数据转换为立方数据的 3D 地球专用变压器（3DEST）架构来提高预测精度。中短程确定性预测是盘古的强项。天气（即预测时间范围从一小时到一周不等）。

Pangu-Weather提供了几种下游预报选项，例如热带气旋跟踪和实时大型集成预报。Pangu-Weather回答了基于AI的技术是否比NWP技术表现更好的问题，并为增强深度学习天气预报系统提出了新的建议。

该团队认为，他们的训练方法尚未达到完全收敛。还有空间增加观测组件的数量，将时间维度整合到4D深度网络的训练中，并使用更深和/或更宽的网络。所有这些都需要具有更多内存和 FLOP 的 GPU。因此，由于计算资源，未来的天气预报会更好。

多分辨率深度学习框架

极端天气事件严重威胁着人类生命和经济，每年造成数十亿美元的损失和数万人的生命损失。由于气候变化，其后果和强度预计将增加。不幸的是，作为气候预测的主要工具，环流模型（GCMs）无法充分定义极端天气。

来自Verisk Analytics，Otto-von-Guericke大学和麻省理工学院的一组科学家开发了一种多分辨率深度学习框架，以加速极端天气事件的模拟。为了消除偏差并提高GCM仿真的分辨率，他们将以粗分辨率执行的基于物理的GCM与在观测数据上训练的机器学习模型混合在一起。

主要成分是：

· 一种分而治之的训练策略，允许以高空间分辨率训练区域模型

· 强调极值和时空相干性的新型统计损失函数

· 球体上物理过程的紧凑、多尺度表示，可有效捕获跨尺度的能量转移。

决策者可以利用全尺寸去偏模拟来查看当前场景并衡量他们遭受灾难性天气灾害的风险，所有这些都具有任意的详细程度。

建议的架构使百万年的极端天气模拟成为可能，改善了灾害事件的量化。随着对全球模拟的需求不断增加，这些模拟可以解释跨多个地理位置和威胁的相互依赖性，研究人员认为这将有助于满足这一要求。

风场预报的实时偏差校正

欧洲中期天气预报中心（ECMWF;简称EC）预测可以作为开发海上灾害预警系统的基础，同时包含一些系统偏差。欧盟委员会第五代大气再分析（ERA5）数据高度准确;但是，已经晚了几天。EC和ERA5数据之间的非线性映射可以通过时空深度学习方法得到改进，从而允许EC进行更准确的实时风力预报。

中国海洋大学、国家海洋环境预报中心和朴茨茅斯大学最近的一项研究设计了一种多任务学习损失函数，可以使用单一模型来校正风速和风向。他们在多任务双编码器轨迹门控循环单元 (MT-DETrajGRU) 模型中实现了它，该模型采用增强的“双编码器预报器”架构来模拟时空序列风分量。西北太平洋 (WNP) 作为研究区域。从 2020 年 12 月到 2021 年 11 月的所有四个季节，EC 的 10 天风场预报都针对滚动偏差进行了实时校正。经MT-DETrajGRU模型调整后，四个季节的风速和风向偏差较EC原预报分别降低了8-11%和9-14%。

此外，所提出的技术在不同气候条件下一致地模拟了数据。这里构建的数据驱动模式具有弹性和可推广性，在正常和台风条件下的类似校正性能证明了这一点。该团队计划在未来的调查中将影响风场的其他变量（如温度，气压和湿度）纳入模型中。

使用天气模式预测风电场功率和下游尾流

ECMWF，波恩，伦敦帝国理工学院，英国气象局，埃克塞特和壳牌研究有限公司的一项新研究建立了一种新的风能工作流程，首次展示了如何将复杂的数值天气预报模型与无监督聚类算法成功集成，以有效地对风电场功率和下游尾流进行准确的长期预测。此过程首先使用对 ERA5 再分析数据的无监督 k 均值聚类来识别天气趋势，以考虑区域和时间变化。为了计算集群功率输出和下游风电场尾流，使用集群中心的平均气象条件进行WRF模拟。

该分析确定了海上风能生产天气模式的最佳变量和域大小。在运行WRF仿真后，该团队将独特的后处理方法应用于集群仿真，以改善长期风力发电量和下游尾流预测。这种新方法允许在不运行模拟的情况下对海上风电场的电力和下游尾流进行多年和年代际估计。虽然先前的研究已经对下游风电场尾流进行了小规模检查，但这是通过提供精确和快速的长期预测来提高风电场位置知识来减少这些尾流的第一个工具。

通过将这种方法应用于两个案例研究区域，该团队表明，虽然花费了不到2%的计算工作量，但提出的长期预测与一年的WRF模拟非常一致。当对风速进行分组时，结果是最精确的。

GraphCast：提供高效的中程全球天气预报

从挑选服装到飓风发生时该怎么做，人们不断根据天气预报调整计划。人们依靠气象部门每天发布多达四次的“中程”天气预报来做出需要了解未来十天天气的决策。

DeepMind和谷歌最近的一项研究引入了GraphCast。这种基于 ML 的新型天气模拟器超越了世界上最精确的确定性操作中程天气预报系统和所有 ML 基线。GraphCast 自回归模型使用来自欧洲中期天气预报中心（ECMWF）的 ERA5 再分析档案的气象数据进行训练。该模型建立在神经图网络和新颖的高分辨率多尺度网格表示之上。它在赤道的分辨率约为25×25公里，可以每隔10小时为五个表面和六个大气变量创建6天的预报，每个表面和六个大气变量在37个垂直压力水平。

在 90.0% 的 2760 个变量和提前期组合中，GraphCast 的表现优于 ECMWF 的确定性运营预测方法 HRES。对于它报告的 252 个目标中的 99.2%，GraphCast 的表现优于之前最准确的基于 ML 的天气预报模型。借助 Cloud TPU v4 技术，GraphCast 可以在 60 秒内生成 10 天的预测（35 GB 数据）。

与更传统的预测技术不同，随着更多数据可用于训练，基于 ML 的预测可能很容易在规模和复杂性上增加。这项研究是基于ML的天气建模的重大进展。原则上，它可以应用于更广泛的环境和其他地理 - 空间 - 时间预测挑战，例如对各种气象因素以及季节和气候预测，野火，森林砍伐等进行建模。

WeatherFusionNet用于从卫星数据预测降水

深度学习方法最近提高了天气预报的准确性。布拉格捷克技术大学的研究人员在 2021 年人工智能惠及人类世界峰会挑战赛上展示了两种深度学习模型，用于预测极端天气的发生。

第一个模型sat2rad是基于U-Net的深度学习模型，用于估计当前卫星帧时间步的降雨量。该模型使用卷积神经网络的空间不变性预测整个卫星区域的降雨量，即使雷达数据仅适用于较小的区域。sat2rad模型分别应用于所有四个卫星帧以生成四个通道。

第二个模型PhyDNet是一个递归卷积网络，它将物理动力学与补充视觉输入分开。PhyDNet的两个分支处理物理动力学和残差信息以进行未来预测。由于比赛限制，PhyDNet接受了卫星数据而不是雷达框架的训练。为了进行预测，另一个U-Net将两个模型的输出与输入序列合并。

该研究表明，使用sat2rad和PhyDNet模型可以增加降雨预测。卷积神经网络的空间不变性有助于估计整个卫星区域的降雨量，即使雷达数据仅适用于较小的区域。

WF-UNet：用于降水临近预报的天气融合UNet

在设计针对恶劣天气及其后果（如城市洪水或山体滑坡）的预警系统时，必须对降水进行准确的短期预报（临近预报）。临近预报有多种环境用途，从农业管理到改善航空安全。

马斯特里赫特大学和乌得勒支大学之间的合作研究探讨了使用UNet核心模型以及该模型的扩展来提前三小时预测西欧降雨量的可行性。他们的研究提出了天气融合UNet（WF-UNet）模型，该模型建立在Core 3D-UNet模型的基础上，在训练过程中包括风速和降水等变量，然后分析这些因素如何影响预测降水的目标任务的性能。

使用来自欧盟地球观测计划哥白尼的 ERA5 数据集，该团队编制了 14 个欧洲国家六年（2016 年 1 月至 2021 年 12 月）的降水和风雷达图像，时间分辨率为 1 小时，空间分辨率为 31 平方公里.他们将提出的 WF-UNet 模型与持久性模型和其他使用单一降水雷达输入数据训练的基于 UNet 的架构进行了比较。根据调查结果，当时间范围为 1、2 和 3 小时时，WF-UNet 的 MSE 分别比分析的其他最佳性能设计低 22%、8% 和 6%。与传统的 UNet 模型相比，决策级融合在捕获存档雷达图像中包含的时空信息方面更胜一筹。由于其卓越的特征提取能力，WF-UNet 在短期临近预报方面优于其他经过测试的基于 UNet 的模型。

这项研究的所有功劳都归功于这个项目的研究人员。

翻译工具

1. Google Translate

2. Immersive Translate

水平有限，翻译如有不当，请见谅！

作者：塔努什里·申外

上一篇：没有啦
下一篇：促进气象产业发展的对策研究（二） 2023/3/1