联系方式 Contact

南京天气在线气象科技有限责任公司

地址:北京市海淀区海淀西大街36号9层

电话:010-58995339

手机:18611808504

传真:010-58995339

网址:www.weatheron.cn

搜索 Search
你的位置:首页 > 新闻动态 > 智慧气象

人工智能在气候预测领域应用初探(二)

 2024-02-07 10:46:39  点击:

转载于领略气象

刘冠州,唐伟

5.气候预测

5.1遥相关预测

Chattopadhyay等人2013年提出了一种基于自组织映射(Self-Organizing Map,SOM)算法的非线性聚类技术,用于识别马登-朱利安振荡(Madden Julian Oscillation, MJO)在其生命周期中的水平和垂直结构。MJOSOM描述不需要季节内带通滤波或主导模式的选择。SOM基于所选变量的状态相似性来定义MJO阶段。由SOM定义的给定MJO阶段的降雨相关变量的空间模式不同于其他阶段的模式。与其他MJO诊断方法相比,SOM具有其独特的特征,是提取MJO信号的可靠且有用的工具。

整个热带地区的地表温度变化表现出不同程度的空间一致性,然而这种一致性还没有得到很好的描述。大面积地理区域同时出现的多年高温异常有可能对粮食生产和社会发展产生不利影响。Yang等人2019年通过对过去六十年广泛温度测量之间的相关性进行聚类分析,发现70年代后期发生了重大变化。两个空间集群合并为一个主导的空间集群,因此,大多数热带陆地区域同时经历较暖的年份,确定了与太平洋年代际涛动(Pacific Decadal Oscillation ,PDO)的陆地热带联系。

Liess等人2017年提出沃克环流与北半球极地地区的温带波有关,在北半球冬季,这些波从中亚向东南传播到西太平洋暖池。波动模式类似于东大西洋-西俄罗斯模式,并影响厄尔尼诺-南方涛动(El NiñoSouthern Oscillation ,ENSO)区域。西西伯利亚平原和ENSO两个活动中心之间的三极模式表明,ENSO相对于全球海平面气压(Sea Level Pressure ,SLP)的背景状态与西西伯利亚平原有显著的负相关。由ENSO的两个作用中心的总和定义的与背景状态的相关性高于单独与任一ENSO中心的每一个成对相关性。这些中心由检测具有相似特征区域的聚类算法来定义。

厄尔尼诺/南方涛动(ENSO)的变化与一系列区域极端气候和生态系统影响有关。因此,稳健的长期预测对于管理政策反应将是有价值的。但是,尽管经过几十年的努力,提前一年以上预测ENSO事件仍然是个问题。Ham等人2019年研究表明,采用深度学习方法的统计预测模型可以在长达一年半的时间内产生熟练的ENSO预测。为了避开有限数量的观察数据,该研究首先在历史模拟上使用迁移学习来训练卷积神经网络(Convolutional Neural Network ,CNN),随后重新分析1871-1973年。在1984年至2017年的验证期间,CNN模型的Nino3.4指数的全季节相关技能远远高于当前最先进的动力预报系统。CNN模式在预测海面温度的详细带状分布方面也更好,克服了动力预测模式的弱点。热图分析表明,CNN模型使用物理上合理的前兆来预测ENSO事件。因此,CNN模型是预测ENSO事件和分析其相关复杂机制的有力工具。

5.2极端气候预测

在大型数据集中检测极端事件是气候科学研究中的一个主要挑战。当前极端事件检测算法建立在人类根据相关物理变量的主观阈值定义事件的专业知识之上。通常,多种相互竞争的方法会在同一数据集上产生非常不同的结果。气候模拟和观测数据中极端事件的准确描述对于理解气候变化内容中此类事件的趋势和潜在影响至关重要。Liu等人2016年首次将深度学习技术应用于气候极端事件检测。深度神经网络能够从标记的数据中学习一大类模式的高级表示。在这项工作中,我们开发了深度卷积神经网络(CNN)分类系统,并证明了深度学习技术在处理气候模式检测问题中的有效性。结合基于贝叶斯的超参数优化方案,深度CNN系统在检测极端事件方面达到了89%-99%的准确度。

对未来干旱的预测是评估干旱事件对重要水资源、农业、生态系统和水文的不利后果的有效缓解工具。使用机器学习算法的数据驱动模型预测是实现这些目的的有希望的原则,因为它们需要较少的开发时间、最少的输入,并且比动态或物理模型相对简单。Deo Sahin2015年使用1957-2008年训练的输入数据和2009-2011年期间预测的月度干旱指数,验证了一种计算简单、快速和有效的非线性深度学习算法,称为极限学习机(Extreme Learning Machine ,ELM),用于预测澳大利亚东部的有效干旱指数。预测指标证明了ELM在所有测试点优于ANN模型的性能。此外,ELM模型的学习速度比ANN模型快32倍,训练速度比ANN模型快6.1倍。ELM模型对干旱持续时间和严重程度的预测能力得到了提高,所以ELM是预测干旱及其相关特性的更快捷的工具。

降水不足引发的干旱受温度和蒸发蒸腾等各种环境因素的影响,导致缺水和作物歉收问题。在Park等人2016年的研究中,来自中分辨率成像光谱仪和热带降雨测量卫星传感器的16个基于遥感的干旱因素被用于监测美国不同气候区域 2000-2012 年生长季节的气象和农业干旱,时间尺度为112个月的标准化降水指数和作物产量数据分别用作气象和农业干旱的参考数据。通过随机森林、增强回归树等机器学习方法对16个基于遥感的干旱因素与现场参考数据之间的关系进行建模,这些方法在许多回归任务中被证明是稳健和灵活的。结果表明,随机森林产生了最好的性能用于标准化降水指数预测。

Belayneh等人2016年探讨了耦合机器学习模型和集成技术预测埃塞俄比亚阿瓦什河流域干旱状况的能力,探索了小波变换与自举和增强集成技术开发可靠的人工神经网络和支持向量回归模型用于干旱预测的潜力。小波分析被证明可以改善干旱预测并改善所有模型的预测结果。

5.3中国区域气候预测应用

夏季降水的季节预报对减少区域性灾害至关重要,但目前预报水平较低。Wang等人2021年基于中国科学院灵活全球海洋-大气-陆地系统有限体积2代版本模式(Flexible Global Ocean-Atmosphere-Land System Model finite volume version 2,FGOALS-f2)动力预报模式的环流场,开发了一种动力和机器学习混合(Dynamical and Machine Learning hybrid,MLD)的中国夏季降水季节预报方法。通过为三种机器学习方法选择最佳超参数以获得最佳拟合和最小过拟合,随机森林和梯度增强回归树方法的集合均值显示出以异常相关系数衡量的最高预测能力。该技能在历史交叉验证期(1981-2010)的平均值为0.34,在独立预测的10年期(2011-2020)的平均值为0.20,显著提高了400%的动态预测能力。减少过拟合和使用最佳动态预测在MLD方法的应用中都很重要,对这些方法的深入分析值得进一步研究。

与我国旱涝灾害密切相关的降水变化,每年影响着数十亿人。然而,比天气预报难度更大的次季节预报在很长一段时间内仍是气象服务的一个空白领域。为了提高中国降水的次季节预测精度,Wang等人2021年引入了机器学习方法,提前2-6周对中国降水进行预测,使用一种称为局部线性回归的非线性回归模型和多任务特征选择(Local Linear Regression together with Multitask Feature Selection ,MultiLLR)模型,选择21个气象要素作为候选预报因子来整合不同的气象观测数据。该方法通过多任务特征选择过程,自动剔除无关预测因子,建立预测方程。该方法可为中国降水的次季节预测提供有效的指导。通过在MultiLLR模型中加入另外三个因子,即北极涛动指数、西北太平洋季风指数和西北太平洋副热带高压指数,发现北极涛动能指数最大程度地提高对中国降水的预报能力,其次是西北太平洋副热带高压指数。此外,该模式和美国国家环境预报中心CFSv2模式的集合可以将CFSv2对中国降水的次季节预报技术提高近40%。这一工作表明,MultiLLR模式将有助于我国次季节降水的预测。

长江流域的中下游是中国人口最稠密的地区之一,洪水频繁。He等人2021年采用预测因子重要性分析模型对预测因子进行分类和筛选,并采用五种方法(多元线性回归(Multiple Linear Regression,MLR)、决策树(Decision Tree,DT)、随机森林(Random Forest,RF)、反向传播神经网络(Back Propagation Neural Network,BPNN)和卷积神经网络(CNN))对长江流域中下游夏季降水的年际变化进行预测。八个气候模型的预测被用于比较。在五种测试方法中,RF显示出最好的预测能力。当从冬季开始预测时,RFDT和气候模型都显示出比早春更高的预测技能,并且RFDTMLR方法都显示出比数值气候模型更好的预测技能。缺乏训练数据是限制机器学习方法性能的一个因素。未来的研究应该使用深度学习方法,充分利用海洋、陆地、海冰和其他因素的潜力,进行更准确的气候预测。

Fan等人2023年使用基于深度学习的堆叠式自动编码器进行非线性降尺度,以在早期压缩气候变量的自由度。研究从中国东部四个地区的夏季降水中提取气候因子特征,从中识别出影响各地区夏季降水的关键气候因子。在此基础上,采用包括机器学习方法中的随机森林在内的多种回归方法,构建各区域关键气候预测因子的预测模型。通过模型参数对预测结果的敏感性试验,确定了最佳模型参数。几年的预报表明,该方法对中国东部降水的预报有很高的技巧,特别是在中国南方。结果表明,该模型在区域预测中的异常一致性优于主流模式。与主流模式相比,华南地区的预测结果可提高10%以上。该方法在中国东部夏季降水预测中具有良好的应用前景。

尽管近年来取得了重大进展,但中国季节性降水的预报技术仍然有限。Jin等人2022年开发了一个基于深度学习的中国季节性降水统计预测模型。使用同期大气环流数据对模型进行训练,以学习季节性降水的分布。首先,用几个大气环流模型(GCM)的回报结果对其进行了预训练,对测试集的评估表明,预训练的模型基本上可以再现GCM预测的降水,其异常模式相关系数(Pattern Correlation Coefficients,PCCs)大于0.80。然后,利用ECMWF再分析资料(ECMWF Reanalysis v5,ERA5)资料和中国区域网格降水观测资料进行迁移学习,进一步修正模型中的系统误差。结果表明,以再分析得到的大气环流场作为输入,该混合模式对中国的季节降水模拟效果较好,PCC达到0.71。此外,还评估了使用GCMs预测的环流场作为输入的结果。总的来说,与原始的GCM输出相比,建议的模型在1-4个月的时间内将中国的PCC提高了0.10-0.13。这种深度学习模型在过去两年中已被中国气象局国家气候中心用于为中国夏季降水预测提供指导,并且表现非常好。

6.结语

随着人工智能的蓬勃发展,机器学习等关键技术领域都取得了长足的进步。通过人工智能强大的学习和计算能力,对不同的气候数据类型使用最为匹配的算法,捕捉气候大数据的潜在特征,通过人工智能模型训练获得最佳的预测结果,通过上文的梳理可以发现国内外的大量专家学者都已取得显著的研究进展。

但目前人工智能气候预测的准确率、稳定性、预测产品多样化与精细化需求等方面还需进一步的提高。第一,需要与更多的气候模式产品相结合,比如区域气候模式产品和大气环流模式产品等,进一步提高人工智能气候预测产品的时空分辨率,进而提升气候遥相关、极端气候、集合预报等气候预测产品的质量。第二,需要在气候预测中引入随着人工智能技术发展而更为成熟、先进的深度学习方法,进一步拓宽升级人工智能气候预测的技术数字工具箱,提高气候预测的准确性。

总的来说,人工智能在气候预测领域大有可为,应将人工智能充分融入气候预测,进一步提升气候预测技术和能力,以帮助人类更好地应对日益复杂的区域、全球的气候变化和极端气候事件。

(本文推送前略有修改)

END

—————————————————————————————————

来源 |中国信息化,2023,(10):29-35

作者单位 | 中国气象局气象发展与规划院

编辑 | 冯裕健