联系方式 Contact

南京天气在线气象科技有限责任公司

地址:北京市海淀区海淀西大街36号9层

电话:010-58995339

手机:18611808504

传真:010-58995339

网址:www.weatheron.cn

搜索 Search
你的位置:首页 > 新闻动态 > 热点新闻

基于深度学习模型的1公里分辨率的近地面风速和温度的区域降尺度

 2023-10-22 18:56:08  点击:

原创 辽月 AI气象大模型

近期复旦大学伏羲大模型团队和阿里巴巴达摩院团队联合发表论文:Investigatingtransformer-basedmodelsforspatialdownscalingandcorrectingbiasesofnear-surfacetemperatureandwindspeedforecast,实现了近地面风速和温度1公里分辨率的区域降尺度。详情如下:

背景

近地面气象预报,例如2米温度和10米风速等,在研究和应用中扮演着关键角色。目前,全球数值预报模式(NWP)受限于计算资源、计算时间、物理参数化方案等因素,其空间分辨率相对较低,例如,欧洲中期天气预报(ECMWF)的确定性预报(HRES)的空间分辨率为0.1。然而,很多应用需要更高的空间分辨率,尤其是在地形复杂的地区。因此,需要采用降尺度的方法,以从低分辨率的NWP预报中获取更高分辨率的数据。传统的降尺度方法包括动力和统计降尺度。动力降尺度方法依赖于高分辨率的区域数值预报模式,其输出各个变量结果物理意义上一致,同时能够适用于任意区域。然而,动力降尺度的缺点是它需要消耗大量的计算资源和时间,而且精度受初始场和边界条件的准确性以及区域模式本身的误差所限制1。统计降尺度方法则是通过数据驱动的方式,从大量的历史数据中学习低分辨率模式变量和观测数据之间的映射关系。统计降尺度方法的优势在于其计算效率高,能够在一定程度上订正模式误差。然而,其不足之处在于通常基于简单的统计方法和平稳性假设,这可能导致该方法的结果会随着时间的推移变得不够准确,有时可能产生不合理的结果2。由于机器学习视觉领域中的超分辨率技术和气象领域中的降尺度过程具有相似之处,因此,越来越多的超分辨率模型被应用于气象降尺度。然而,与超分辨率领域不断采用最新的深度学习模型以提高精度不同,气象降尺度所采用的超分辨率模型大多仅限于基于卷积神经网络(CNN)的模型2-5CNN模型的局限性包括仅能处理局部信息以及使用固定大小的卷积核。而基于transformer的超分模型的优势在于其是可以捕获图像中的长距离像素依赖关系,根据局部内容动态调整权重,相当于使用大小可变的卷积核。

此外,以前的研究工作在使用机器学习模型进行空间降尺度时,通常使用的同源的高分辨率和低分辨率的数据,即从高分辨率数据中采样并合成低分辨率数据。然而,在实际的降尺度应用中,低分辨率数据为NWP的预报数据,而高分辨率数据则是观测数据的格点数据。因此,模型不仅需要提高空间分辨率,还需要订正低分辨率预报数据的误差。

本研究的主要贡献在于采用基于transformer的模型,包括SwinIRUformer,用于对近地面变量进行空间降尺度,并与基于CNN的模型进行对比。我们采用NWP数据作为输入,格点观测数据作为真值。这种数据来源的设置更符合实际应用场景,尽管也更具挑战性。此外,我们引入了地形特征提取模块和多分辨率特征融合模块,以进一步提高了Uformer的精度。

数据

本次研究选取的数据区域为蒙东区域,空间范围涵盖39.6N46N,以及111.6E118E。内蒙古省拥有中国最丰富的陆上风能资源6,其中蒙东区域的风资源密度超过了3507。作为真值的格点观测数据采用中国气象局(CMA)研发的陆面数据同化系统CLDASV2.0,其空间分辨率为0.01(https://data.cma.cn/data/cdcdetail/dataCode/NAFP_CLDAS2.0_RT.html)。CLDAS采用陆面模式和资料同化等方法融合了多个观测数据源,包括地面站和卫星等8

模型输入数据采用了ECMWFHRES,其空间分辨率为0.1,时间分辨率为1小时,起报时间为12UTC。高分辨率地形数据则通过WRFgeogrid.exe将GTOPO30的数据插值到研究区域以获取。

方法

Uformer模型通常应用于图像复原任务,其输入和输出的分辨率相同。因此,为了适应不同分辨率的输出结果,我们对原模型结构的输出部分进行了改进,引入了pixelshuffle。此外,考虑到地形数据在降尺度中的重要性,我们在原Uformer结构的基础上,设计了一个地形数据特征提取模块,用于从高分辨率地形数据中提取不同分辨率的特征(如图1和图2中的红线所示)。同时,我们引入了一个多分辨率特征融合模块,将不同分辨率的信息融合在一起(如图1中的蓝线所示),以进一步提高模型精度。

1.基于Uformer的降尺度框架图

2.高分辨率地形数据特征提取模块

结果

以下两个表格总结了各种机器学习模型在所有测试集上,针对2米温度和10米风速的各项指标上的平均值。尽管UNet模型具有最多的参数,但其在2米温度方面的表现较差,而在10米风速方面略优于RCAN模型。而基于transformer的两个模型,SwinIR和Uformer,在各个指标上都要优于基于CNN的UNetRCAN模型。其中,Uformer模型在所有指标上均表现最佳,它通过引入对高分辨率地形数据特征提取和多尺度特征融合后,进一步提升了模型的精度。两个表格均表明,Uformer模型在同时使用地形数据特征提取模块和多分辨率特征融合模块时表现最佳。