联系方式 Contact

天气在线(北京)气象科技有限公司

地址:北京市海淀区海淀西大街36号9层

电话:010-58995339

手机:18611808504

传真:010-58995339

网址:www.weatheron.cn

搜索 Search
你的位置:首页 > 新闻动态 > 热点新闻

综述 | 用于天气预测的深度学习模型中的归纳偏置

 2023-04-16 17:07:30  点击:

转载于 气象学家公众号  原创 Thuemmel et al. 



用于天气预测的深度学习模型中的归纳偏见

德国学者近年来目睹了大量基于深度学习的天气预测模型蓬勃发展,每个模型都有自己独特的深度学习配方。不禁让人思考,究竟是什么让这些模型如此层出不穷?他们梳理了100多篇论文,并写了这篇综述文章。

深度学习最近在地球科学领域获得了巨大的普及,因为它使我们能够制定复杂地球系统过程的纯数据驱动的模型。基于深度学习的天气预报(DLWP)模型在过去几年中取得了重大进展,以相对较少的计算成本实现了与既定的数值天气预报(NWP)模型相媲美的预测技能。为了训练准确、可靠和可操作的具有几百万个参数的DLWP模型,模型设计需要纳入适当的归纳偏置,以编码关于数据和建模过程的结构假设。如果选择得当,这些偏差可以使学习速度更快,对未见过的数据有更好的概括性。尽管归纳偏置在成功的DLWP模型中起着至关重要的作用,但它们往往没有被明确说明,而且它们对模型性能的贡献仍不清楚。在这里,我们回顾并分析了六个最先进的DLWP模型的归纳偏置,涉及到对五个关键设计元素的深入研究:输入数据、预测目标、损失成分、深度学习架构的分层设计以及优化方法。我们展示了这五个设计元素中的每一个的设计选择是如何与结构假设相关的。鉴于更广泛的DL社区的最新发展,我们预计DLWP的未来可能会看到更广泛地使用基础模型--通过自我监督学习在大型数据库上预先训练的大型模型--结合明确的物理学信息的归纳偏置,使模型甚至在更具挑战性的次季节到季节尺度上提供有竞争力的预测。

引用文章:

Thuemmel, J., Karlbauer, M., Otte, S., Zarfl, C., Martius, G., Ludwig, N., ... & Butz, M. V. (2023). Inductive biases in deep learning models for weather prediction. arXiv preprint arXiv:2304.04664.

PDF原文链接:

https://arxiv.org/pdf/2304.04664.pdf