基于Catboost和Stacking融合模型的 长江中下游短时临近降水预报研究
来源:宋慧娟,等
摘 要
Abstract
用中国自动站与CMORPH降水产品融合的逐小时降水量网格数据集、全球预报系统(Global Forecasting System, GFS)模式再分析资料,将机器学习特征算法筛选的特征变量作为模型输入数据,运用Catboost模型和以Catboost和随机森林为初级模型、径向基神经网络为次级模型的融合模型预测未来6 h累计降水等级,并应用公平TS评分(Equal Threat Score,ETS)、真实技巧评分(True Skill Statistic,TSS)、混淆矩阵、预报偏差(Bias值)、击中率(Probability of Detection,POD)对预报结果进行检验分析。结果表明:优化变量的输入有利于提高模型的准确率;Catboost模型和融合模型都可以在一定程度上辨别晴雨状况;仅非动力学变量参与的融合模型对雨区预报准确率最高,但容易将暴雨雨区预报得更加广泛。总体而言,融合模型具有更强、更稳定的预报性能,中到暴雨量级预报准确率还待进一步提高。
关键词
Keywords
中文关键词:
机器学习
短时临近预报
长江中下游
降水
融合模型
英文关键词:
machine learning
short-range forecast
the middle-lower reaches of the Yangtze River
precipitation Stacking model
文内图片
图1 模拟区域及地形
图4 Stacking集成学习算法
图7 6月24日(b—d) 00—06时、(f—h)06—12时和(j—l)12—18时的6 h累计降水量级Catboost模型预报结果: (a、e、i) 实况; (b、f、j)输入动力学变量预测; (c、g、k)输入非动力学变量预测; (d、h、l)输入完整变量预测