图片丢失啦 机器学习方法在气象学领域的应用虚拟专刊

    随着人工智能的飞速发展,机器学习方法在气象学领域的应用日益广泛且深入,为气象预报、气候模拟及数据分析带来了革命性的变化。为了全面展示机器学习方法在本领域的最新进展与研究成果,我们特别策划并推出了气象学中机器学习方法虚拟专刊。

    本虚拟专刊涵盖了从基础理论探索到实际应用案例的广泛内容。我们精心挑选了一系列高质量论文,这些论文不仅深入探讨了机器学习方法在气象数据处理、特征提取、模式识别及预测建模等方面的最新进展,还展示了这些技术在提高气象预报精度、优化气候模拟过程以及推动气象科学研究深入发展方面的巨大潜力。在本专刊中,您将看到利用深度学习、神经网络、支持向量机等多种先进机器学习算法对气象现象进行精准预测与模拟的最新研究成果。这些研究不仅解决了传统物理模型在复杂大气系统预测中的局限性,还通过融合物理机制与数据驱动的优势,实现了对气象现象的更高精度、更高效率的模拟与预测。此外,本专刊还特别关注了机器学习在气象数据预处理、分类与表征、时间序列分析等方面的应用,为气象学家提供了更加丰富多样的数据处理与分析工具。这些工具的应用不仅提高了气象数据的利用价值,还促进了气象科学研究的深入与拓展。

    我们相信,本气象学中机器学习方法虚拟专刊的推出,将为广大气象学者、机器学习研究者以及相关领域的专业人士提供一个交流思想、分享成果的重要平台。我们期待通过这些优秀的研究成果的展示与传播,进一步推动气象学与机器学习技术的融合发展。

默认 最新文章 浏览次数  
Please wait a minute...
选择: 显示/隐藏图片
  • 基于LightGBM机器学习算法的江西气温短期预报模型研究
  • 孙康慧, 肖安, 夏侯杰
  • 2024, 43 (6): 1520-1535. DOI: 10.7522/j.issn.1000-0534.2024.00035
  • 摘要 (552) PDF (8093KB) (152)
  • 为进一步提高站点气温的预报精度, 增强对极端气温的预报能力, 本研究利用2017 -2019年江西省91个国家站地面观测数据和ECMWF模式高空和地面预报数据, 基于LightGBM机器学习算法和MOS预报框架, 建立了江西省24 h国家站日最高(低)气温预报模型。2020年评估结果表明: LightGBM模型日最高(低)气温预报和观测变化趋势一致, 年平均预报效果优于ECMWF、 CMA-SH9、 CMA-GFS三家数值模式、 RF和SVM两种机器学习产品以及主观订正产品。从预报误差的时空分布来看, 模型冬、 春季日最高(低)气温预报误差略大于夏、 秋季; 日最高气温预报误差呈现“南大北小、 周边大于中心”的空间分布特征, 日最低气温则与之大致相反。从重要天气过程来看, 在高温过程中, LightGBM模型在七种产品中预报效果最优; 在强冷空气过程中, LightGBM模型预报效果仍优于三家数值模式产品和另外两种机器学习模型, 但日最低气温预报效果不如主观订正产品。针对强冷空气过程中低温预报误差进行简单经验订正后, 模型低温预报效果与主观订正产品接近。模型重要性分析显示临近地面观测特征对模型建立也有较大贡献, 该结果可以为模式改进和气温预报产品研发提供参考。目前, LightGBM模型气温预报产品已应用于江西省气象业务。

  • 基于高分辨率数值预报和深度学习的地面气温预报研究
  • 李浙华, 肖安, 郑丽君
  • 2024, 43 (2): 464-477. DOI: 10.7522/j.issn.1000-0534.2023.00073
  • 摘要 (588) PDF (4222KB) (203)
  • 基于2020 -2021年的中国气象局(CMA)陆面数据同化系统(CLDAS)逐小时地面气温(T2m)产品, 融合CMA上海快速更新循环数值预报(CMA-SH3)的T2m预报数据, 构建深度学习语义分割模型(MT-Cunet), 实现逐小时滚动更新的24 h T2m网格预报, 并对2022年预报结果进行了检验评估。结果表明, 在研究范围内, MT-Cunet在3~9 h时效订正效果最好, 平均MAE和平均RMSE分别降低42.4%、 40.89%; 10~24 h时效的订正效果较好, 平均MAE和平均RMSE分别下降26.7%、 26.3%。低温(≤0 ℃)和高温(≥35 ℃)事件检验评估表明, MT-Cunet在高温预报整体表现为正偏差, 而低温整体为负偏差, 但误差幅度远低于CMA-SH3; 空间尺度上, MT-Cunet能较大幅度减少复杂地形下的T2m预报误差, 降低CMA-SH3的MAE离散度, 使预报误差分布较为稳定。通过对2022年2月和3月的区域性增温、 寒潮过程分别进行检验评估发现, MT-Cunet能较好预报出增(降)温转折时间和增(降)温幅度。在增温和寒潮过程中, MT-Cunet的MAE比CMA-SH3分别降低28.9%和33.8%, 表明MT-Cunet模型在转折性天气过程中同样具有较好的预报能力。因此, 利用可以快速增加预报样本数量的快速更新循环数值预报, 经过语义分割深度学习模型客观方法订正, 就能较大幅度降低数值模式预报误差, 解决常规数值预报由于数据量太少, 深度学习训练效果较差的问题, 这对充分利用国产模式资源, 更广泛地开展国产模式后处理和应用提出了一个新的思路。

  • 基于机器学习的中国夏季降水延伸期预报及土壤湿度的可能贡献
  • 叶宇辰, 陈海山, 朱司光, 董寅硕
  • 2024, 43 (1): 184-198. DOI: 10.7522/j.issn.1000-0534.2023.00025
  • 摘要 (556) PDF (9551KB) (246)
  • 延伸期预报准确率较低的问题仍然是目前重要的科学难题, 做好延伸期预报对防灾减灾具有重要意义。本文利用机器学习方法开展了中国夏季降水延伸期(5~30天)预报试验, 并探讨了土壤湿度对降水延伸期预报的可能贡献。结果表明机器学习方法的预报结果准确率要比传统线性模型方法有较大改善, 且在诸多机器学习方法中, 以Catboost, Lightgbm和Adaboost三个机器学习模型为最优。进一步分析发现长江流域表层土壤湿度异常导致的蒸发异常和感热异常, 能够引起大气环流和垂直运动异常, 最终对夏季降水产生影响。使用三个最优的机器学习方法的集合计算出模型中各个预报因子的贡献率, 发现在长江流域的延伸期降水中, 局地土壤湿度主要在5~10天占主导作用, 而前期降水主要在10~15天占主导作用, 长江流域20~30天的延伸期降水基本上受到大尺度环流控制。还评估了非局地土壤湿度在延伸期降水中的作用, 发现中南半岛表层土壤湿度主要对15~30天的长江流域延伸期降水有重要贡献。将中南半岛表层土壤湿度加入到东北地区延伸期降水模型中, 发现对该地区延伸期降水预报准确率并无提升作用, 验证了机器学习模型的可用性。该研究为延伸期降水预测以及探究预报因子贡献率提供了一定的参考。

  • 基于随机森林和卷积神经网络的FY-4A号卫星沙尘监测研究
  • 姜红;何清;曾晓青;唐冶;赵克明;窦新英
  • 2021, 40 (3): 680-689. DOI: 10.7522/j.issn.1000-0534.2020.00060
  • 摘要 (640) HTML(11) PDF (6249KB) (325)
  • 利用归一化差值沙尘指数NDDI(Normalized Difference Dust Index)、 随机森林RF(Random Forests)和卷积神经网络CNN(Convolutional Neural Networks)算法结合对地静止风云四号气象卫星(FY-4A)中多通道扫描成像辐射计AGRI(Advanced Geostationary Radiation Imager)数据对塔里木盆地沙尘进行监测研究。结果表明, AGRI数据计算得NDDIAGRI沙尘指数在监测沙尘时, 需要针对不同时间的AGRI数据取不同的阈值; 并且对云和陆地的交错区域, 以及一些植被覆盖和荒漠交错区域存在错误识别。RF建立的沙尘监测模型, 测试样本精确度(Precision)、 召回率(Recall)、 F1-score的值都达100%, 训练样本的交叉验证精度平均值为99.5%; CNN模型中, 训练样本和测试样本的精确值(Accuracy)和损失函数值(Loss)都分别为99.9%和0.1%; 因此RF和CNN模型都具有较强的沙尘监测能力。在实际沙尘监测中CNN相比RF在识别沙尘与非沙尘交界处更加精确, RF和CNN在沙尘识别过程中都易将部分沙尘与云混合区域以及戈壁错误识别成沙尘。
  • 基于卷积门控循环单元神经网络的临近预报方法研究
  • 陈训来;刘军;郑群峰;李旭涛;刘佳;姬喜洋;陈元昭;叶允明
  • 2021, 40 (2): 411-423. DOI: 10.7522/j.issn.1000-0534.2020.00023
  • 摘要 (736) HTML(10) PDF (12357KB) (416)
  • 基于天气雷达资料的外推预报是灾害天气0~2 h临近预报基础, 本文以业务应用为目标, 应用广东省2015 -2018年11部新一代多普勒雷达反射率拼图资料, 研究了基于卷积门控循环单元神经网络ConvGRU的临近预报方法, 采用多损失函数加权与分级加权的策略, 基于ConvGRU框架建立三层自编码模型(Encoder-Decoder)的雷达回波临近预测模型, 进行未来2 h逐6 min、 连续20帧雷达回波图的预测, 并与业务上已经应用的交叉相关法、 光流法和粒子滤波法的临近预报结果对比, 进行典型个例分析和长时间检验。结果表明, 基于ConvGRU方法对强对流天气具有较好的预报效果, 对雷达回波位置、 强度和形状与实况更接近, 表明深度学习方法通过对时间序列数据的学习, 能较好地把握强回波区域的特征, 在一定程度上能够相对比较准确地预报较强回波范围, 但该方法预报雷达回波图像存在损失空间细节信息的局限, 且对层状云降水的预报效果较差; ConvGRU方法的临界成功指数(CSI)和命中率(POD)评分高于传统的交叉相关法、 光流法和粒子滤波法, 且虚警率(FAR)评分为最小, 在业务中具有广泛的应用前景。
  • 机器学习算法对涡动相关缺失通量数据的插补研究
  • 王少影;张宇;孟宪红;宋敏红;尚伦宇;苏有琦;李照国
  • 2020, 39 (6): 1348-1360. DOI: 10.7522/j.issn.1000-0534.2019.00142
  • 摘要 (701) HTML(6) PDF (11880KB) (248)
  • 受观测系统故障、 质量控制与质量保证等因素影响, 涡动相关系统的长期观测常存在大量缺失。本文利用三种机器学习算法(随机森林RF, 支持向量机SVM, 人工神经网络ANN)和国际通量网络边缘分布抽样法(MDS)方法对若尔盖高寒湿地生态系统研究站2016年感热(H)、 潜热(LE)以及净生态系统交换(NEE)通量序列进行了插补。结果表明: RF算法的模拟能力优于SVM和ANN算法; 三种机器学习算法的模拟能力在夜间和日出、 日落时段以及冬、 春季节相对较弱; 插补方法的选择对HLE的年累积量无显著影响, 但其对NEE年累积量可造成-42 gC·m-2的差异。
  • BP神经网络在估算模式非系统性预报误差中的应用
  • 李虎超;邵爱梅;何邓新;王越亚
  • 2015, 34 (6): 1751-1757. DOI: 10.7522/j.issn.1000-0534.2014.00120
  • 摘要 (589) PDF (1562KB) (1198)
  • 基于数值天气预报误差在时间上的相依性,采用BP神经网络方法建立预测数值模式非系统性预报误差的模型,并利用2003 2007年T213模式分析场和24 h高度预报场资料验证了该模型的预测能力,结果表明:所建立的3层BP神经网络模型对未来24 h的非系统性预报误差有较好的预估能力,对大多数样本而言所估测的非系统性预报误差的分布特征和其真值较为一致。BP神经网络模型估测的非系统性预报误差可以在系统性预报误差订正的基础上进一步对预报做出修正,其订正效果好于仅进行系统性预报误差订正的效果。
  • 基于BP神经网络的张掖国家湿地公园水域结冰厚度预报模型
  • 刘洪兰;张俊国;阙龙凯;郑学金;保佳志
  • 2014, 33 (3): 832-837. DOI: 10.7522/j.issn.1000-0534.2013.00051
  • 摘要 (486) PDF (1175KB) (894)
  • 利用2011年12月-2012年3月张掖国家湿地公园水域结冰厚度观测资料和张掖观象台的气温、 地温等资料,借助BP神经网络可以逼近任意非线性函数的能力和特点,构建了用于短期预报水域结冰厚度的模型,并验证该模型的预报效果。结果表明,BP神经网络预报模型能够对水域结冰厚度进行有效的短期预报,该结冰厚度的预报模型对结冰厚度的预报效果较理想.流动水域结冰厚度预报历史拟合率高达96.8%,模型试报准确率为85.7%;静止水域结冰厚度预测历史拟合率达87.8%,模型试报准确率为80.0%,其性能指标符合实际要求,具有实际应用价值。
  • 地基微波辐射计遥感大气廓线的BP神经网络反演方法研究
  • 刘亚亚;毛节泰;刘钧;李峰
  • 2010, 29 (6): 1514-1523.
  • 摘要 (259) PDF (833KB) (998)
  • 讨论了12通道地基微波辐射计遥感反演温度、 相对湿度和云液态水廓线的BP神经网络反演方法, 利用探空资料, 对北京春、 夏、 秋、 冬四个季节的大气廓线进行神经网络训练, 并对训练好的网络的反演能力进行数值检验, 分析了反演精度; 对北京南郊观象台12通道微波辐射计的观测亮温资料进行实际反演, 结果表明, 神经网络(BPNN)反演的廓线与微波辐射计自带RadiomeNN的相比更加接近实际。
  • 人工神经网络及支持向量机在降雨量预报中的应用
  • 张乐坚-;程明虎-;田付友
  • 2010, 29 (4): 982-991.
  • 摘要 (220) PDF (1124KB) (1078)
  • 使用误差反向传播网络(BPN)和约当网络(JN)两种人工神经网络(ANN)以及支持向量机(SVM)对降雨量进行了1 h和3 h预报的研究, 并与交叉相关法(CCM)外推预报的结果进行了比较。针对安徽省2003年6~7月的降水过程, 比较了网络(文中指BPN、 JN和SVM)和CCM预报降雨量与实况降雨量的雨带分布、 强降雨区域和强度; 使用命中率(HR)、 虚警率(FAR)、 漏报率(NAP)、 临界成功指数(CSI)、 相关系数(CC)和均方根误差(RMSE)这6个指标并结合天气分析检验网络和CCM的预报效果。结果表明: 网络和CCM对雨带和强降雨区域的预报比较准确, 但是对强降雨中心位置和强度的预报与实况存在差异; 在使用HR、 FAR、 NAP和CSI检验预报效果时设定的阈值对预报结果的评价有影响; 预报的中小尺度结构与天气分析的结果一致; 网络与CCM以及不同的网络之间的预报结果存在着差异; 连续预报的结果表明, 与CCM相比, 网络对3 h预报的效果优于1 h的。
  • BP神经网络和支持向量机在紫外线预报中的应用
  • 胡春梅;陈道劲;于润玲
  • 2010, 29 (2): 539-544.
  • 摘要 (156) PDF (981KB) (895)
  • 为了提高紫外线预报准确率, 应用BP(Back Propagation Learning Algorithm)神经网络模型和支持向量机(Support Vector Machines, 简称SVM)回归方法建立重庆市主城区紫外线辐射强度客观预报模型。统计相关分析结果显示, 不同季节影响紫外线辐射强度的主要因素并不相同。对所有相关分析因子用逐步回归方法, 按方差贡献大小筛选出预报因子, 以每日紫外线平均辐射量为预报对象, 分季节建立预报模型。比较用不同方法建立的预报模型发现, 两种非线性模型(BP模型和SVM模型)的拟合能力优于线性逐步回归模型, 但独立样本检验结果表明, 3种模型的预报准确率基本相当。将3种方法所建预报模型应用T213数值预报资料进行业务试报, 得到较好预报效果。
  • 模糊神经网络方法在热带气旋强度预报中的应用研究
  • 黄小燕;史旭明;刘苏东;金龙
  • 2009, 28 (6): 1408-1413.
  • 摘要 (172) PDF (1221KB) (935)
  • 以1960-2007年共48年6月份西行进入南海海域的热带气旋样本为基础, 将热带气旋中心附近最大风速作为台风强度, 以气候持续预报因子作为模型输入, 采用模糊神经网络方法, 进行了热带气旋强度预报模型的预报建模研究。结果表明, 对175个独立预报样本模糊神经网络方法的南海热带气旋强度24 h的预报平均绝对误差为3 m·s-1。另外, 根据相同的热带气旋样本及预报因子, 还进一步将该预报方法与国内外普遍采用的气候持续法热带气旋强度预报方法进行对比分析, 结果表明, 气候持续预报方法的预报误差明显偏大, 独立样本强度预报平均绝对误差为4.54 m·s-1。
  • BP神经网络在多普勒雷达降水量的估测中的应用
  • 邵月红;张万昌*;刘永和;孙成武;傅成玉
  • 2009, 28 (4): 846-853.
  • 摘要 (218) PDF (2702KB) (926)
  • 利用2005年4次降雨过程的多普勒雷达体扫的回波强度资料及相应的雨量计观测资料, 通过BP神经网络方法来估测临沂地区的降雨量, 同时以改进的最佳窗概率配对法建立的Z-R关系估测的降雨量为对照, 进一步验证BP神经网络方法的优越性。根据各个站点的平均相对误差、 均方根差、 相关系数和相关曲线斜率4个指标的比较, 小时雨量和累计降雨量估测结果表明: BP神经网络估测精度要明显优于Z-R关系式, 训练样本的精度高于检验样本的精度, BP神经网络估测的降雨量与站点实测雨量吻合性较好, 能够较真实地反映地面降雨情况; Z-R关系式估测的降雨量随着雨强的不同表现为不同程度的低估现象。
  • 人工神经网络在西藏中短期温度预报中的应用
  • 马学款;普布次仁;唐叔乙;林志强
  • 2007, 26 (3): 491-495.
  • 摘要 (250) PDF (299KB) (474)
  • 根据2003年11月-2005年10月西藏自治区32个站点的气象资料,采用动态学习率BP算法的人工神经网络建模,在ECWMF、T213等模式数值预报产品释用基础上,进行1~7天逐日最高、最低温度模拟预测。模型业务试用结果表明,该神经网络模型具有较强的自适应学习和非线性映射能力,其预报结果能够满足实时预报的精度要求,对西藏中、短期极端温度的实时业务预报具有较好的参考价值。
  • 基于遗传算法的神经网络短期气候预测模型
  • 金龙;吴建生;林开平;陈冰廉
  • 2005, 24 (6): 981-986.
  • 摘要 (233) PDF (283KB) (788)
  • 用遗传算法优化神经网络的连接权和网络结构,并在遗传进化过程中采取保留最佳个体的方法,进行短期气候预测建模研究。该方法克服了由于神经网络初始权值的随机性和网络结构确定过程中所带来的网络振荡,以及网络极易陷入局部解问题。作为应用实例,以广西全区4月份平均降水作为预报量及前期500 hPa月平均高度场,海温场高相关区作为预报因子,建立基于遗传算法的神经网络短期气候预测模型。将这种方法与传统的逐步回归方法作对比分析,结果表明,该方法具有预报精度高,稳定性好的特点。
  • 月降水量的神经网络混合预报模型研究
  • 金龙;罗莹;王业宏;李永华
  • 2003, 22 (6): 618-623.
  • 摘要 (218) PDF (244KB) (494)
  • 以均生函数表征预报量自身周期变化,结合500hPa月平均高度场和月平均海温场预报因子,采用神经网络方法建立了一种新的短期气候预报模型。分别以广西桂北、桂中和桂南6月降水量作为预报对象进行预报试验,结果表明,这种新的预报方法比均生函数回归预报模型及高度场、海温场预报因子的回归预报模型,具有更好的物理基础和预报能力。
  • 神经网络在气象观测资料优化中的应用研究
  • 曹晓钟;王强
  • 2002, 21 (1): 96-101.
  • 摘要 (242) PDF (230KB) (408)
  • 利用一种改进的BP算法,对气象观测资料进行优化处理,并把神经网络方法看作是时间序列方法的扩充。利用该算法提出了基于空间相关、时间相关、模式相关三种资料优化处理方案,为气象观测资料的优化提供了一条新方法。利用文中的方法,对黑河地区的观测资料进行了修正实验,取得了比较满意的结果。
  • 基于神经网络B-P算法的雹云识别模型及其效果检验
  • 李祚泳;邓新民;张辉军
  • 1994, 13 (1): 44-49.
  • 摘要 (368) PDF (209KB) (483)
  • 本文根据成都、内江和泸州等地的雷达回波和部分探空资料,应用神经网络B-P算法建立了不同地区的3参数和4参数雹云识别模型,并对模型进行了分析和效果检验。结果表明:该模型不仅能得到较高的拟合率和预报准确率,而且由于B-P网络具有自组织、自学习和自适应的能力,与其它方法相比具有一定的优越性。