融合地形特征和神经网络的日最高/最低气温预报订正方法研究

卢姝; 许霖; 顾雪; 周悦; 戴泽军; 陶雅琴

doi:10.7522/j.issn.1000-0534.2025.00081

高原气象 >

2026 , Vol. 45 >Issue 2: 500 - 514

DOI: https://doi.org/10.7522/j.issn.1000-0534.2025.00081

融合地形特征和神经网络的日最高/最低气温预报订正方法研究

卢姝 ^,¹^,²^,³^,⁴ ,
许霖 ^,¹^,²^,³^,⁴ ,
顾雪 ⁵ ,
周悦 ⁶ ,
戴泽军 ¹^,²^,³^,⁴ ,
陶雅琴 ¹^,²^,³^,⁴

展开

^1. 气象防灾减灾湖南重点实验室，湖南长沙 410118
^2. 湖南省气象台，湖南长沙 410118
^3. 洞庭湖国家气候观象台，湖南岳阳 414000
^4. 中国气象局高影响天气（专项）重点开放实验室，湖南长沙 410118
^5. 湘西州气象局，湖南吉首 416000
^6. 中国气象局武汉暴雨研究所/暴雨监测预警湖北省重点实验室/中国气象局流域强降水重点开放实验室，湖北武汉 430205

许霖（1983 -），女，湖南长沙人，正高级工程师，主要从事灾害性天气客观预报方法研究. E-mail： railin@126.com

卢姝（1997 -），女，湖南浏阳人，工程师，主要从事天气预报技术研发相关工作. E-mail： lushu0818@163.com

收稿日期: 2025-03-16

修回日期: 2025-07-01

网络出版日期: 2026-01-26

基金资助

湖南省气象局重点项目(XQKJ22A005)

湖南省气象台青年创新基金项目(QNJJ202501)

武汉市自然科学基金项目(2024020901030454)

收起

Research on Daily Maximum and Minimum Temperature Forecasts by Integrating Terrain Features and Neural Networks

Shu LU ^,¹^,²^,³^,⁴ ,
Lin XU ^,¹^,²^,³^,⁴ ,
Xue GU ⁵ ,
Yue ZHOU ⁶ ,
Zejun DAI ¹^,²^,³^,⁴ ,
Yaqing TAO ¹^,²^,³^,⁴

Expand

^1. Hunan Key Laboratory of Meteorological Disaster Prevention and Reduction，Changsha 410118，Hunan，China
^2. Hunan Meteorological Observatory，Changsha 410118，Hunan，China
^3. Dongting Lake National Climatic Observatory，China Meteorological Administration，Yueyang 414000，Hunan，China
^4. Key Laboratory of High Impact Weather（special） China Meteorological Administration，Changsha 410118，Hunan，China
^5. Xiangxi Meteorological Bureau，JiShou 416000，Hunan，China
^6. China Meteorological Administration Basin Heavy Rainfall Key Laboratory/Hubei Key Laboratory for Heavy Rain Monitoring and Warning Research，Institute of Heavy Rain，China Meteorological Administration，Wuhan 430205，Hubei，China

Received date: 2025-03-16

Revised date: 2025-07-01

Online published: 2026-01-26

Copyright

Fold

摘要

日最高、最低气温的预报是天气预报业务的重要组成部分，其精度提升对保障社会经济活动具有重要意义。针对数值模式在复杂地形区域系统性偏差显著的问题，本研究以湖南省为试验区（具有“凹”字形三级阶梯地貌，涵盖山地、丘陵、平原等多种下垫面类型），提出一种融合地理特征聚类的深度学习改进方案。基于欧洲中期天气预报中心（European Centre for Medium Range Weather Forecasts， ECMWF）模式预报场、中国气象局陆面数据同化系统（CMA Land Data Assimilation System， CLDAS）再分析数据和地理变量，首先构建基准卷积神经网络CNN模型并针对地形特征处理策略设置三类对照实验：方案1（K-means聚类地理变量）、方案2（标准化非聚类地理变量）及方案3（无地理变量）。对比实验表明，方案1对24 h最高/低温度平均绝对误差MAE较方案3分别降低4.7%/9.4%，较方案2预报技巧提升2.5%/1.4%，证实地理特征聚类处理对模型性能具有显著增益。因此，优选方案1发展了未来72 h气温预报CNN-TC（Terrain Correction）模型。该模型表现出显著预报优势：相较ECMWF产品，最高/低温MAE降幅达23.5%~37.3%/20.8%~26.9%；较中央气象台指导预报产品SCMOC，最高/低温度误差降低18.7%~27.6%/26.8%~32.3%，其中24 h预报时效下，最高/低温度空间分布MAE区间由1.2~5.8 ℃/0.8~5.9 ℃（ECMWF）降低至0.9~1.7 ℃/0.8~1.7 ℃，区域稳定性大幅提升。分月检验表明， CNN-TC模型在所有月份均保持最优性能， MAE相对降幅覆盖5.6%~59.1%（最高温度）和6.3%~47.8%（最低温度）。典型强天气过程检验中，模型成功捕捉2022年11月寒潮过程的降温特征，较ECWMF和SCMOC表现均为最优，显示出优异的极端天气应对能力。本研究证实通过深度学习耦合地形特征聚类，可有效解决数值模式在复杂下垫面区域的系统性偏差问题，为山地气候区精细化气象服务提供了可靠的技术方案。

关键词： 日最高/最低气温; 地理变量; 卷积神经网络; K-means方法

本文引用格式

卢姝 , 许霖 , 顾雪 , 周悦 , 戴泽军 , 陶雅琴 . 融合地形特征和神经网络的日最高/最低气温预报订正方法研究[J]. 高原气象, 2026 , 45(2) : 500 -514 . DOI: 10.7522/j.issn.1000-0534.2025.00081

Abstract

Accurate forecasting of daily maximum （T _max） and minimum （T _min） temperatures is essential for meteorological operational， as enhanced precision safeguards socioeconomic stability in agriculture， transportation and public health.To address pronounced systematic biases in numerical weather prediction models over complex terrain-particularly regions with heterogeneous underlying surfaces-this study develops an advanced deep learning framework integrating geographic feature clustering.The study focuses on China’s Hunan Province， characterized by a distinctive concave-shaped， three-tiered topography encompassing mountains， hills， basins， and plains.A baseline convolutional neural network （CNN） was constructed using ECMWF forecast fields， high-resolution CLDAS （China Land Data Assimilation System） reanalysis data， and multi-dimensional geographic variables （elevation， slope， aspect， terrain roughness index）.Three comparative experiments rigorously evaluated terrain-processing efficacy： Method 1 （K-means clustered geographic variables delineating topographic regimes）， Method 2 （Conventionally standardized non-clustered geographic variables）， and Method 3 （Geographic variable exclusion as terrain-agnostic control）.Validation confirmed Method 1's superiority， achieving 24-hour mean absolute error （MAE） reductions of 4.7% for T _max and 9.4% for T _min relative to Method 3， while improving forecast skill by 2.5% （T _max） and 1.4% （T _min） compared to Method 2.These statistically significant gains validate the benefits of explicit terrain feature clustering.Building on this approach， the CNN-Terrain Correction （CNN-TC） model was developed for 72-hour T_max/T _min predictions.CNN-TC framework delivers transformative improvements.Versus ECMWF outputs， T _max MAE decreased by 23.5%~37.3% and T _min MAE by 20.8%~26.9% across 24~72 hour lead times.Compared to operational SCMOC products， errors reduced 18.7%~27.6% （T _max） and 26.8%~32.3% （T _min）.Critically， the model compresses spatial error dispersion， narrowing 24-hour MAE ranges from 1.2~5.8 ℃/0.8~5.9 ℃ （ECMWF） to a stable 0.9~1.7 ℃/0.8~1.7 ℃ for T _max/T _min-demonstrating breakthrough operational stability.Monthly verification confirmed persistent superiority， with T _max MAE reductions of 5.6%~59.1% and T _min improvements of 6.3% to 47.8% relative to ECMWF.During the November 2022 cold-air outbreak， the model captured intricate spatiotemporal cooling patterns， outperforming ECMWF and SCMOC with over 30% error reduction， underscoring its capability in extreme weather.This study verifies that deep learning combined with terrain clustering effectively mitigates systematic biases over complex terrain.The CNN-TC framework establishes a robust solution for refined meteorological services in mountainous regions.Cross-regional implementation requires localized hyperparameter optimization and cluster retraining to address spatial heterogeneity in climate regimes and surface properties.

Key words： daily maximum and minimum temperature; geographic variables; Convolutional Neural Network; K-means algorithm

1 引言

近年来，为顺应精细化天气预报服务需求，天气预报业务正在进行重要改革，在中国智能网格预报业务成为主流趋势，传统站点预报已经转变为精细化格点预报（金荣花等， 2019；王丹等， 2023）。气温预报是精细化客观预报产品的重要组成部分，与人类生活、农业生产和水资源管理等密切相关，提升气温预报准确率一直是现代化天气业务发展的目标之一（潘留杰等， 2017；胡莹莹等， 2023）。数值天气预报模式是天气预报的主要手段，其利用大气、陆地和海洋物理参数之间的动态机制来预测气温。尽管数值模式通过同化技术和物理参数化持续改进，复杂地形区次网格尺度地形动力-热力效应的表征缺陷（薛海乐等， 2011），导致其难以完全准确地模拟复杂地形和局部天气现象，需要通过后处理手段提高气象要素预测精度（李浙华等， 2024）。传统模式后处理方法包括模式输出统计法（Model Output Statistics， MOS）方法（邱贵强等， 2023）和卡尔曼滤波方法（张玉涛等， 2020）等虽可部分修正此类误差，但其线性假设难以匹配大气系统的高度非线性特征。

深度学习方法可以有效处理高维气象数据，充分挖掘预报量与预报因子间的非线性关系，能够更好适应当前气象数据多样性的特点（朱育雷等， 2024；姚润进等， 2024）。在处理具有时空尺度的气象大数据时，许多学者利用循环神经网络（Recurrent Neural Networks， RNNs）和卷积神经网络（Convolutional Neural Networks， CNNs）进行建模（夏侯杰等， 2023）。其中CNN模型直接对网格预报产品订正，而不仅限于个别气象站点，能够自动学习数据中的空间特征和模式（Jiang et al， 2024），凭借其空间特征提取优势，在模式误差订正中展现出显著潜力（Han et al， 2021； Qin et al， 2023）。随着地形海拔的增加，改进效果逐渐减弱，在复杂地形山区的预报误差仍较大（Zhou et al， 2024）。由于2 m气温预报误差的来源具有显著的地形依赖性，近年来，学者们在深度学习模型构建中加入地理特征因子，取得了一系列成果（Zhang et al， 2023； Lian et al， 2024）。Liu et al（2023）将站点经纬度、海拔和地貌特征与数值模式输出预报因子进行组合，应用深度学习算法进行站点降水偏差订正，指出深度学习算法可以充分整合多个预报因子信息，以模拟大气条件和地理特征。其他研究也表明地理特征可以为模型提供重要的背景信息，使得模型能够更好地适应特定的环境和地理条件（Xu et al， 2024； Sønderby et al， 2020）。虽然其他下垫面因子（如植被覆盖等）可以通过调节地气能量交换间接影响气温，但其影响在复杂地形区域相对次要，空间分布也通常与地形特征相关（陈新明等， 2023），且相关数据还受遥感反演精度、时间更新频率以及数据缺失等技术的限制（Darabi et al， 2025），因此本研究优先考虑地形特征的应用。

然而现有研究在利用地理特征建模时，往往直接采用原始地理特征，难以捕捉不同地形类型对气象要素的差异化影响。为解决这一问题，本研究采用机器学习中的K均值（K-means）聚类算法对研究区域内的地理变量进行聚类分区，从而为模型提供更具气象意义的地形分区信息。相较于层次聚类， K-means算法的时间复杂度远低于层次聚类（Murtagh and Contreras， 2012），更适用于海量地理空间数据快速处理（管筝等， 2024； Guo et al， 2003）。此外， K-means算法不受局部地形噪声（如孤立山峰）的干扰，与基于密度的有噪声应用空间聚类（Density-Based Spatial Clustering of Applications with Noise， DBSCAN）算法依赖密度阈值相比，更适合捕捉地理变量中的全局结构模式（Schubert et al， 2017； Li et al， 2020）。与高斯混合模型相比， K-means的确定性分类能直接生成空间连续的同质子区域，避免了概率隶属度输出所需的二次阈值化，降低了业务系统的复杂性，同时提高了过程的可解释性（Vatsavai et al， 2011）。这些特性促使K-means算法在气象领域得到广泛应用，从天气分型（郭小芹等， 2022）到城市微气候模拟（Chang et al， 2021），均证实其对地理-气象关联规则的强大提取能力。

鉴于湖南地区的复杂地形特征，本文以湖南地区为研究区域，利用ECMWF预报产品和CLDAS气温网格融合分析产品，设计了加入地形条件的两种方案和未加入地形条件的方案三类分别构建不同的特征因子集来建模，选取最优特征方案建立0~72 h逐日最高/最低气温深度学习模型，从时间、空间等多角度检验分析了ECMWF和深度学习模型预报效果，旨在突破复杂地形区气温预报的“海拔衰减效应”，提高对最高和最低气温网格预报的精度，为复杂地形条件下的智能网格气温预报业务提供技术支持。

2 数据来源及预处理方法

2.1　数据来源

本文使用ECMWF高分辨率数值预报产品，起报时间为20:00（北京时，下同），预报时效为15~84 h，预报间隔为6 h，地面和高空要素水平分辨率分别为0.125°×0.125°和0.25°×0.25°。预报时段选取2018年1月至2023年6月。ECMWF预报产品接收时间相比实际起报时间延迟约7 h，对ECMWF模式后处理时需采用预报时效12 h之后的预报产品。此外， ECMWF预报产品中并不直接包含日最高、最低气温，利用逐6 h预报时效的过去6 h 2 m温度数据计算生成日最高、最低气温产品。除ECMWF外，选用中央气象台每日08:00下发的指导预报产品（SCMOC）的日最高、最低气温资料作为对照。

观测资料来源于CLDAS日最高/最低气温资料，水平分辨率为0.05°×0.05°，选取时间长度同为2018年1月至2023年6月。该产品利用数据融合与同化技术，对地面观测数据、卫星遥感资料和数值模式产品等多源数据进行融合同化，弥补了站点稀疏区域观测不足的问题，已经实现业务上实时运行，可以作为机器学习训练中的真值场（师春香等， 2019）。数字高程、坡向、坡度数据产品来源于地球观测数据源——美国航天飞机雷达地形测绘任务（Shuttle Radar Topography Mission， SRTM）数据集，空间分辨率90 m，可从地理空间数据云平台（https： //www.gscloud.cn/）下载。

订正区域为24.5°N -30.3°N， 108.7°E -114.4°E范围，包含整个湖南境内区域（图1）。该地区地形复杂，为三面环山、中部丘陵、北部平原的向东北方向开口的不对称马蹄形地貌，不同地形条件下气温分布差异较大，导致数值模式对该地区气温的预报偏差大。另外，文中涉及的地图是基于中华人民共和国自然资源部地图技术审查中心标准地图服务系统下载的审图号为GS（2016）1552的中国地图制作，底图无修改。

显示原图|下载原图ZIP|生成PPT

图1 湖南省地形图

Fig.1 Topographic map of Hunan

2.2　因子选择

选择合适的预测因子是建立深度学习模型的关键步骤之一，合适的预测因子可以降低模型复杂度，提升模型性能。孙康慧等（2024）在进行气温订正建模任务时，主要引入了反映大气环流背景场、温湿垂直廓线信息及具有其他物理意义的ECMWF地面和高空要素，例如不同气压层的温度、湿度、风速及风向等因子。本研究综合考虑相关研究成果（Zhong et al， 2024），选取了涵盖大气热力、动力因子在内的多维特征集，以期更全面地刻画影响气温变化的物理过程，具体选用特征见表1。由于历史观测数据包含了过去的气温趋势信息，对于未来气温的预测有一定的指示意义，因此加入临近观测因子（与预报日相比滞后2 d以及3 d的日最高/最低气温观测）作为特征因子（赵琳娜等， 2022）。另外，地貌地形会对大气运动和稳定性产生显著影响（Sun et al， 2019），本文加入地理变量（数字高程、坡度和坡向）作为地表特征因子。

表1 建模所选取的因子

Table 1 Predictors selected for modeling

因子类型	特征变量
ECMWF模式地面预报因子	日最高/最低气温、地面2 m温度、2 m露点温度、地表温度、10 m风速、10 m风向、平均海平面气压、对流有效位能、预报反照率、大气柱水总量、大气柱水汽总量
ECMWF模式高空预报因子	500 hPa、700 hPa和850 hPa位势高度、温度、比湿、风速和风向
临近观测因子	滞后2 d日最高/最低气温观测、滞后3 d日最高/最低气温观测
地理变量	数字高程、坡度和坡向

2.3　数据预处理

数据预处理步骤对模型精度的提高发挥着重要作用。在建模前，需要对预报与观测数据进行数据清洗。因ECMWF预报产品高空与地面要素空间分辨率不一致，本文采用双线性插值方法将上述产品统一插值至0.05°×0.05°分辨率，以匹配观测数据网格。ECMWF预报产品中存在少数日期缺失，采用线性插值方式填补时间序列中缺失数据，并从中挑选与观测数据对应的时间以保持预报与观测时间维度一致。由于数据集中的因子具有不同尺度，如果不经过处理会导致在较低尺度上重要因子的有效性被稀释，因此本文对所有因子进行标准化处理［式（1）］，标准化后的数值处于［0， 1］之间。

x * = x - X m i n X m a x - X m i n

（1）

式中： x和x*分别代表标准化前后的数据； X _max为样本数据的最大值； X _min为样本数据的最小值。

3 方法

3.1　 K-means聚类法

为了反映实际地理特征，将数字高程、坡度、坡向这几个因子作为聚类分区的依据，应用K-means聚类算法将研究区域内的格点划分为k个区域。具体做法（Hartigan and Wong， 1979）是以空间中k个中心进行聚类，对最靠近他们的对象归类，通过迭代的方法，逐次更新聚类中心的值，直至得到最好的聚类结果，实现的目标函数是：

m i n (c 1, c 2, ⋯, c k) ∑ i = 1 n d 2 [X i, C (X i)]

（2）

式中： c ₁， c ₂， …， c_k 分别为k个簇的中心； C（X_i）表示X_i 是所属类的中心点； d ²为X_i 与C（X_i）两点距离的平方。

本研究基于“肘部法则”确定最佳k值，图2（a）为不同k值对应的误差平方和（SSE）变化趋势，当k>3时， SSE随k值的下降速率明显减缓，表明增加更多簇对减少SSE的贡献变小，因此选定k=3为最优簇数。聚类分区结果可以较好反应湖南地形区划特征，区域-1主要分布在湘西、湘南山地山原区（平均高程813.30 m，坡度21.16°）；区域-2对应湘北、湘中平原区（平均高程97.71 m，坡度6.98°）；区域-3处于平原和山地的过渡地带，覆盖了湘西、湘南山丘区域（平均高程348.54 m，坡度16.35°）［图2（b）］。将聚类结果作为特征因子，并进行独热编码预处理，将离散数值的特征转换成一个只含有0和1的向量，以更好表达分类变量。获得的聚类地理特征可以作为神经网络的输入帮助建模。

显示原图|下载原图ZIP|生成PPT

图2 误差平方和随聚类数量的变化趋势（a）和基于地理变量的K-means聚类分区（b）

Fig.2 Sum of squared errors versus cluster number （a） and K-means geographic partitioning based on terrain variables （b）

3.2　卷积神经网络

卷积神经网络是一种人工神经网络模型，在图像和模式识别、自然语言处理以及语音识别等领域得到了广泛应用，其具有独特的特征提取能力，可以自动从输入图像中提取关键的空间特征。本文设计了多个卷积块组成的CNN模型（图3），将ECMWF预报因子、临近观测因子和地表特征进行组合输入模型，上述特征已经被上采样至与真值场一致的分辨率。模型主要结构如下：首先由尺寸3×3的卷积核、批标准化、修正线性单元（Rectified Linear Unit， ReLU）激活函数以及最大池化层组成卷积块，堆叠卷积块时逐步增加卷积核个数，分别为64、 128、 256、 512，将数据的局部信息转化为高阶特征图，实现对输入数据多层次、多尺度的特征提取。再逐步堆叠卷积核尺寸1×1的卷积块，卷积核个数分别为256、 128、 64、 32，逐步降低特征图维度，帮助不同通道之间进行信息交互整合，并减小模型参数量。最后连接全连接层，将高维特征映射到目标回归值上，输出最终预测结果。模型输入与输出均为相同尺寸［形状为（116， 116）］的格点场，模型能够在每个格点上进行偏差校正，以确保气温预报的准确性。

显示原图|下载原图ZIP|生成PPT

图3 CNN模型框架图

Fig.3 Architecture of the convolutional neural network （CNN） model

训练集时间设定为2018年1月至2022年3月，验证集时间为2022年4 -6月。在训练CNN模型时，本研究使用回归任务中通常采用的平均绝对误差（MAE）损失函数来寻找模型的最佳权重。由于自适应矩估计（Adaptive Moment Estimation， ADAM）算法在训练过程中具有快速、稳定的收敛性，因此选择ADAM作为优化器。采用早停法机器学习训练策略，当模型在验证集上连续3个时期损失值不降反增时，停止训练，以避免模型在训练集上过拟合。模型训练超参数设置见表2。

表2 模型训练超参数设置

Table 2 Hyperparameter configurations for model training

超参数	设置
学习率	0.001
优化器算法	ADAM算法
训练时期数	400
正则化方法	早停法
批量数	64
损失函数	MAE

3.3　检验方法

测试集时间为2022年7月至2023年6月，为评估ECMWF和各模型在测试集上预报性能，选用MAE、技巧评分（SS）以及预报准确率（ATF）作为检验指标，公式如下：

M A E = 1 n ∑ i = 1 n y^i - y i

（3）

S S = M A E E C - M A E D L M A E E C × 100 %

（4）

A T F = n r n × 100 %

（5）

式中：

y^i

、 y分别为模型预报值和观测值； MAE_EC 、 MAE_DL 分别代表ECMWF和模型的平均绝对误差； nr为|

y^i - y i

|≤2 ℃的样本数； n为总样本数； ATF是总样本中预测值与观测值之间的绝对差值不大于2 ℃的样本百分比。

4 结果与分析

4.1　不同特征组合方案对比

为验证地理变量在模型性能中的影响，本文设计了不同的特征组合方案。采用控制变量法，保持ECMWF预报因子和临近观测因子不变，分别利用三种不同的方案建模：方案一引入经过K-means处理的地理变量聚类特征，方案二引入标准化后但不聚类的地理变量，方案三不加入地理变量，以此分离地理变量的独立贡献。通过构建地形参数相关性矩阵评估变量间共线性特征，发现高程-坡度、高程-坡向、坡度-坡向的皮尔逊相关系数分别为0.59（p<0.01）、 0.04（p<0.05）和0.05（p<0.05），均显著低于多重共线性警戒阈值0.7（Dormann et al， 2013）。这表明原始连续型地形参数虽存在一定的地形耦合效应，但未达到显著共线性水平，满足直接输入模型的统计独立性要求。

尽管地理变量间无显著信息冗余，空间离散化处理仍展现出重要建模价值。K-means算法将连续变量转化为离散的空间分区，把具有相似地表特征的区域归并为一类，使模型能更清晰地识别区域间的差异性，显著提升模型性能。在本研究中，采取的建模方式是根据不同预报时效单独建模，为了减小工作量，特征组合方案试验基于24 h预报时效的CNN模型进行。试验结果表明（图4），三种方案预报结果相比ECMWF模式均降低了预报误差，方案一、二和三对于未来1 d日最高（低）气温的SS分别为37.4%、 34.9%和34.4%（26.9%、 25.5%和19.3%）。与方案三相比，方案一和方案二对于未来1 d日最高（低）气温预报MAE降低幅度分别达4.7%和0.8%（9.4%和7.7%），证实由于地理变量可以提供与地理位置相关的附加信息，可以使模型更好地理解地理空间上的特征关联（Han et al， 2021）。进一步分析发现，经过地理变量聚类后的方案一日最高、最低气温SS相比未经聚类直接将地理变量输入模型的方案二分别高出2.5%和1.4%，表明基于地形特征空间聚类，可有效解耦地形异质性对气象场的差异化调控机制，进而提取主导性响应模态。值得注意的是，地理变量对最低温的改进率（9.4%）显著高于最高温（4.7%），这与夜间稳定边界层受地形辐射效应调控的物理机制一致。

显示原图|下载原图ZIP|生成PPT

图4 不同特征组合方案下CNN模型未来1 d日最高、最低气温预报的平均绝对误差（柱状图，单位： ℃）和技巧评分（折线图，单位： %）

Fig.4 Mean absolute error （bar chart， unit： ℃） and skill scores （line chart， unit： %） for the 24-hour daily maximum and minimum temperature forecasts by the CNN model under various feature combination schemes

4.2　基于最优特征方案的CNN模型评估

4.2.1　模型整体预报效果

经过特征组合方案试验，基于方案一这种多源数据融合方式（组合ECMWF预报因子、临近观测因子和地理变量聚类特征作为模型输入）分别构建24 h、 48 h和72 h预报时效的CNN模型（CNN-TC，其中TC为Terrain Correction），实现不同预报时效下日最高、最低气温精细化格点预报，并评估该模型、 ECMWF模式和SCMOC的预报效果。

首先对模型整体预报效果进行检验。图5为不同预报时效ECMWF模式、 SCMOC和CNN-TC模型逐日的日最高、最低气温预报MAE箱线图和平均ATF折线图。随着预报时效增加， ECMWF模式对日最高和最低气温预报的MAE逐渐增加， ATF逐渐降低，箱线图中箱体长度增加，意味着MAE离散度也进一步增加， SCMOC和CNN-TC模型呈现一致的变化趋势，说明CNN-TC模型的订正效果依赖于数值模式的预报效果。三种预报产品中， CNN-TC模型箱体位置最靠下，在不同预报时效下日最高（低）气温MAE分布的均值介于1.2~1.8 ℃（1.1~1.2 ℃），中位数介于1.1~1.6 ℃（1.0~1.1 ℃），四分位距介于0.5~0.9 ℃（0.5~0.6 ℃）；其均值与ECMWF模式和SCMOC相比降低幅度分别介于23.5%~37.3%（20.8%~26.9%）和18.7%~27.6%（26.8%~32.3%）之间，中位数降低幅度分别介于25.3%~40.8%（23.1%~27.8%）和18.4%~29.9%（24.3%~28.0%）之间。

显示原图|下载原图ZIP|生成PPT

图5 CNN-TC模型、 SCMOC和ECMWF模式在不同预报时效日最高气温（a）和日最低气温（b）预报的平均绝对误差（箱线图，单位： ℃）和气温预报准确率（折线图，单位： %）

Fig.5 MAE （box plot， unit： ℃） and ATF （line chart， unit： %） for the daily maximum temperature （a） and minimum temperature （b） from the CNN-TC， SCMOC and ECMWF model at different forecast leading times

CNN-TC模型对未来1 d、 2 d和3 d日最高（低）气温的ATF分别为81.6%、 73.2%和66.6%（85.8%、 84.0%和80.3%），与ECMWF相比分别高出23.2%、 19.1%和14.9%（11.7%、 11.6%和10.1%），与SCMOC相比分别高出14.2%、 12.2%和9.9%（14.6%、 15.3%和13.3%）。综上， CNN-TC模型能有效降低ECMWF模式的预报偏差，且整体预报效果优于SCMOC。原因可能在于气象数据包含复杂的非线性关系，通过深层卷积操作， CNN-TC模型能够同时处理多通道、多维度信息，综合考虑了地理信息、历史气温观测等多要素对当前气温预报的影响，有效捕捉气象数据的空间特征，提高气象变量间复杂关系的建模能力。

CLDAS作为同化融合数据产品，与国家站观测资料相比略有偏差。朱宏武等（2023）基于2021年1 -12月湖南省内自动站气温数据，评估了CLDAS气温数据产品质量，结果表明CLDAS气温数据整体可信度较高， 93.8%的站点偏差在1 ℃内， MAE和均方根误差均小于1 ℃。由于本模型是应用CLDAS资料作为真值格点场进行建模的，为了对模型产品进行更全面的检验评估，同时也基于观测站实测数据计算了不同模型日最高、最低气温的MAE与ATF（表3）。从站点检验评估结果来看， CNN-TC模型相较于其他两个模型仍然表现出一定优势， CNN-TC的日最高（低）气温MAE与SCMOC相比减少了16.9%~18.9%（12.3%~15.4%），与ECMWF相比减少了20.3%~28.3%（4.9%~8.0%）； CNN-TC的最高（低）气温的ATF与SCMOC相比提升了10.9%~13.1%（5.5%~8.5%），与ECMWF相比提升了20.9%~25.9%（2.0%~3.9%）。

表3 基于国家气象站日最高、最低气温观测数据的预报订正误差检验统计表

Table 3 Verification statistics for corrected forecast of daily maximum and minimum temperatures using national meteorological station observations

评估指标	预报时效	CNN-TC		SCMOC		ECMWF
评估指标	预报时效	最高温	最低温	最高温	最低温	最高温	最低温
MAE/℃	24 h	1.3	1.2	1.6	1.4	1.8	1.3
	48 h	1.5	1.3	1.9	1.5	2.1	1.4
	72 h	1.8	1.4	2.1	1.6	2.2	1.4
ATF/%	24 h	78.9	81.4	71.1	77.2	62.7	78.8
	48 h	72.4	79.7	64.0	73.5	57.9	76.8
	72 h	66.7	76.2	59.4	71.4	55.2	74.7

4.2.2　模型时空维度的预报效果

结合图2的K-means聚类结果，对比图6中三种预报产品在不同预报时效下的日最高气温预报MAE空间分布。CNN-TC模型几乎在所有格点上的MAE小于ECMWF模式和SCMOC，聚类特征有效区分了不同地形单元的气象响应机制，从而揭示了地形对气温预报误差的空间影响。基于24 h预报时效的检验结果显示，不同地形区域的气温预报准确率存在显著空间分异特征。在高海拔山区的区域-1（包括武陵山、雪峰山、南岭、阳明山等）， ECMWF模式的MAE较高，超过2.0 ℃，最高可达5.8 ℃，山地复杂地形诱发的局地环流效应（如山谷风、热力差异、坡面辐射差异）构成显著干扰模式预报精度的关键机制（Casaretto et al， 2022； Wu and Takemi， 2023； Bugnard et al， 2025）。而在地形均质区的区域-2（尤其是湘北平原区）的MAE较低，仅为1.2~1.4 ℃，平坦下垫面条件下主导的大尺度平流过程与模式参数化方案具有更好的适应性，从而获得更高预报稳定性。SCMOC的MAE空间分布呈现出与ECMWF相似的地形响应特征， MAE介于1.0~6.7 ℃，可见相同的气象过程通常引入相似的气温预报误差。本研究构建的CNN-TC模型创新性地引入地形聚类特征，能够更精准地捕捉地形单元对气象过程的影响，从而显著提升复杂地形条件下的数值预报订正效果。CNN-TC模型在湖南地区的MAE介于0.9~1.7 ℃，有94.2%区域的MAE小于1.4 ℃，而ECMWF和SCMOC所占区域面积仅为5.6%和18.0%。随着预报时效增加，地形对风向、湿度和气温等的影响在长时间尺度上可能变得更加显著， ECMWF在空间上的日最高气温预报误差逐渐拉大， MAE高于2.0 ℃格点数占总格点数比例由33.5%（24 h）增加至56.4%（48 h）、 78.2% （72 h）， CNN-TC模型对于ECMWF的偏差订正性能也逐渐降低， CNN-TC模型相对ECMWF模式MAE减小百分比超过30%的格点数占比由63.4%（24 h）降低至36.9%（48 h）、 19.9%（72 h），但仍优于ECMWF模式和SCMOC。

显示原图|下载原图ZIP|生成PPT

图6 CNN-TC模型（a， d， g）、 SCMOC（b， e， h）和ECMWF模式（c， f， i）在不同预报时效下日最高气温预报的平均绝对误差空间分布（单位： ℃）

Fig.6 Spatial distributions of the MAE for daily maximum temperature at different forecast leading times：（a， d， g） CNN-TC，（b， e， h） SCMOC and （c， f， i） ECMWF.Unit： ℃

图7为不同预报产品日最低气温MAE空间分布， ECMWF模式、 SCMOC和CNN-TC模型整体预报效果优于日最高气温。ECMWF同样存在系统性偏差，在不同预报时效内湖南地区MAE分别为0.8~5.9 ℃（24 h）、 1.0~6.1 ℃（48 h）和1.0~6.2 ℃（72 h），可见ECMWF对于日最低气温预报稳定性高于日最高气温。SCMOC整体预报效果不如ECMWF模式。经过CNN-TC模型订正后， MAE分别介于0.8~1.7 ℃（24 h）、 0.9~1.8 ℃（48 h）和1.0~2.2 ℃（72 h）， CNN-TC模型有效修正了ECMWF在复杂地形区域的MAE极端偏差，以24 h预报时效为例，其MAE低于1.2 ℃格点数占比为90.0%，比ECMWF和SCMOC分别高出56.3%和76.5%。

显示原图|下载原图ZIP|生成PPT

图7 CNN-TC模型（a， d， g）、 SCMOC（b， e， h）和ECMWF模式（c， f， i）在不同预报时效下日最低气温预报的平均绝对误差空间分布（单位： ℃）

Fig.7 Spatial distributions of the MAE for daily minimum temperature at different forecast leading times：（a， d， g） CNN-TC，（b， e， h） SCMOC and （c， f， i） ECMWF.Unit： ℃

对比不同预报时效ECMWF模式、 SCMOC和CNN-TC模型日最高、最低气温预报的MAE和ATF随时间变化情况（图8），三种预报产品随着预报时效增加逐月预报效果变差，但CNN-TC模型在所有预报时效、所有月份的预报效果仍最优，相比另外两个产品， CNN-TC模型日最高（低）气温预报的MAE降低了5.6%~59.1%（6.3%~47.8%）。以未来1 d预报结果为例， ECMWF模式在不同月份日最高气温预报的MAE介于1.7~2.2 ℃， ATF介于48.8%~65.4%，其中7月预报最差，在11月、 12月相对较优，经过CNN-TC模型订正后，与ECMWF模式和SCMOC相比MAE降低幅度分别为22.2%~59.1%和20.0%~41.2%， ATF提升最高幅度达82.0%和30.1%。针对日最低气温， ECMWF在冬季预报效果相对更差， 1月ATF值仅为64.6%，而7月可达85.0%。CNN-TC模型对各月份的ECMWF模式预报同样有正的订正技巧， MAE为0.8~1.3 ℃，与ECMWF模式和SCMOC相比降低幅度分别介于16.7%~33.3%和18.2%~47.8%； ATF为76.2%~94.9%，与ECMWF和SCMOC相比最高提升幅度分别达33.3%和46.3%。

显示原图|下载原图ZIP|生成PPT

图8 CNN-TC模型、 SCMOC和ECMWF模式在不同预报时效日最高气温（a， c）和日最低气温预报（b， d）的平均绝对误差（单位： ℃）、气温预报准确率（单位： %）月际变化

Fig.8 Monthly variations of the MAE （unit： ℃） and ATF （unit： %） values of the daily maximum （a， c） and minimum （b， d） temperature forecasts from the CNN-TC， SCMOC and ECMWF at different forecast leading times

4.3　个例检验

发生转折性天气时如强降温、寒潮时的气温预报一直是天气预报的重点和难点。2022年11月28日至12月1日，湖南省自北向南出现一轮强寒潮天气过程，平均气温下降20.8 ℃。图9为本次强降温过程中三种预报产品的日最高、最低气温预报值与观测值的核密度图，填色表示像素点的样本个数，如果色标中数值越高，表明该区域内散点越集中。在进行个例检验时，主要对比三种预报产品对于未来1 d日最高、最低气温预报效果。

显示原图|下载原图ZIP|生成PPT

图9 强寒潮过程期间CNN-TC模型（a， d）、 SCMOC（b， e）和ECMWF模式（c， f）在湖南地区的预测值与观测值核密度分布填色表示每个像元内的样本个数（即样本密度），黑色实线为对角线，红色虚线为散点的拟合线，图中右下角标注R、 N分别为相关系数与样本个数

Fig.9 Kernel density estimation plots comparing forecasts and observations over Hunan during the severe cold-air outbreak event for CNN-TC （a， d）， SCMOC （b， e）， and ECMWF （c， f）.Color shading represents sample density at each grid point.The black solid line denotes the 1∶1 reference line， and the red dashed line indicates the linear regression fit.Correlation coefficient （R） and sample size （N） are annotated in the bottom-right corner

由图9（a）~（c）可知， ECMWF模式和CNN-TC模型拟合线与对角线接近重合，当观测值位于0 ℃左右时， SCMOC日最高气温预报存在明显高估。CNN-TC模型的MAE为1.1 ℃，低于ECMWF模式（1.4 ℃）和SCMOC（2.4 ℃）。计算所有样本预报值与观测值的绝对误差，并统计不同绝对误差区间范围样本数占比， CNN-TC模型预报值与观测值绝对误差≤1 ℃的样本数所占比例比ECMWF模式和SCMOC分别高出13.8%和33.5%［图10（a）］。从站点的检验情况来看（表4）， CNN-TC日最高气温产品的MAE为1.2 ℃，低于ECMWF模式（1.5 ℃）和SCMOC（2.5 ℃）。

显示原图|下载原图ZIP|生成PPT

图10 三种预报产品日最高气温（a）和日最低气温（b）预报值与观测值绝对误差在不同区间范围内样本占比

Fig.10 The percentage distribution of samples across different absolute error intervals between forecasted and observed values for daily maximum temperature （a） and daily minimum temperature （b） among three forecast products

表4 本次强寒潮过程基于国家气象站日最高、最低气温观测数据的预报订正误差检验统计表

Table 4 Verification statistics of forecast corrections for daily maximum and minimum temperatures during the severe cold-air outbreak event using observational data from national meteorological stations

评估指标	CNN-TC		SCMOC		ECMWF
评估指标	最高气温	最低气温	最高气温	最低气温	最高气温	最低气温
MAE/℃	1.2	0.9	2.5	1.3	1.5	1.2
ATF/%	84.4	92.9	55.6	80.4	76.7	86.2

由图9（d）~（f）可知，当观测值位于15 ℃左右时，三种预报产品日最低气温预报均存在一定低估，但CNN-TC模型散点分布相较对角线最为集中， MAE为0.9 ℃，绝对误差≤1 ℃的样本数所占比例比ECMWF模式和SCMOC分别高出14.9%和22.8%［图10（b）］。由此可见， CNN-TC模型对于转折性天气的预报效果与数值模式和中央台指导产品相比有较大的提升。从站点的检验情况来看（表4）， CNN-TC日最低气温产品的MAE为0.9 ℃，低于ECMWF模式（1.2 ℃）和SCMOC（1.3 ℃）。

5 结论

本文利用ECMWF高分辨率数值模式、 CLDAS网格融合实时分析产品及地理变量，分别构建了不同预报时效下、日最高/最低气温的深度学习预报模型，获得未来3 d的精细化气温格点预报产品。通过对比三组特征组合方案，分别为加入地理变量聚类特征、加入未聚类地理变量以及不加入地理变量，探讨了地表特征对模型构建的重要性。最后基于最优特征方案构建CNN模型（CNN-TC模型），并检验评估CNN-TC模型与ECMWF模式、 SCMOC在湖南地区预报效果。结论如下：

（1）模式预报因子和地理变量的联合输入可以使模型更好地捕捉气象系统中的复杂关系，了解不同地区的气象特征，提高模型在不同地理条件下的鲁棒性，这对于具有地理梯度或特殊地形的区域尤其重要。特别是，应用K-means聚类方法对地理变量进行聚类后输入模型的效果要优于不经聚类直接将地理变量输入模型，未来1 d日最高、最低气温预报的技巧评分分别高出2.5%和1.4%。

（2）通过对比ECMWF模式、 SCMOC以及基于最优特征组合（ECMWF预报因子、临近观测因子和地理变量聚类特征）的CNN-TC模型在测试集上未来3 d日最高（低）气温预报效果， CNN-TC模型能有效降低ECMWF的预报偏差，且整体预报效果优于SCMOC，其逐日平均绝对误差箱线图箱体位置最靠下，均值介于1.2~1.8 ℃（1.1~1.2 ℃），与ECMWF模式和SCMOC相比降低幅度分别介于23.5%~37.3%（20.8%~26.9%）和18.7%~27.6%（26.8%~32.3%）之间。

（3）在不同预报时效， ECMWF模式均存在明显的系统性偏差，日最高、最低气温预报的平均绝对误差在地形复杂区域高于平原地区。ECMWF模式经过CNN-TC模型订正后，预报误差得到明显降低，其中，未来1 d日最高（低）气温预报的平均绝对误差范围由1.2~5.8 ℃（0.8~5.9 ℃）降低至0.9~1.7 ℃（0.8~1.7 ℃）。从时间维度来看， CNN-TC模型在所有预报时效、所有月份的预报效果最优。与ECMWF模式和SCMOC相比，未来1 d日最高（低）气温预报准确率最高提升幅度达82.0%和30.1%（33.3%和46.3%）。随着预报时效增加， CNN-TC模型对于ECMWF模式偏差订正的性能降低，但仍然明显优于ECMWF和SCMOC。个例检验结果表明， CNN-TC模型对于转折性天气预报效果更优。

综上，采用卷积神经网络对ECMWF预报产品进行订正，进一步克服了传统统计学方法，例如MOS方法仅针对单一站点/格点建模的局限性，直接输出空间分辨率更高（0.05°×0.05°）、优于ECMWF的预报产品。本研究选取湖南省作为典型复杂地形试验区，因其地貌类型多样（山地、丘陵、盆地、平原并存）、地形起伏显著，具备强代表性及高复杂性地形特征，可充分验证模型对多元地形下气温分布的识别与预报能力。该区域为检验模型泛化能力提供了理想基础。文中所提出的CNN-TC模型具有结构普适性： ①模型通过K-means聚类自动提取区域间地理特征差异，避免了对固定区域依赖，便于在其他复杂地形区推广； ②卷积神经网络结构具备强大的空间模式识别能力，已被广泛应用于地球科学领域，具备良好的跨区域适应性。需指出的是，不同区域气候背景与下垫面特征存在差异，模型推广时需结合目标区特点调整超参数，以优化预报性能。考虑到本研究建模使用的实况真值是CLDAS气温产品，但其与站点实测仍有一定偏差，未来工作中，可进一步引入站点观测对CLDAS实况数据进行偏差订正，提升模型在站点尺度的预报准确性。

参考文献

原文顺序 | 文献年度倒序 | 文中引用次数倒序

Bugnard

， Collaud

C M

， Hervo

， et al， 2025.Comparison of temperature and wind profiles between ground-based remote sensing observations and numerical weather prediction model in complex Alpine topography： the Meiringen campaign［J］.Atmospheric Measurement Techniques， 18（4）： 1039-1061.

Casaretto

， Dillon

M E

， Salio

， et al， 2022.High-resolution NWP forecast precipitation comparison over complex terrain of the Sierras de Córdoba during RELAMPAGO-CACTI［J］.Weather and Forecasting， 37（2）： 241-266.

Chang

J M H

， Lam

Y F

， Lau

S P W

， et al， 2021.Development of fine-scale spatiotemporal temperature forecast model with urban climatology and geomorphometry in Hong Kong［J］.Urban Climate， 37： 100816.

Darabi

， Haghighi

A T

， Klöve

， et al， 2025.Remote sensing of vegetation trends： a review of methodological choices and sources of uncertainty［J］.Remote Sensing Applications： Society and Environment， 37： 101500.

Dormann

C F

， Elith

， Bacher

， et al， 2013.Collinearity： a review of methods to deal with it and a simulation study evaluating their performance［J］.Ecography， 36（1）： 27-46.

Guo

， Peuquet

D J

， Gahegan

， 2003.ICEAGE： Interactive clustering and exploration of large and high-dimensional geodata［J］.GeoInformatica， 7： 229-253.

Han

， Chen

， et al， 2021.A deep learning method for bias correction of ECMWF 24-240 h forecasts［J］.Advances in Atmospheric Sciences， 38（9）： 1444-1459.

Hartigan

J A

， Wong

M A

， 1979.Algorithm AS 136： A K-means clustering algorithm［J］.Journal of the Royal Statistical Society： Series C （Applied Statistics）， 28（1）： 100-108.

Jiang

， Cioffi

， Li

， et al， 2024.Hybrid multilayer perceptron and convolutional neural network model to predict extreme regional precipitation dominated by the large-scale atmospheric circulation［J］.Atmospheric Research， 304： 107362.

J W

， Han

X Q

， Jiang

J W

， et al， 2020.An efficient clustering method for DBSCAN geographic spatio-temporal large data with improved parameter optimization［J］.The International Archives of the Photogrammetry， Remote Sensing and Spatial Information Sciences， 42： 581-584.

Lian

， Huang

， Shao

， et al， 2024.Terra Wind： a deep learning‐based near‐surface winds downscaling model for complex terrain region［J］.Geophysical Research Letters， 51（23）： e2024GL112124.

Liu

， Lou

， Yan

， et al， 2023.Deep-learning post-processing of short-term station precipitation based on NWP forecasts［J］.Atmospheric Research， 295： 107032.

Murtagh

， Contreras

， 2012.Algorithms for hierarchical clustering： an overview［J］.Wiley Interdisciplinary Reviews Data Mining and Knowledge Discovery， 2（1）， 86-97.

Qin

， Liu

， Jiang

， et al， 2023.Grid-to-point deep-learning error correction for the surface weather forecasts of a fine-scale numerical weather prediction system［J］.Atmosphere， 14（1）： 145.

Schubert

， Sander

， Ester

， et al， 2017.DBSCAN revisited， revisited： why and how you should （still） use DBSCAN［J］.ACM Transactions on Database Systems （TODS）， 42（3）： 1-21.

Sønderby

C K

， Espeholt

， Heek

， et al， 2020.MetNet： a neural weather model for precipitation forecasting［J］.arXiv： 2003. 12140v2.

Vatsavai

R R

， Symons

C T

， Chandola

， et al， 2011.GX-Means： A model-based divide and merge algorithm for geospatial image clustering［J］.Procedia Computer Science， 4： 186-195.

P Y

， Takemi

， 2023.Impacts of mountain topography and background flow conditions on the predictability of thermally induced thunderstorms and the associated error growth［J］.Journal of the Atmospheric Sciences， 80（4）： 1177-1199.

， Zhou

， Chen

， et al， 2024.A deep learning network for improving predictions of maximum and minimum temperatures over complex terrain［J］.Theoretical and Applied Climatology， 155（7）： 6949-6963.

Zhang

， Liang

， Li

， et al， 2023.Statistical post-processing of precipitation forecasts using circulation classifications and spatiotemporal deep neural networks［J］.Hydrology and Earth System Sciences， 27（10）： 1945-1960.

Sun

Z B

， Wang

， Guo

， et al， 2019.Barrier effect of terrain on cold air and return flow of dust air masses［J］.Atmospheric Research， 220： 81-91.DOI： 10.1016/j.atmosres.2019.01.007 .

Zhong

， Du

， Chen

， et al， 2024.Investigating transformer‐based models for spatial downscaling and correcting biases of near‐surface temperature and wind‐speed forecasts［J］.Quarterly Journal of the Royal Meteorological Society， 150（758）： 275-289.

Zhou

， Chen

， Xu

， et al， 2024.Deep learning‐based postprocessing for hourly temperature forecasting［J］.Meteorological Applications， 31（2）： e2194.

陈新明，盘钰春，徐勇，等， 2023.西南地区植被覆盖度时空演变及其与气候和地形的相关性［J］.西南农业学报， 36（6）： 1307-1317.

Chen

X M

， Pan

Y C

， Xu

， et al， 2023.Spatio-temporal variation of fractional vegetation cover and its relationship with climate and topographic factors in Southwest China［J］.Southwest China Journal of Agricultural Sciences， 36（6）： 1307-1317.

管筝，印涌强，张晓祥，等， 2024.基于K-means聚类与集成学习算法的小流域山洪灾害易发性评估［J］.应用科学学报， 42（3）： 388-404.DOI： 10.3969/j.issn.0255-8297.2024.03.002.Guan Z ，

Yin

Y Q

， Zhang

X X

， et al， 2024.Estimating flash flood disaster susceptibility based on K-means clustering and ensemble learning approaches［J］.Journal of Applied Sciences， 42（3）： 388-404.DOI： 10.3969/j.issn.0255-8297.2024.03.002 .

郭小芹，李光明，孙占峰，等， 2022.祁连山及周边降水分布聚类检验和典型流域增雨效果评价［J］.干旱区地理， 45（3）： 706-714.

Guo

X Q

， Li

G M

， Sun

Z F

， et al， 2022.Cluster analysis with statistical test of precipitation distribution in Qilian Mountains and its surrounding area and evaluation of artificial precipitation enhancement in typical watershed［J］.Arid Land Geography， 45（3）： 706-714.

胡莹莹，庞林，王启光， 2023.基于深度学习的 7~15d温度格点预报偏差订正［J］.应用气象学报， 34（4）： 426-437.

Y Y

， Pang

， Wang

Q G

， 2023.Application of deep learning bias correction method to temperature grid forecast of 7-15 days［J］.Journal of Applied Meteorological Science， 34（4）： 426-437.

金荣花，代刊，赵瑞霞，等， 2019.我国无缝隙精细化网格天气预报技术进展与挑战［J］.气象， 45（4）： 445-457.

Jin

R H

， Dai

， Zhao

R X

， et al， 2019.Progress and challenge of seamless fine gridded weather forecasting technology in China［J］.Meteorological Monthly， 45（4）： 445-457.

李浙华，肖安，郑丽君， 2024.基于高分辨率数值预报和深度学习的地面气温预报研究［J］.高原气象， 43（2）： 464-477.DOI： 10.7522/j.issn.1000-0534.2023.00073.Li Z H ，

Xiao

， Zheng

L J

， 2024.Research on surface temperature prediction based on high-resolution numerical prediction products and deep learning［J］.Plateau Meteorology， 43（2）： 464-477.DOI： 10.7522/j.issn.1000-0534.2023.00073 .

潘留杰，薛春芳，王建鹏，等， 2017.一个简单的格点温度预报订正方法［J］.气象， 43（12）： 1584-1593.

Pan

L J

， Xue

C F

， Wang

J P

， et al， 2017.A simple grid temperature forecast correction method［J］.Meteorological Monthly， 43（12）： 1584-1593.

邱贵强，时少英，王洪霞，等， 2023.2m气温集成订正方法及在冬奥延庆赛区的应用［J］.应用气象学报， 34（4）： 400-412.

Qiu

G Q

， Shi

S Y

， Wang

H X

， et al， 2023.An integrated correction method for 2 m temperature and its application to Yanqing competition zone of Olympic Winter Games［J］.Journal of Applied Meteorological Science， 34（4）： 400-412.

师春香，潘旸，谷军霞，等， 2019.多源气象数据融合格点实况产品研制进展［J］.气象学报， 77（4）： 774-783.

Shi

C X

， Pan

， Gu

J X

， et al， 2019.A review of multi-source meteorological data fusion products［J］.Acta Meteorologica Sinica， 77（4）： 774-783.

孙康慧，肖安，夏侯杰， 2024.基于LightGBM机器学习算法的江西气温短期预报模型研究［J］.高原气象， 43（6）： 1520-1535.DOI： 10.7522/j.issn.1000-0534.2024.00035.Sun K H ，

Xiao

， Xia

H J

， 2024.Study on short term temperature forecast model in Jiangxi Province based on LightGBM machine learning algorithm［J］.Plateau Meteorology， 43（6）： 1520-1535.DOI： 10.7522/j.issn.1000-0534.2024.00035 .

王丹，王建鹏，党超琪，等， 2023.CLDAS实况产品在陕西气温网格预报检验与订正中的应用［J］.气象， 49（8）： 946-957.

Wang

， Wang

J P

， Dang

C Q

， et al， 2023.Application of CLDAS in test and correction of grid temperature forecast in Shaanxi Province［J］.Meteorological Monthly， 49（8）： 946-957.

夏侯杰，肖安，聂道洋， 2023.基于观测的短时强降水深度学习预报模型［J］.高原气象， 42（4）： 1005-1017.DOI： 10.7522/j.issn.1000-0534.2022.00046.Xia H J ，

Xiao

， Nie

D Y

， 2023.Observation based deep learning model for short-duration heavy rain nowcasting［J］.Plateau Meteorology， 42（4）： 1005-1017.DOI： 10.7522/j.issn.1000-0534.2022.00046 .

薛海乐，沈学顺，苏勇， 2011.地形湍流拖曳力参数化及在GRAPES中的应用［J］.应用气象学报， 22（2）： 169-181.

Xue

H L

， Shen

X S

， Su

， 2011.Parameterization of turbulent orographic form drag and implementation in GRAPES［J］.Journal of Applied Meteorological Science， 22（2）： 169-181.

姚润进，程帅兵，赵乾乾，等， 2024.一种基于组合深度学习的复杂山地风电场测风数据质量控制方法［J］.高原气象， 43（6）： 1630-1638.DOI： 10.7522/j.issn.1000-0534.2024.00043.Yao R J ，

Cheng

S B

， Zhao

Q Q

， et al， 2024.A quality control method based on combination deep learning for measurement data of complex mountain wind farm［J］.Plateau Meteorology， 43（6）： 1630-1638.DOI： 10.7522/j.issn.1000-0534.2024.00043 .

张玉涛，佟华，孙健， 2020.一种偏差订正方法在平昌冬奥会气象预报的应用［J］.应用气象学报， 31（1）： 27-41.

Zhang

Y T

， Tong

， Sun

， 2020.Application of a bias correction method to meteorological forecast for the Pyeongchang Winter Olympic Games［J］.Journal of Applied Meteorological Science， 31（1）： 27-41.

赵琳娜，卢姝，齐丹，等， 2022.基于全连接神经网络方法的日最高气温预报［J］.应用气象学报， 33（3）： 257-269.

Zhao

L N

， Lu

， Qi

， et al， 2022.Daily maximum air temperature forecast based on fully connected neural network［J］.Journal of Applied Meteorological Science， 33（3）： 257-269.

朱宏武，罗丹，黎燚隆，等， 2023.国家级气温智能网格产品在湖南地区的可靠性评估［J］.现代电子技术， 46（20）： 61-68.

Zhu

H W

， Luo

， Li

Y L

， et al， 2023.Reliability evaluation of national temperature smart gridded product CLDAS in Hunan province［J］.Modern Electronics Technique， 46（20）： 61-68.

朱育雷，杨静，钟水新，等， 2024.基于多神经网络的动态权重集成温度预报订正研究［J］.热带气象学报， 40（1）： 156-168.

Zhu

Y L

， Yang

， Zhong

S X

， et al， 2024.Research on temperature forecast correction by dynamic weight integration based on multi-neural networks［J］.Journal of Tropical Meteorology， 40（1）： 156-168.

Options

文章导航

模态框（Modal）标题

摘要

本文引用格式

Abstract

1 引言

2 数据来源及预处理方法

2.1 数据来源

图1 湖南省地形图

2.2 因子选择

表1 建模所选取的因子

2.3 数据预处理

3 方法

3.1 K-means聚类法

图2 误差平方和随聚类数量的变化趋势（a）和基于地理变量的K-means聚类分区（b）

3.2 卷积神经网络

图3 CNN模型框架图

表2 模型训练超参数设置

3.3 检验方法

4 结果与分析

4.1 不同特征组合方案对比

图4 不同特征组合方案下CNN模型未来1 d日最高、 最低气温预报的平均绝对误差（柱状图， 单位： ℃）和技巧评分（折线图， 单位： %）

4.2 基于最优特征方案的CNN模型评估

4.2.1 模型整体预报效果

图5 CNN-TC模型、 SCMOC和ECMWF模式在不同预报时效日最高气温（a）和日最低气温（b）预报的平均绝对误差（箱线图， 单位： ℃）和气温预报准确率（折线图， 单位： %）

表3 基于国家气象站日最高、 最低气温观测数据的预报订正误差检验统计表

4.2.2 模型时空维度的预报效果

图6 CNN-TC模型（a， d， g）、 SCMOC（b， e， h）和ECMWF模式（c， f， i）在不同预报时效下日最高气温预报的平均绝对误差空间分布（单位： ℃）

图7 CNN-TC模型（a， d， g）、 SCMOC（b， e， h）和ECMWF模式（c， f， i）在不同预报时效下日最低气温预报的平均绝对误差空间分布（单位： ℃）

图8 CNN-TC模型、 SCMOC和ECMWF模式在不同预报时效日最高气温（a， c）和日最低气温预报（b， d）的平均绝对误差（单位： ℃）、 气温预报准确率（单位： %）月际变化

4.3 个例检验

图10 三种预报产品日最高气温（a）和日最低气温（b）预报值与观测值绝对误差在不同区间范围内样本占比

表4 本次强寒潮过程基于国家气象站日最高、 最低气温观测数据的预报订正误差检验统计表

5 结论

参考文献

2.1　数据来源

2.2　因子选择

2.3　数据预处理

3.1　 K-means聚类法

3.2　卷积神经网络

3.3　检验方法

4.1　不同特征组合方案对比

图4 不同特征组合方案下CNN模型未来1 d日最高、最低气温预报的平均绝对误差（柱状图，单位： ℃）和技巧评分（折线图，单位： %）

4.2　基于最优特征方案的CNN模型评估

4.2.1　模型整体预报效果

图5 CNN-TC模型、 SCMOC和ECMWF模式在不同预报时效日最高气温（a）和日最低气温（b）预报的平均绝对误差（箱线图，单位： ℃）和气温预报准确率（折线图，单位： %）

表3 基于国家气象站日最高、最低气温观测数据的预报订正误差检验统计表

4.2.2　模型时空维度的预报效果

图8 CNN-TC模型、 SCMOC和ECMWF模式在不同预报时效日最高气温（a， c）和日最低气温预报（b， d）的平均绝对误差（单位： ℃）、气温预报准确率（单位： %）月际变化

4.3　个例检验

表4 本次强寒潮过程基于国家气象站日最高、最低气温观测数据的预报订正误差检验统计表