基于地形引导注意力的降水降尺度模型研究

  • 王彩玲 , 1 ,
  • 樊磊 1, 2 ,
  • 解小宁 , 2
展开
  • 1. 西安石油大学计算机学院,陕西 西安 710065
  • 2. 中国科学院地球环境研究所 黄土科学全国重点实验室,陕西 西安 710061
解小宁(1981 -), 男, 陕西渭南人, 研究员, 主要从事全球变化研究. E-mail:

王彩玲(1984 -), 女, 宁夏吴忠人, 副教授, 主要从事深度学习、 人工智能、 信息提取技术等研究. E-mail:

收稿日期: 2025-05-29

  修回日期: 2025-09-01

  网络出版日期: 2026-04-13

基金资助

中国科学院战略性先导科技专项

黄土科学全国重点实验室开放基金资助项目(SKLLQG2418)

西安石油大学研究生创新基金项目(YCX2513161)

A Deep Learning-Based Precipitation Downscaling Models with Terrain-Guided Attention

  • Cailing WANG , 1 ,
  • Lei FAN 1, 2 ,
  • Xiaoning XIE , 2
Expand
  • 1. School of Computer Science,Xi’an Shiyou University,Xi'an 710065,Shanxi,China
  • 2. State Key Laboratory of Loess Science,Institute of Earth Environment,Chinese Academy of Sciences,Xi'an 710061,Shanxi,China

Received date: 2025-05-29

  Revised date: 2025-09-01

  Online published: 2026-04-13

Copyright

© Editorial Department of Plateau Meteorology (CC BY-NC-ND)

摘要

基于卷积神经网络(Convolutional Neural Network, CNN)的降水降尺度技术能够利用深度学习模型从低分辨率全球气候模式生成高分辨率降水数据, 是评估气候变化在区域和局地尺度上对环境造成影响的关键技术, 具有重要的现实意义。本文提出了一种基于CNN的降水降尺度模型-地形引导注意力网络(Terrain-guided Attentian Network, TGAN), 能够实现2°大气变量的降尺度操作, 并得到0.1°的高分辨率降水场。该模型采用拉普拉斯金字塔作为渐进式降尺度框架, 逐级提升分辨率并重建降水场; 同时引入地形引导注意力模块, 通过注意力机制以多尺度方式聚合大气数据和相应尺度的高程信息, 加强模型的特征学习能力, 从而实现模型模拟精度的提高。本研究以黄河中游地区为研究区域, 使用2001 - 2010年的ERA5日大气变量、 GPM IMERG日降水数据和高程数据进行模型训练, 并利用2011 -2020年的数据验证TGAN的有效性。结果表明, 相较于传统CNN模型, TGAN在日、 月和年尺度的时空降水模拟中均表现出更高精度, 尤其是在日尺度上优势更为显著: 其平均均方根误差低至5.10 mm·d⁻¹, 平均相关系数高达0.42, 预测的第95百分位数和第99百分位数也更接近于GPM IMERG观测数据。同时, TGAN模拟的日降水概率密度分布与GPM IMERG也更加吻合, 尤其是在大降水区间中, 表现出了更高的一致性。此外, 本文进一步分析了不同损失函数对TGAN模型降尺度性能的影响。采用RMSE损失函数可以提升模型整体的预测精度, 但在极端降水模拟上存在明显低估; 而Bernoulli-Gamma损失函数虽整体精度略低, 但却能更准确地重现极端降水事件, 其概率密度分布与GPM IMERG及站点观测数据基本保持一致, 表现出较好的极端降水捕捉能力。总体而言, TGAN通过结合地形引导注意力机制以及Bernoulli-Gamma损失函数, 在黄河中游地区的降水降尺度任务中展现出显著优势, 不仅提升了整体模拟精度, 同时能够更好地捕捉极端降水事件, 为复杂地形区域的高分辨率降水模拟提供了有力支撑。

本文引用格式

王彩玲 , 樊磊 , 解小宁 . 基于地形引导注意力的降水降尺度模型研究[J]. 高原气象, 2026 , 45(3) : 705 -717 . DOI: 10.7522/j.issn.1000-0534.2025.00098

Abstract

As a powerful deep-learning downscaling technique, convolutional neural networks (CNN) are widely utilized to generate high-resolution precipitation data from low-resolution global climate models through data-driven approaches, playing a critical role in assessing the impacts of climate change at both regional and local scales.This study proposes a CNN-based precipitation downscaling model, the Topography-Guided Attention Network (TGAN), which downscales coarse-resolution (2°) atmospheric variables to produce high-resolution precipitation fields at 0.1°.The model adopts a Laplacian pyramid as a progressive, multi-level downscaling framework, in which the spatial resolution of precipitation fields is incrementally enhanced and precipitation structures are reconstructed through successive stages.In addition, a topography-guided attention module is incorporated, which leverages an attention mechanism to integrate atmospheric variables with elevation data at corresponding spatial scales.By combining these multi-scale features, the module strengthens the network’s capacity for feature representation and learning, thereby improving the accuracy and reliability of simulated precipitation.Focusing on the middle reaches of the Yellow River, TGAN is trained on daily ERA5 atmospheric variables, GPM IMERG daily precipitation data from 2001 to 2010, together with static elevation data, and validated using data from 2011 to 2020.The results indicate that, compared with a conventional CNN model, TGAN achieves higher accuracy in spatiotemporal precipitation simulations at daily, monthly, and annual scales.At the daily scale, TGAN achieves a lower average root mean square error (5.10 mm·d-1) and a higher average correlation coefficient (0.42) compared with the conventional CNN model.Additionally, TGAN more accurately captures extreme precipitation events (95th and 99th percentiles) and better aligns with GPM IMERG observations in probability density distribution, particularly for heavy precipitation range.This study further investigates the impact of different loss functions on the downscaling performance of TGAN.Using the RMSE loss function improves overall predictive accuracy but leads to underestimation of extreme precipitation events, whereas the Bernoulli-Gamma loss function, although slightly less accurate overall, more faithfully reproduces extreme precipitation events.Its probability density distributions are highly consistent with both GPM IMERG data and station observations, indicating that the model has an enhanced capability to capture extreme precipitation events, thereby better reproducing the distribution characteristics of precipitation frequency.Overall, by combining the topography-guided attention mechanism with the Bernoulli-Gamma loss function, TGAN demonstrates clear advantages in downscaling precipitation over the middle reaches of the Yellow River, not only improving overall simulation accuracy but also better representing extreme precipitation events, providing a robust and reliable tool for high-resolution precipitation modeling in complex terrain regions.

1 引言

为了更精准地评估区域尺度上的气候变化影响, 获取高分辨率的气象数据至关重要。然而, 现有的全球气候模式(Global climate models, GCMs)由于其输出结果的空间分辨率较低, 难以充分地反映不同区域的气候特征及其差异(陈超君和王钦, 2014)。因此, 降尺度技术作为一种将大尺度的气候模式输出转换为高空间分辨率区域数据的方法, 已成为气候变化研究中不可或缺的重要手段(Giorgi and Mearns, 1999)。
目前的降尺度方法主要分为动力降尺度和统计降尺度。动力降尺度主要通过区域气候模式(Regional climate models)利用低分辨率的全球气候模式输出数据作为边界条件, 计算并生成能够描述区域气候特征的高分辨率数据(Giorgi and Gutowski, 2015)。该方法具备坚实的物理基础, 能够较为真实地模拟气候系统的物理过程, 因此在局地降水模拟中具备较高的物理可信度(Laprise, 2008Jacob et al, 2014)。其中, 以WRF(Weather Research and Forecasting Model)为代表的中尺度天气预报模式被广泛应用于动力降尺度研究(Tian et al, 2020Maussion et al, 2011Yun et al, 2020胡迎春等, 2024)。例如, Tian et al(2020)采用WRF模式在黄土高原地区进行了1980-2011年的长期模拟, 结果表明WRF模式不仅充分捕捉到了该地区降水的空间分布, 而且再现了其在不同时间尺度上的量级和变率。Maussion et al(2011)利用WRF对青藏高原地区进行了高分辨率降尺度模拟, 结果表明WRF对该地区降水具有较高的模拟精度。在中国东部暖季降水模拟中WRF模式同样表现出色, 其准确再现了季节和次季节降水的空间分布以及降水的年际变化, 并能较好地模拟降水强度和频率的分布特征(Yun et al, 2020)。然而, WRF等动力降尺度方法也存在一定缺陷: 一方面, 模型计算成本较高, 尤其在进行长期气候预测或更高分辨率模拟时更加耗时耗力; 另一方面, 模型结果高度依赖驱动其运行的GCMs所提供的初始和边界条件, 模型的精度对这些条件表现出较强的敏感性(Denis et al, 2003)。综上所述, 基于WRF等中尺度模式的动力降尺度方法, 虽然能够更真实地刻画区域尺度的气候动力过程, 在中国各个地区也表现出更好的适应性和准确性, 但同时也面临计算资源消耗大、 对GCMs结果敏感等挑战。统计降尺度方法是通过建立大尺度气候预报因子与局地气象要素之间的最优统计关系, 从而实现从低分辨率气候模式输出到高分辨率气象数据之间的转换。根据建模原理的不同, 统计降尺度方法可以分为3类(Maraun et al, 2010): 理想预报法、 模型输出统计法和基于天气生成器的方法。与动力降尺度方法相比, 统计降尺度方法计算效率高、 易于实施, 在气候变化研究中得到了广泛应用(张慕琪等, 2022朱姜韬等, 2023汪红等, 2025陈涵等, 2025)。
近年来, 深度学习技术在超分辨领域取得的重要突破(Wang et al, 2019Ledig et al, 2017鲁心怡等, 2024黄健等, 2021), 为气候数据的降尺度研究提供了新的技术路径。具体而言, 这类技术通过构建端到端的非线性映射模型, 能够有效捕捉低分辨率输入和高分辨率输出之间的复杂映射关系, 这一核心机制与气候降尺度的本质需求高度一致。因此, 许多研究者尝试将基于深度学习的超分辨模型应用于气候降尺度任务中, 并取得了一系列的研究进展与成果。例如, Vandal et al(2017)提出了基于深度学习的统计降尺度模型DeepSD, 该模型采用堆叠的超分辨卷积神经网络(SRCNN)结构, 并引入多尺度输入通道增强SRCNN, 提高了美国降水降尺度操作的准确性。Wang et al(2021)设计了一种基于深度残差结构的超分辨率网络(SRDRN), 用于每日温度和降水的降尺度。相较于传统降尺度方法, 该模型更准确地再现了局地温度和降水的分布及其极值。Baño-Medina et al(20202021)通过系统性的评估框架, 对卷积神经网络(CNN)和传统的统计降尺度方法进行了对比分析。结果表明, 在降水降尺度任务中, CNN模型在大多数方面均优于广义线性模型, 能够为气候变化应用提供更加合理的降尺度结果。在此基础上, Fu et al(2024)通过引入残差密集块来提取更高层次和更加抽象的特征, 进一步提升了模型的降水降尺度性能。
尽管上述研究在气候要素的降尺度建模中取得了较为理想的效果, 但其仍存在一定的局限性。气候降尺度不同于计算机视觉中常见的整数倍超分辨率问题, 其通常需要以非整数倍且大尺度的方式重建气象要素。为了解决这一问题, 一些研究者尝试将低分辨率气象数据插值到与目标分辨率相同大小, 然后再作为模型输入, 但这会显著增加计算复杂度。也有研究在模型的末端引入全连接层, 通过输出的离散像素重建气象场(Baño-Medina et al, 2020Sun and Lan, 2021Dujardin and Lehning, 2022)。尽管该操作在一定程度上降低了计算成本, 但同时也破坏了输出数据的空间结构特征。针对上述问题, 渐进式降尺度框架(Lai et al, 20172018)通过逐步提升分辨率的方式, 在保持空间结构一致性的同时有效降低了计算复杂度, 是一种针对大尺度非整数倍降尺度任务的可行方案。此外, 合理引入辅助信息也有助于提升模型对于局地特征的感知能力, 从而更加准确的重建高分辨率气候场(杨雅婷等, 2024杜晓婉等, 2023)。
本文提出了一种基于地形引导注意力的降水降尺度模型(Terrain-Guided Attention Network, TGAN)。该模型采用拉普拉斯金字塔作为渐进式降尺度框架, 同时引入高程数据作为地形先验信息, 从多个尺度上通过地形引导注意力机制融合气象因子与地形特征, 从而增强模型对于复杂地形区域降水分布的模拟能力。本研究以黄河中游地区为研究区, 采用2001 -2010年的ERA5日大气变量和GPM IMERG日降水数据以及高程数据进行模型训练, 并利用2011 -2020年的数据对模型进行测试。通过在测试集上的定量和定性分析表明, TGAN在日、 月、 年3个时间尺度上的降水模拟效果, 以及在极端降水和极端降水频率分布等方面均优于基线CNN模型。

2 研究区域与数据

2.1 研究区域

黄河中游地区(32°N -42°N, 100°E -116°E)位于中国北方, 地处青藏高原与华北平原之间的过渡地带, 地形复杂多样, 涵盖黄土高原、 山地、 丘陵和平原等多种地貌类型。该区域属于半干旱至半湿润的过渡地带, 降水的空间分布呈自西北向东南逐渐递增的趋势。受东亚夏季风的控制, 降水主要发生在夏季(6 -9月约占全年的70%), 并多以强降水事件为主。其中7 -8月占比超过40%, 表现出显著的夏秋多雨、 冬春干旱的气候特征(任保平和杜宇翔, 2021)。由于地形起伏大, 降水集中且变率高等自然特征, 该地区生态环境脆弱, 对气候变化响应敏感。因此, 获取高分辨率的降水数据对于该地区的气候变化研究具有重要意义。

2.2 数据来源

表1所示, 气象数据采用欧洲中期天气预报中心提供的ERA5再分析数据集, 空间分辨率为0.25°×0.25°。本研究选取了500 hPa、 700 hPa和850 hPa三个压力水平上的纬向风、 经向风、 温度、 比湿以及位势高度作为预测因子, 并将其空间分辨率统一升尺度到2°×2°。为提升地形复杂区域的建模精度, 研究中还引入了通用海底地形图(General Bathymetric Chart of the Oceans, GEBCO)2024版高程数据作为地形校正因子。降水基准数据GPM IMERG来源于全球降水测量计划(Global Precipitation Measurement, GPM), 其空间分辨率为0.1°×0.1°。与其他的降水数据集相比, GPM IMERG具有更高的精度和时空分辨率(Tang et al, 2020), 并在极端天气事件监测中表现出了较高的准确性(Su et al, 2018)。除高程数据为静态数据外, 所有大气因子和降水数据均为2001 -2020年的日尺度数据。其中, 2001 -2010年数据用于模型训练, 2011 - 2020年数据用于模型验证。
表1 用于降水降尺度的预测因子与目标变量概述

Table 1 Overview of predictor and target variables for precipitation downscaling

变量 数据来源 空间分辨率
预测因子 温度/K ERA5 2°×2°
比湿/(g·kg⁻¹) ERA5 2°×2°
经向风/(m·s⁻¹) ERA5 2°×2°
纬向风/(m·s⁻¹) ERA5 2°×2°
位势高度/gpm ERA5 2°×2°
高程/m GEBCO 500 m
预测目标 降水/mm GPM IMERG 0.1°×0.1°

3 方法介绍

3.1 地形引导注意力网络(TGAN

本节提出了一种基于地形引导注意力的降水降尺度模型(图1), 用于黄河中游地区的高分辨率降水模拟。该模型采用拉普拉斯金字塔作为渐进式降尺度框架, 通过3个上采样模块将低分辨率气象数据逐步提升至目标分辨率(100×159), 最终输出用于降水场重建的3个参数: p、 log α和log β。为确保参数的物理合理性, 对log α和log β进行指数变换, 从而保证αβ始终为正数。日降水量Y的计算公式如式(1)所示:
Y = f ( p ) × G a m m ( α ,   β )
式中: αβ分别代表伽马分布的形状参数和尺度参数, p表示模型预测降水发生的概率。 f ( p ) { 0 ,   1 }表示降水是否发生的判断结果。首先根据GPM IMERG训练集中每个网格日降水量小于1 mm的日数占比, 确定训练集预测降水概率序列中对应位置的概率值为阈值F, 作为是否发生降水的判断标准。若测试集预测的降水概率 p < F, 则视为无降水, 设 f ( p ) = 0; 若 p F, 则视为有降水, 设 f ( p ) = 1。在此基础上, 从Gamma(αβ)分布中随机采样降水强度, 并与 f ( p )相乘可得到最终降水量Y
图1 地形引导注意力网络结构示意图

Fig.1 Schematic diagram of the terrain-guided attention network architecture

TGAN模型主要由两个分支构成: 主分支和地形分支, 两者协同作用以实现对复杂地形区域降水分布的精准建模与细节重建。
(1) 主分支
主分支采用拉普拉斯金字塔结构, 由特征提取分支和重建分支构成, 输入低分辨率的大气变量。特征提取分支首先通过卷积层与激活函数进行初步特征提取, 随后依次通过3个残差密集块(Residual Dense Block, RDB)以提取更深层次的高阶特征。RDB 模块采用密集连接机制, 有助于缓解梯度消失问题, 增强特征的传递与复用能力。每个 RDB 模块后均连接一个上采样(Upsample)模块, 实现特征图分辨率的逐级提升。重建分支同样通过三个上采样模块逐步提升空间分辨率, 并在每一级与特征提取分支对应尺度的残差特征进行逐元素相加, 从而实现精细的降水重建。
(2) 地形分支
地形分支主要对原始高程数据进行逐级下采样, 使其空间分辨率与主干网络各个上采样阶段相匹配, 为后续的多尺度特征融合奠定基础。传统的降尺度模型通常仅将辅助信息与低分辨率大气数据简单拼接作为输入, 未能充分挖掘地形数据中的多层次特征。为了更有效的利用地形辅助信息, 本模型引入多尺度特征融合机制, 在重建分支每个上采样阶段之后嵌入地形引导注意力模块(TGAB), 实现气象与地形数据在多个尺度上的深度融合, 从而提升降尺度性能。TGAB的具体计算方式如式(2)所示:
F i n p u t = δ [ f C ( ω 1 , M e t ) ] σ [ f C ( ω 2 , D e m ) ]
式中: ω 1ω 2​分别表示卷积层的参数; f C为卷积操作符; Met为气象数据; Dem为数字高程模型。为更有效地建模高低分辨率数据之间的复杂映射关系, 模型在对气象特征进行卷积处理后引入ReLU激活函数δ, 以增强其非线性表达能力; 同时, 对DEM特征图施加 Sigmoid 激活函数σ, 生成地形引导的注意力图。该注意力图随后与气象特征图进行逐元素乘法操作, 以实现气象特征的地形自适应加权, 从而提升模型的降尺度性能。

3.2 损失函数

合适的损失函数对于降水预测至关重要。本研究采用基于伯努利-伽马分布的复合损失函数, 即:
L ( p , α , β , y t r u e ) = ( 1 - p t r u e ) l o g ( 1 - p + ε ) + p t r u e l o g ( p + ε ) + ( α - 1 ) l o g ( y t r u e + ε ) - α l o g ( β + ε ) - l o g ( Γ ( α + ε ) ) - y t r u e β + ε
式中: p为神经网络预测降水发生的概率; αα > 0)和 ββ > 0)分别为伽马分布的形状和尺度参数; Γ(α)为伽马函数。 y t r u e是降水量, p t r u e是二进制的降水概率(1表示降水, 0表示无降水), 其值由 y t r u e确定, y t r u e>0时, p t r u e为1, 否则为0。 ϵ是正则化参数, 用于避免数值不稳定。该损失函数综合考虑了降水的二元性与连续性, 采用伯努利分布刻画降水的发生概率, 伽马分布建模降水强度。通过统一的概率框架, 该损失函数可以同时优化降水发生概率与降水量的预测精度, 从而在提升整体降水模拟能力的同时, 显著增强极端降水事件的预测性能(Rampal et al, 2022)。

4 结果

4.1 降水指标评估

本文选取Baño-Medina et al(2020)提出的CNN模型作为基准模型, 同时移除TGAN模型中的地形分支, 构建无地形信息的对照模型(TGAN-noland), 以分析地形信息在降水降尺度中的作用。为全面评估各模型的降尺度性能, 本节计算了3种模型在黄河中游地区日降水模拟中的均方根误差(RMSE)、 皮尔逊相关系数(CC)以及第95百分位数和第99百分位数偏差, 结果如图2表2所示。TGAN在日尺度降水模拟中的综合表现明显优于CNN和TGAN-noland模型。其中, TGAN的平均RMSE最低(5.10 mm·d-1), 较CNN下降9.3%; 平均CC最高(0.42), 较CNN提高16.7%。在极端降水模拟方面, TGAN第95百分位数和第99百分位数偏差分别为0.68%和-1.25%, 相较于CNN, 分别减少11.0%和6.5%。与TGAN-noland相比, TGAN 在第95百分位数和第99百分位数偏差上也有显著改善, 不仅均值偏差更接近于0, 其四分位距范围也更小, 表明模拟结果在空间上更加稳定。此外, 本节进一步分析了TGAN模型相较于CNN模型在多项降水评估指标空间分布上的改进情况[图2(e)~(h)]。结果表明, TGAN模型的RMSE在大多数区域均低于CNN模型, 部分区域的降幅超过10%; CC普遍高于CNN模型, 在大多数区域提升幅度超过10%。TGAN的第95百分位数和第99百分位数偏差相较于CNN也有所降低。综上所述, TGAN模型在日尺度降水降尺度模拟中表现出更高的模拟精度和更强的极端降水捕捉能力, 不仅显著优于传统CNN基准模型, 也优于去除地形信息的TGAN-noland模型。这一结果表明, 在复杂地形区域, 地形信息对降水空间分布的重建及强降水事件的准确模拟具有重要作用。
图2 降水降尺度模型在2011 -2020年黄河中游地区日降水模拟中的性能评估 (a)日降水均方根误差(RMSE, 单位: mm·d⁻¹)、 (b)相关系数(CC)、 (c)第95百分位数偏差(单位: %)、 (d)第99百分位数偏差(单位: %)的箱线图。其中, 箱体表示第25~75百分位数范围, 箱内黑色实线表示均值。灰色虚线在(a)和(b)中表示CNN的平均值, 在(c)和(d)中表示0%。误差线的上下界分别表示去除异常值后的最大值和最小值。(e)~(h)展示了TGAN相较于CNN在日降水RMSE、 CC以及第95百分位和第99百分位偏差(单位: %)的空间分布

Fig.2 Evaluation of daily precipitation simulation performance of downscaling models over the middle reaches of the Yellow River (MRYR) from 2011 to 2020.(a) root mean square error (RMSE, unit: mm·d⁻¹), (b) correlation coefficient (CC), (c) bias (unit: %) of the 95th-percentile precipitation, and (d) bias (unit: %) of the 99th-percentile precipitation, presented as boxplots.The boxes represent the 25th–75th percentile range.The solid black line in the box indicates the mean value.The dashed gray line represents the CNN mean value in (a) and (b), while it represents 0% in (c) and (d).The upper and lower boundaries of the error bars represent the maximum and minimum values after removing anomalies, respectively.(e)~(h) show the spatial distributions of the differences between TGAN and CNN in daily precipitation RMSE, CC, and the 95th- and 99th-percentile biases (unit: %)

表2 不同降尺度模型在2011 -2020年日尺度降水模拟中的平均性能指标及其相对于CNN模型的变化幅度

Table 2 Average performance metrics of different downscaling models for daily precipitation simulations from 2011 to 2020 along with their relative changes compared to the CNN model

时间尺度 模型 RMSE/(mm·d⁻¹) CC 第95百分位数偏差/% 第99百分位数偏差/%
CNN 5.62 0.36 11.66 7.74
TGAN-noland 5.29 (↓5.9%) 0.41 (↑13.9%) 8.23 (↓3.4%) 5.46 (↓2.3%)
TGAN 5.10 (↓9.3%) 0.42 (↑16.7%) 0.68 (↓11.0%) -1.25 (↓6.5%)

括号中的数值表示相对变化百分比, ↑和↓分别表示该指标相对于CNN模型有所提升或降低(values in parentheses indicate the percentage of relative change, where ↑ and ↓ denote an increase or decrease of the corresponding metric relative to the CNN model, respectively)

三种降尺度模型在月尺度和年尺度降水模拟中RMSE和CC的平均值以及性能提升情况如表3所示。在月尺度降水模拟中, TGAN模型相较于CNN模型, RMSE降低9.9%, CC提高2.7%。在年尺度, TGAN模型的RMSE降低7.7%, CC提高6.5%。上述结果表明, TGAN模型在日、 月和年多个时间尺度上均能显著提升降水预测的精度, 具有良好的稳健性。
表3 不同模型在月尺度和年尺度降水模拟中的平均性能指标及其相对于CNN模型的变化幅度

Table 3 Average performance metrics of different models for monthly and annual precipitation simulations along with their relative changes compared with the CNN model

时间尺度 模型 RMSE/(mm·d⁻¹) CC
CNN 1.21 0.75
TGAN-noland 1.13 (↓6.7%) 0.76 (↑1.3%)
TGAN 1.09 (↓9.9%) 0.77 (↑2.7%)
CNN 0.39 0.29
TGAN-noland 0.38 (↓2.6%) 0.28 (↓3.4%)
TGAN 0.36 (↓7.7%) 0.31 (↑6.5%)

括号中的数值表示相对变化百分比, ↑和↓分别表示该指标相对于CNN模型有所提升或降低(values in parentheses indicate the percentage of relative change, where ↑ and ↓ denote an increase or decrease of the corresponding metric relative to the CNN model, respectively)

4.2 平均降水和极端降水

本节基于2011 -2020年的GPM IMERG观测数据和深度学习模型的模拟结果, 对多年平均降水的空间分布特征进行了系统分析[图3(a), (d), (g), (j)]。结果表明, 黄河中游地区多年平均降水呈现出明显的梯度分布, 降水量自西北向东南逐步递增。深度学习模型均能较好的再现这一空间分布格局。为进一步评估模型对极端降水事件的模拟能力, 本文采用了气候变化检测与指数专家组所定义的两个关键气候指数: R95P和R99P。其中, R95P(R99P)定义为日降水量超过95%(99%)百分位阈值的年累计降水量。GPM IMERG观测和深度学习模型在R95P与R99P上的空间分布结果表明(图3), 深度学习模型均能够较为准确地再现极端降水的空间分布特征, 其模拟结果与GPM IMERG观测数据具有较好的一致性。
图3 2011 -2020年黄河中游地区GPM IMERG观测值(a~c)与CNN(d~f)、 TGAN-noland(g~i)和TGAN(j~l)模型的多年平均降水(左, 单位: mm·d⁻¹)及R95P(中, 单位: mm)、 R99P(右, 单位: mm)的空间分布特征

Fig.3 Spatial distributions of multi-year average precipitation (left, unit: mm·d⁻¹), R95P (middle, unit: mm), and R99P (right, unit: mm) over the MRYR from 2011 to 2020, with (a~c) showing GPM IMERG observations, (d~f) CNN, (g~i) TGAN-noland, and (j~l) TGAN

此外, 本节还评估了2011 -2020年黄河中游地区年均降水和月均降水的时间变化情况, 结果如图4所示。三种降尺度模型均能在一定程度上捕捉该区域降水的年际变化趋势和季节性波动特征, 表现出较好的模拟能力。然而, 在月均降水模拟中, 各模型普遍存在夏季降水峰值高估的问题。相较之下, TGAN模型在多个降水高峰期的模拟结果与GPM IMERG观测更为接近, 偏差更小, 表现出更优的拟合能力和更强的鲁棒性。定量评估结果显示, TGAN模型在月均降水上的RMSE为0.40 mm·d⁻¹, CC为0.95, 均优于基准CNN模型的RMSE(0.43 mm·d⁻¹)和CC(0.93), 分别降低了7.5%和提升了2.2%。
图4 2011 -2020年各模型模拟值与GPM IMERG观测值在黄河中游地区的月均降水量(a)和年均降水量(b)对比分析

Fig.4 Comparison of monthly (a) and annual (b) mean precipitation simulated by different models with GPM IMERG observations over the MRYR from 2011 to 2020

图5(a)~(c)显示了各模型与GPM IMERG观测数据在2011 -2020年降水、 R95P和R99P的季节性变化情况, 可以看出, 各模型模拟降水及R95P和R99P的季节性变化与GPM IMERG观测基本保持一致, 均表现出明显的季节性特征, 降水主要集中在夏秋两季, 春季次之, 冬季最少。在此基础上, 为更全面刻画年内降水的时序变化规律, 本节进一步分析了各模型模拟的月际变化过程。结果表明, 在降水的月际变化中, TGAN模型表现最好, 7 -12月的模拟结果与GPM IMERG观测高度吻合[图5(d)]。在R95P和R99的月际变化方面, 各模型在8 -12月的模拟效果相对较好, 但在1 -7月偏差较大, 低估或高估现象较为明显[图5(e)~(f)]。
图5 2011 -2020年GPM IMERG与不同降尺度模型在黄河中游地区降水(单位: mm·d⁻¹)、 R95P(单位: mm)和R99P(单位: mm)的季节性(上)与月际变化(下)对比分析

Fig.5 Comparison of seasonal (top) and monthly (bottom) variations in precipitation (unit: mm·d⁻¹), R95P (unit: mm), and R99P (unit: mm) over the MRYR from 2011 to 2020 for GPM IMERG and different downscaling models

4.3 日降水的概率密度分布

为评估各模型在模拟不同强度降水频率方面的能力, 本节对比了GPM IMERG与三个降尺度模型在2011 -2020年的日降水概率密度函数, 结果如图6所示。从图6可以看出, 三种降尺度模型整体上均能够较好地捕捉到GPM IMERG观测日降水的频率分布特征。其中, TGAN模型表现最优, 其概率密度分布在大降水区间内与GPM基本重合, 展现出较强的极端降水模拟能力。
图6 2011 -2020年黄河中游地区各模型与GPM IMERG观测的日降水概率密度函数对比分析

Fig.6 Comparison of daily precipitation probability density functions between model simulations and GPM IMERG observations in the MRYR from 2011 to 2020

5 讨论

为了讨论不同的损失函数对于模型性能的影响。另外训练了一组使用RMSE损失函数的TGAN模型。与原始TGAN 模型不同的是, 该模型直接预测降水量本身, 而非p、 log α和log β 等中间参数, 并以 RMSE 作为优化目标以最小化预测值与观测值之间的均方根误差。随后, 将该模型与本文基于Bernoulli-Gamma损失函数的TGAN模型进行了系统比较。在此, 将使用Bernoulli-Gamma 损失函数训练的TGAN模型称为BG-TGAN, 使用RMSE损失函数训练的TGAN模型称为RMSE-TGAN。如图7所示, 箱体表示第25~75百分位数范围, 箱内黑色实线表示均值, 误差棒上下边界表示剔除异常值后的最大值和最小值(下同)。其中, (a)和(b)中的灰色虚线表示BG-TGAN的均值参考线, (c)和(d)中的灰色虚线表示0%偏差参考线, 用于对比不同模型在均方根误差、 相关系数及极端降水百分位数偏差方面的差异。采用RMSE-TGAN在整体精度上表现更优, 具体体现为较低的RMSE和更高的CC。与采用BG-TGAN损失函数的模型相比, 其RMSE(4.06 mm·d-1)降低了20%, CC(0.53)提高了26%。然而, 在极端降水的模拟上(第95和99百分位数偏差), 采用 RMSE 损失函数的模型却产生了较大的负偏差, 明显偏离观测值; 相比之下, 采用BG-TGAN损失函数的模型虽然整体拟合性能略低, 但其在第95和99百分位数偏差上更接近于观测值, 能够更准确地反映极端降水事件的分布特征。这表明, 虽然 RMSE 损失函数有助于整体精度的提升, 但牺牲了对极端降水事件的模拟能力; 而Bernoulli-Gamma 损失函数则在保证极端降水特征方面更具优势。此外, 进一步绘制了这两个模型与GPM IMERG观测数据的日降水概率密度分布(图8)。从图8中可以看出, 采用 BG-TGAN损失函数的模型日降水概率密度分布与GPM IMERG基本保持一致, 能够较好地重现不同量级降水事件的分布特征。采用RMSE-TGAN模拟降水主要集中在1~10 mm区间, 而在10~100 mm区间的降水频率则被显著低估。最后, 将这两组模型的模拟结果以及GPM IMERG观测数据在指定站点处的日降水概率密度分布与站点数据进行了比较(图9)。以GPM IMERG数据为基准, 确定覆盖95%降水事件的阈值(图9中的灰色虚线), 并将超过该阈值的少量极端降水事件合并统计。结果表明, 虽然4个站点的观测数据与GPM IMERG在部分降水区间的概率密度分布存在一定的差异, 但是整体分布趋势基本一致。同时, BG-TGAN在指定站点处的概率密度分布与站点数据基本保持一致, 而RMSE-TGAN在强降水时间频率仍存在明显的低估现象。这进一步表明具有Bernoulli-Gamma 损失函数的模型能够更好地捕捉极端降水事件, 从而较好地再现降水频率的分布特征。
图7 2011 -2020年BG-TGAN和RMSE-TGAN在黄河中游地区日降水模拟中的均方根误差(a, 单位: mm·d⁻¹)、 皮尔逊相关系数(b, CC)以及第95百分位数和第99百分位数偏差(c, d, 单位: %)

Fig.7 Root mean square error (a, RMSE, unit: mm·d⁻¹), pearson correlation coefficient (b, CC), and biases of the 95th and 99th percentiles (c, d, unit: %) in daily precipitation simulations over the middle reaches of the Yellow River from 2011 to 2020, obtained from BG-TGAN and RMSE-TGAN models

图8 2011 -2020年黄河中游地区BG-TGAN(橘色线)和RMSE-TGAN(绿色线)的模拟结果以及GPM IMERG观测数据的日降水量概率密度函数(蓝色线)

Fig.8 Daily precipitation probability density functions along with GPM IMERG observations (blue line), the simulation results of BG-TGAN (orange line) and RMSE-TGAN (green line) over the MRYR from 2011 to 2020

图9 2011 -2020年四个站点位置上的日降水量概率密度分布比较 灰色虚线表示覆盖 95% 降水事件的阈值, 超过该阈值的降水事件较为少见, 因此在统计时将其合并计算

Fig.9 Comparison of daily precipitation probability density distributions at four station locations from 2011 to 2020.The gray dashed lines indicate thresholds covering 95% of precipitation events, events exceeding these thresholds are relatively rare and therefore aggregated in the statistics

6 结论与讨论

本研究提出了一种基于地形引导注意力的降水降尺度模型, 用于建立低分辨率大气数据与高分辨降水之间的非线性映射关系。为验证该模型的有效性, 本研究选取CNN基准模型和不包含地形信息的TGAN(TGAN-noland)作为对照组, 基于2011 -2020年数据开展实验分析, 得到以下主要结论:
(1) TGAN模型的整体性能明显优于TGAN-noland模型, 可见高程信息与降水分布具备较强相关性, 一定程度上能够帮助深度学习模型更好的重建降水场。
(2) 在日尺度的降水模拟中, TGAN表现最优。相较于基准模型CNN, TGAN的平均RMSE降低9.3%, 平均CC提高16.7%。此外, TGAN对第95百分位和第99百分位降水的预测结果与GPM IMERG观测数据更为接近, 表明其在降水模拟方面具有更高的精度和稳定性。
(3) 在月尺度和年尺度的降水模拟中, TGAN模型也明显优于CNN模型, 表明该模型在日、 月、 年等多个时间尺度上均具有较强的降水模拟能力。
(4) TGAN模型日降水的概率密度分布与GPM IMERG观测基本吻合, 尤其是在大降水区间表现更好, 展现出更强的极端降水事件捕捉能力。
尽管TGAN模型在重建高分辨率降水场方面取得了较好的精度, 但其性能仍有进一步提升的空间。本研究中, 设计的地形引导注意力模块结构相对简单, 仅基于高程信息生成注意力权重用于特征加权, 尚未充分挖掘大气变量与地形之间的复杂交互关系。未来研究可探索更先进的注意力机制, 如Transformer或可变形注意力, 以更好地建模地形与气候要素之间的非线性依赖关系, 增强模型降水降尺度的性能。其次, 数据驱动模型在实际应用中往往难以保证物理一致性, 可能产生违背降水物理机制的结果。未来可从两方面引入物理约束以提升模型可靠性(Kashinath et al, 2021): (1)软约束: 在损失函数中加入反映守恒定律或偏微分方程的正则项, 引导模型输出更符合物理规律的结果; (2)硬约束: 通过设计特定网络结构, 如守恒层或偏微分方程约束模块, 使物理规律在模型中严格成立。相比软约束, 硬约束具备更强泛化能力, 适用于不同区域和极端气候条件。将物理机制与数据驱动方法相融合是未来提升降水降尺度模型可信度与稳健性的关键路径。 同时, 本文仅在黄河中游地区进行了测试, TGAN模型在其他气候区或地形条件下的适用性尚未得到验证。未来研究可将模型应用于不同区域, 以进一步评估其在更广泛气候条件下的适应能力和稳健性。
Baño-Medina J Manzanas R Gutiérrez J M2020.Configuration and intercomparison of deep learning neural models for statistical downscaling[J].Geoscientific Model Development13(4): 2109-2124.DOI: 10.5194/gmd-13-2109-2020 .

Baño-Medina J Manzanas R Gutiérrez J M2021.On the suitability of deep convolutional neural networks for continental-wide downscaling of climate change projections[J].Climate Dynamics57(11): 2941-2951.DOI: 10.1007/s00382-021-05847-0 .

Denis B Laprise R Caya D2003.Sensitivity of a regional climate model to the resolution of the lateral boundary conditions[J].Climate Dynamics20(2): 107-126.DOI: 10.1007/s00382-002-0264-6 .

Dujardin J Lehning M2022.Wind‐Topo: downscaling near‐surface wind fields to high‐resolution topography in highly complex terrain with deep learning[J].Quarterly Journal of the Royal Meteorological Society148(744): 1368-1388.DOI: 10.1002/qj. 4265 .

Fu H Guo J N Deng C G, et al, 2024.Deep‐learning‐based downscaling of precipitation in the middle reaches of the Yellow River using residual‐based CNNs[J].Quarterly Journal of the Royal Meteorological Society150(763): 3290-3304.DOI: 10.1002/qj.4759 .

Giorgi F Gutowski Jr W J2015.Regional dynamical downscaling and the CORDEX initiative[J].Annual review of environment and resources40(01): 467-490.DOI: 10.1146/annurev-environ-102014-021217 .

Giorgi F Mearns L O1999.Introduction to special section: regional climate modeling revisited[J].Journal of Geophysical Research: Atmospheres104(D6): 6335-6352.DOI: 10.1029/98JD02072 .

Jacob D Petersen J Eggert B, et al, 2014.EURO-CORDEX: new high-resolution climate change projections for European impact research[J].Regional Environmental Change14(2): 563-578.DOI: 10.1007/s10113-013-0499-2 .

Kashinath K Mustafa M Albert A, et al, 2021.Physics-informed machine learning: case studies for weather and climate modelling[J].Philosophical Transactions of the Royal Society A: Mathematical, Physical and Engineering Sciences379(2194): 20200093.DOI: 10.1098/rsta.2020.0093 .

Lai W S Huang J B Ahuja N, et al, 2017.Deep laplacian pyramid networks for fast and accurate super-resolution[C].2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 5835-5843.DOI: 10.1109/cvpr.2017.618 .

Lai W S Huang J B Ahuja N, et al, 2018.Fast and accurate image super-resolution with deep laplacian pyramid networks[J].IEEE transactions on pattern analysis and machine intelligence41(11): 2599-2613.DOI: 10.1109/tpami.2018.2865304 .

Laprise R2008.Regional climate modelling[J].Journal of computational physics227(7): 3641-3666.DOI: 10.1016/j.jcp.2006. 10.024 .

Ledig C Theis L Huszár F, et al, 2017.Photo-realistic single image super-resolution using a generative adversarial network[C].2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 105-114.DOI: 10.1109/CVPR.2017.19 .

Maraun D Wetterhall F Ireson A M, et al, 2010.Precipitation downscaling under climate change: recent developments to bridge the gap between dynamical models and the end user[J].Reviews of geophysics48(3): 2009RG000314.DOI: 10.1029/2009rg000314 .

Maussion F Scherer D Finkelnburg R, et al, 2011.WRF simulation of a precipitation event over the Tibetan Plateau, China-an assessment using remote sensing and ground observations[J].Hydrology and Earth System Sciences15(6): 1795-1817.DOI: 10. 5194/hess-15-1795-2011 .

Rampal N Gibson P B Sood A, et al, 2022.High-resolution downscaling with interpretable deep learning: rainfall extremes over New Zealand[J].Weather and Climate Extremes, 38: 100525.DOI: 10.1016/j.wace.2022.100525 .

Su X L Shum C K Luo Z C2018.Evaluating IMERG V04 final run for monitoring three heavy rain events over mainland China in 2016[J].IEEE Geoscience and Remote Sensing Letters15(3): 444-448.DOI: 10.1109/lgrs.2018.2793897 .

Sun L Lan Y F2021.Statistical downscaling of daily temperature and precipitation over China using deep learning neural models: localization and comparison with other methods[J].International Journal of Climatology41(2): 1128-1147.DOI: 10.1002/joc. 6769 .

Tang G Q Clark M P Papalexiou S M, et al, 2020.Have satellite precipitation products improved over last two decades? a comprehensive comparison of GPM IMERG with nine satellite and reanalysis datasets[J].Remote sensing of environment, 240: 111697.DOI: 10.1016/j.rse.2020.111697 .

Tian L Jin J M Wu P T, et al, 2020.High-resolution simulations of mean and extreme precipitation with WRF for the soil-erosive Loess Plateau[J].Climate Dynamics54(7): 3489-3506.DOI: 10.1007/s00382-020-05178-6 .

Vandal T Kodra E Ganguly S, et al, 2017.Deepsd: generating high resolution climate change projections through single image super-resolution[C].Proceedings of the 23rd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 1663-1672.DOI: 10.1145/3097983.3098004 .

Wang F Tian D Lowe L, et al, 2021.Deep learning for daily precipitation and temperature downscaling[J].Water Resources Research57(4): e2020WR029308.DOI: 10.1029/2020wr029308 .

Wang X T Yu K Wu S X, et al, 2019.ESRGAN: enhanced super-resolution generative adversarial networks[C].Computer Vision-ECCV 2018 Workshops, 63-79.DOI: 10.1007/978-3-030-11021-5_5 .

Yun Y X Liu C H Luo Y L, et al, 2020.Convection-permitting regional climate simulation of warm-season precipitation over Eastern China[J].Climate Dynamics54(3): 1469-1489.DOI: 10. 1007/s00382-019-05070-y .

陈超君, 王钦, 2014.降尺度技术的应用研究进展[J].气象科技进展4(2): 62-65.DOI: 10.3969/j.issn.2095-1973.2014.02.008.Chen C J

Wang Q2014.Recent advances on the application for the downscaling technology[J].Advances in Meteorological Science and Technology4(2): 62-65.DOI: 10.3969/j.issn.2095-1973.2014.02.008 .

陈涵, 管晓丹, 马婷婷, 2025.机器学习与传统降尺度法处理黄河流域夏季气象要素的差异[J].高原气象44(4): 987-1004.DOI: 10.7522/j.issn.1000-0534.2024.00118.Chen H

Guan X D Ma T T2025.Differences between machine learning and traditional downscaling method in processing summer meteorological elements in the Yellow River Basin[J].Plateau Meteorology44(4): 987-1004.DOI: 10.7522/j.issn.1000-0534.2024.00118 .

杜晓婉, 陈曦, 郑宏伟, 等, 2023.一种降水降尺度模型: 地形约束下的条件生成对抗网络[J].地球信息科学学报25(8): 1586-1600.DOI: 10.12082/dqxxkx.2023.230033.Du X W

Chen X Zheng H W, et al, 2023.A precipitation downscaling model: conditional generative adversarial networks under terrain constraints[J].Journal of Geo-Information Science25(8): 1586-1600.DOI: 10.12082/dqxxkx.2023.230033 .

胡迎春, 陈耀登, 高玉芳, 等, 2024.基于雷达估测降雨及WRF-Hydro模型的典型山洪模拟研究[J].高原气象43(1): 254-263.DOI: 10.7522/j.issn.1000-0534.2023.00044.Hu Y C

Chen Y D Gao Y F, et al, 2024.Simulation study of typical flash floods based on radar-estimated rainfall and WRF-Hydro model[J].Plateau Meteorology43(1): 254-263.DOI: 10.7522/j.issn.1000-0534.2023.00044 .

黄健, 赵元元, 郭苹, 等, 2021.深度学习的单幅图像超分辨率重建方法综述[J].计算机工程与应用57(18): 13-23.DOI: 10.3778/j.issn.1002-8331.2102-0257.Huang J

Zhao Y Y Guo P, et al, 2021.Survey of single image super-resolution based on deep learning[J].Computer Engineering and Applications57(18): 13-23.DOI: 10.3778/j.issn.1002-8331.2102-0257 .

鲁心怡, 黄昱, 吴天筱, 等, 2024.深度学习在超分辨显微成像中的研究进展[J].激光与光电子学进展61(16): 1-31.DOI: 10.3788/LOP241455.Lu X Y

Huang Y Wu T X, et al, 2024.Advances in deep learning for super-resolution microscopy[J].Laser and Optoelectronics Progress61(16): 1-31.DOI: 10.3788/LOP241455 .

任保平, 杜宇翔, 2021.黄河中游地区生态保护和高质量发展战略研究[J].人民黄河43(2): 1-5.DOI: 10.3969/j.issn.1000-1379.2021.02.001.Ren B P

Du Y X2021.Strategic study on ecological protection and high-quality development in the Middle Yellow River[J].Yellow River43(2): 1-5.DOI: 10.3969/j.issn.1000-1379.2021.02.001 .

汪红, 严乔顺, 赵祖军, 等, 2025.基于GWR降尺度的哀牢山2000-2020年降水时空变化特征研究[J].高原气象44(3): 643-656.DOI: 10.7522/j.issn.1000-0534.2024.00093.Wang H

Yan Q S Zhao Z J, et al, 2025.The spatiotemporal variations characteristics of precipitation in the Ailao Mountain Area during 2000-2020 based on geographical weighted regression downscaling method[J].Plateau Meteorology44(3): 643-656.DOI: 10.7522/j.issn.1000-0534.2024.00093 .

杨雅婷, 刘爱利, 赵林, 等, 2024.考虑地形风、 云影响的IMERG日降水随机森林降尺度研究——以青藏高原腹地为例[J].地球信息科学学报26(11): 2643-2657.DOI: 10.12082/dqxxkx.2024.240344.Yang Y T

Liu A L Zhao L, et al, 2024.Random forest-based downscaling of IMERG daily precipitation considering orographic wind and cloud effects: a case study in the Tibetan Plateau hinterland[J].Journal of Geo-Information Science26(11): 2643-2657.DOI: 10.12082/dqxxkx.2024.240344 .

张慕琪, 闻新宇, 包赟, 等, 2022.基于人工神经网络开发中国地区统计降尺度气候预估数据[J].北京大学学报(自然科学版)58(2): 221-233.DOI: 10.13209/j.0479-8023.2022.015.Zhang M Q

Wen X Y Bao Y, et al, 2022.Statistical downscaled climate projection dataset for China using artificial neural network [J].Acta Scientiarum Naturalium Universitatis Pekinensis58(2): 221-233.DOI: 10.13209/j.0479-8023.2022.015 .

朱姜韬, 杨庆怡, 李旭, 等, 2023.中国西北地区夏季降水及其东部降尺度预测模型[J].高原气象42(3): 646-656.DOI: 10.7522/j.issn.1000-0534.2022.00102.Zhu J T

Yang Q Y Li X, et al, 2023.Characteristics and east downscaling forecast model of summer precipitation in Northwest China[J].Plateau Meteorology42(3): 646-656.DOI: 10.7522/j.issn.1000-0534.2022.00102 .

文章导航

/