Soil Moisture Simulation in Maqu Using a Bi-LSTM Model and Multi-Source Data Fusion

  • Wenbo LIU , 1 ,
  • Chunbin LI , 1 ,
  • Jing WU 1 ,
  • Yuanyuan MA 2
Expand
  • 1. College of Resources and Environment,Gansu Agricultural University,Lanzhou 730070,Gansu,China
  • 2. State Key Laboratory of Cryospheric Science and Frozen Soil Engineering,Northwest Institute of Eco-Environment and Resources,Chinese Academy of Sciences,Lanzhou 730000,Gansu,China

Received date: 2025-05-15

  Revised date: 2025-08-20

  Online published: 2026-05-22

Copyright

© Editorial Department of Plateau Meteorology (CC BY-NC-ND)

Abstract

Soil moisture is the key variable of the land-atmosphere interactions and ecosystem dynamics, so obtaining the soil moisture data with high spatiotemporal resolution is significant for simulating the hydrological process and managing the resource.The study is Maqu County,which is located on the eastern edge of the Qinghai-Tibet Plateau.We choose the SMAP daily soil moisture products and hourly in situ observations from ISMN as the base data.we build a Bi-LSTM model by using the GEE technology to construct the data in temporal scale, and by utilizing the random forest regression to downscale the soil moisture from 9 km to 250 m with the multi-high-resolution data (NDVl, DEM, and LST).The results show that Bi-LSTM model with a ratio constrained correction can estimate the hourly soil moisture effectively, have a well performance in multi-site validation with a maximum R 2 of 0.8735, and the random forest model give us a distribution characterization with more refined spatial scale.In this study, we refine the remotely sensed soil moisture in space-time dimension synchronously, and overcome the limitations of traditional approaches which build model by downscaling spatial scale only.

Cite this article

Wenbo LIU , Chunbin LI , Jing WU , Yuanyuan MA . Soil Moisture Simulation in Maqu Using a Bi-LSTM Model and Multi-Source Data Fusion[J]. Plateau Meteorology, 2026 , 45(3) : 666 -677 . DOI: 10.7522/j.issn.1000-0534.2025.00094

1 引言

土壤水分作为连接大气过程与陆面过程的关键变量, 是影响气候、 水文、 农业和生态系统的重要控制因子(董世玉等, 2023)。土壤水分的变化直接影响着地表热通量的变化, 从而影响区域气候变化(Ma et al, 2025廖慧仁等, 2024), 其时空分布特征决定了地表能量平衡、 蒸散发过程、 径流生成机制以及植被生长动态(张戈等, 2023马英赛等, 2019), 对防灾减灾和水资源管理有很大影响(高雅, 2024)。特别是在青藏高原这一全球气候变化敏感区, 土壤水分在冻融循环、 碳水通量与生态稳定性中发挥着不可替代的作用(卢调雪等, 2025侯雅等, 2025)。但土壤水分数据获取困难、 时空分辨率低等问题, 限制了区域水热过程建模与气象灾害预警能力的提升(Peng et al, 2021方西瑶等, 2022)。
对于土壤水分的研究, 传统的基于站点土壤水分测量技术有干燥失重法、 时域反射法、 中子探针法及热流法等(郑涵和王海峰, 2022), 虽然这些方法具有土壤水分测量值精准, 时效性好的优势, 但是对于大面积土壤水分监测却存在分布稀疏、 代表性不足等问题, 难以实现点到面上的扩充。遥感技术是一种非接触式远距离的测量技术, 通过无人机光学遥感、 卫星微波遥感以及卫星导航系统的反射测量(贾燕等, 2023)等技术, 可以快速获取大面积地表信息, 为土壤水分的大尺度观测提供新途径。如土壤水分主动被动探测卫星(Soil Moisture Active Passive,SMAP)提供的L3、 L4级土壤水分数据, 具备高时效性与广覆盖能力, 但在地形复杂区域内, 其9 km空间分辨率及3 h至每日时间尺度, 难以精细化捕捉到不同下垫面土壤水分的差异性(O'Neill et al, 2010; 薛智暄等, 2023)。因此, 基于多技术融合构建地面实测与遥感信息、 兼顾高精度与广覆盖的土壤水分估算方法成为当前研究热点(张蕾等, 2024刘杨晓月和杨雅萍, 2023)。
近年来, 依托强大的时序建模能力, 深度学习在土壤水分预测任务中的应用已十分广泛(Roberts et al, 2022耿庆田等, 2023)。长短期记忆网络(LSTM)及其双向扩展形式(Bi-LSTM)能够有效捕捉土壤水分日变化与季节性趋势, 对解决遥感数据时间间隙、 重建逐小时动态序列具有显著优势(Filipovi et al, 2023; 刘会丹等, 2023)。同时, 随机森林(RF)、 极限梯度提升(XGBoost)等机器学习方法在多源遥感数据融合、 空间插值和高分辨率重建方面展现出较强的泛化能力和变量解释性(Chen et al, 2021王思超等, 2024)。已有研究表明, 将SMAP粗分辨率土壤水分产品与高分辨率辅助因子融合, 可有效实现9 km至250 m的空间降尺度, 提高数据适用于区域应用的能力(Chen et al, 2017)。多源土壤水分数据的融合能够实现多源异构数据的时空协同, 可以整合点测量、 遥感及模型数据, 增强时空连续性。
玛曲地区地处青藏高原东缘、 甘南藏族自治州西南部, 是黄河重要源区与高寒湿地典型代表区。该区域在生态系统服务功能中发挥着蓄水、 调节气候和生物多样性保护的核心作用, 也是黄河水源涵养、 下游洪水调蓄与水资源调度的关键区域。近年来, 随着气候变暖和人类活动加剧, 玛曲地区出现湿地退化、 草地沙化等问题, 导致区域水文过程更加复杂, 对高分辨率土壤水分动态监测提出了更高需求(邴丹珲等, 2012逯军峰等, 2012曹慧宇, 2021)。对玛曲地区土壤水分进行研究, 对理解高原生态系统功能、 气候变化响应和水资源管理具有重要意义, 可为应对全球变化和促进区域可持续发展提供科学依据。为此, 本文选取玛曲地区为研究区, 基于ISMN站点逐小时实测土壤水分数据, 构建Bi-LSTM (Bi-directional Long Short-Term Memory)模型重建全年逐小时土壤水分时间序列; 再融合MODIS NDVI、 ASTER DEM、 ERA5气象数据与SMAP产品, 通过随机森林回归方法实现空间插值与降尺度, 最终生成具有逐小时、 250 m分辨率的高时空土壤水分模拟影像。本研究旨在弥补传统遥感产品在时间连续性与空间精度方面的不足, 耦合Bi-LSTM时间重建与RF空间降尺度, 将SMAP土壤水分数据从9 km空间分辨率提升至250 m, 时空分辨率提升至小时级别, 为青藏高原东缘区域生态水文建模、 气象灾害预警及水资源管理提供数据支持与方法借鉴。

2 研究区域与数据来源

2.1 研究区概况

玛曲地区位于甘肃省甘南藏族自治州西南部, 地处青藏高原东北缘与黄土高原过渡带之间。黄河自西南流入县境, 呈大“几”字形绕流, 是黄河上游重要的水源补给区和重要的生态功能区之一, 在维系流域水源涵养、 调节区域气候、 控制泥沙流失方面发挥着重要作用。
境内地势总体呈西南高、 东北低, 地形起伏剧烈, 冻土广布, 为典型高原高寒地貌类型。年平均气温0~2 ℃, 极端最低气温可达-35 ℃; 年均降水量400~600 mm, 集中在6 -9月, 占全年降水量的70%以上。属于青藏高原大陆性季风气候, 水热同季, 干湿分明, 对地表水热过程与生态系统响应极为敏感。

2.2 数据来源

本研究所使用的数据及其具体来源如下:
(1) 行政边界数据来自国家地理信息公共服务平台, 审图号为GS(2024)0650, 底图无修改。
(2) 土壤水分数据
逐小时土壤水分实测数据来自国际土壤水分网络(International Soil Moisture Network, ISMN), 选取了位于甘肃省玛曲县境内的NST01, NST03, NST08, NST09, NST25 5个观测站点(图1), 数据时间范围为2018年1 -12月。ISMN由全球多家气象、 农业、 水文等机构联合建设, 提供标准化质量控制后的土壤体积含水量(单位: m³·m-³)数据(Dorigo et al, 2021)。SMAP L3土壤水分产品数据为表层土壤水分数据, 时间分辨率为1 d, 空间分辨率为9 km。本研究所使用的SMAP L3级产品数据均在GEE(Goole Earth Engine)上使用代码获取。
图1 研究区海拔及站点分布

Fig.1 Map of attitnde and station distribution in the study area

(3) 归一化植被指数(NDVI)
使用MODIS数据提供的MOD13Q1产品, 其时间分辨率为16 d, 空间分辨率为250 m, 主要提供NDVI与EVI指数。本研究提取2018年全年的NDVI波段数据, 用以反映地表植被覆盖状况与土壤水分之间的耦合关系。
(4) 数字高程模型(DEM)及其衍生变量
高程数据使用NASA发布的SRTM(Shuttle Radar Topography Mission)数据产品SRTMGL1_003, 空间分辨率为30 m(Farr et al, 2007)。本研究基于该DEM数据在GEE平台上进一步计算了坡度(Slope)、 坡向(Aspect)和地形湿度指数(Terrain Ruggedness Index, TRI), 用于反映地形起伏、 坡面辐射与积水能力对土壤水分分布的影响。
(5) 地表温度(LST)
地表温度来自MODIS 数据中的MOD11A1日尺度产品, 其空间分辨率为1 km。该产品包含逐日白天和夜间地表温度值, 研究中主要选取日间地表温度作为表征蒸发潜力的重要因子。
(6) 土地覆盖类型: 土地覆盖信息提取自MODIS年尺度MCD12Q1产品, 空间分辨率为500 m。该产品提供多种分类体系, 本研究采用IGBP分类结果(LC_Type1), 包括草地、 湿地、 灌木、 裸地等类型, 反映不同下垫面特征对土壤含水量的影响。
(7) ERA5-Land气象数据
气象因子选取来自欧洲中期天气预报中心(ECMWF)发布的ERA5-Land逐小时再分析数据, 空间分辨率约0.1°×0.1°, 数据时间为2018年6月(Hersbach et al, 2020)。研究提取了逐小时2 m气温、 降水量等要素, 用于表征空气干燥程度与土壤水分蒸发的关系。

3 研究方法

3.1 双向长短期记忆网络(Bi-LSTM

长短期记忆网络(Long Short-Term Memory, LSTM)是一种特殊的循环神经网络(RNN), 最初由Hochreiter and Schmidhuber(1997)提出。相比于传统RNN(Recurrent Neural Network), LSTM引入了门结构和细胞状态, 解决了RNN在长序列学习过程中易于出现的梯度消失和梯度爆炸问题。
LSTM网络由多个LSTM单元按时间步长排列组成。每个LSTM单元由以下几个主要组件组成:
(1) 遗忘门
决定当前时刻哪些历史信息需要遗忘, 公式如下:
f t = σ ( W f [ h t - 1 , x t ] + b f )
式中: f t为遗忘门输出; W f ,   b f为权重矩阵和偏置; h t - 1为上一时刻隐藏状态; σ为Sigmoid激活函数; x t为当前输入。
(2) 输入门
输入门决定当前时刻哪些新信息需要存储, 公式如下:
i t = σ ( W i [ h t - 1 , x t ] + b i )
式中: i t为输入门激活值; W i为输入门的权重矩阵; b i输入门的偏置向量。
与此同时, 计算候选状态:
C ˜ t = t a n h   ( W C [ h t - 1 , x t ] + b C )
式中: C ˜ t为候选细胞状态; t a n   h为双曲正切激活函数; W C为候选状态的权重矩阵; b C为候选状态的偏置向量。
最终更新细胞状态:
C t = f t C t - 1 + i t C ˜ t
式中: C t为当前时刻细胞状态; C t - 1为上一时刻细胞状态。
(3) 输出门
决定哪些信息会输出到当前时刻的隐藏状态, 公式如下:
o t = σ ( W o [ h t - 1 , x t ] + b o )
式中: o t为输出门激活值; b o为输出门偏置向量。
隐藏状态的计算:
h t = o t t a n h   ( C t )
式中: o t为输出门激活值。
Bi-LSTM包含了前向与后向LSTM, 其输入数据经过两个方向计算, 最后结合隐藏状态作为下一层输入。Bi-LSTM同时拥有前向传播和反向传播, 能够提取序列的双向特征, 可以一定程度上增强捕捉时序信息的能力。
本研究按照节气分割土壤水分实测数据, 并将其作为输入序列, 采用滑动窗口长度为48个时间步长的输入序列, 步长为1 h, 逐步生成训练样本, 在每个时间步, LSTM单元根据当前输入和上一时刻的隐藏状态, 更新细胞状态并生成隐藏状态。经过多层网络传播后输出预测值, 得到下一个节气的逐小时土壤水分模拟值。损失函数采用均方误差(Mean Squared Error, MSE), 通过反向传播算法调整网络权重, 使模型误差最小化, 模型使用前80%时段作为训练集, 后20%时段作为验证集。

3.2 趋势校正

为了得到逐小时的SMAP数据, 本研究使用趋势校正法填补。通过Bi-LSTM模型生成的逐小时土壤水分预测值变化趋势带入SMAP原始数据中, 在有前后两个SMAP原始数据的时间点, 通过计算两个时段SMAP原始数据和实测土壤水分站点数据比值的均值, 得到一个修正系数R, 将这两个时段之间的模型预测值乘以修正系数R后, 得到与实测土壤水分数据有一致变化趋势的SMAP逐小时重构数据。
修正系数R计算:
R p r e v = S M A P p r e v M p r e v , R n e x t = S M A P n e x t M n e x t
式中: S M A P p r e v S M A P n e x t是一天内, SMAP卫星过境时间前后两个时刻的SMAP原始数据; M p r e v M n e x t是与SMAP卫星过境时间相对应的两个时间点的实测土壤水分值。
比值平均:
R a v g = R p r e v + R n e x t 2
式中: R a v g为均值校正系数; R p r e v R n e x t为前后两个时刻的SMAP土壤水分值与实测土壤水分值比值。
SMAP数据修正:
S M c o r r e c t e d = S M p r e d i c t e d × R a v g
式中: S M c o r r e c t e d为校正后土壤水分值; S M p r e d i c t e d为Bi-LSTM模型预测土壤水分值。
对于前后两个时刻有SMAP原始数据的时间段, 使用修正系数R来修正LSTM模型的预测值。如果前后没有SMAP数据, 则使用插值方法填补缺失值。

3.3 随机森林模型

随机森林是一种集成学习方法, 通过构建多个决策树并进行预测结果集成学习, 实现对高分辨率土壤水分的预测(Probst and Boulesteix, 2018)。模型基本流程如下:
(1) 在训练数据中随机抽取样本, 并构建多个决策树。每棵树使用随机选取的特征进行训练, 避免单一特征主导模型预测, 在树节点分裂时, 计算其均方误差MSE:
M S E = 1 N i = 1 N ( y i - y ^ i ) 2
式中: y i为真实值; y ^ i为预测值; N为样本数量。
(2) 模型参数优化。本研究中, 随机森林模型参数设置决策树数量为150, 最大叶节点数为64, 设置采样率为0.8, 同时选择损失函数为Huber损失函数, 以兼顾均方误差(MSE)和平均绝对误差(MAE)的优势。
(3) 使用5折交叉验证(5-Fold Cross Validation)法评估不同参数组合, 确保模型的最优配置。

4 结果与分析

4.1 土壤水分时间序列模拟与校正

本研究以2018年1 -12月ISMN实测逐小时土壤水分数据为训练与验证集, 同时按照节气周期进行时间序列建模, 让模型能更好地适应季节变化规律。使用Bi-LSTM模型进行逐小时土壤水分模拟, 并通过网格搜索和多组超参数组合实验, 确定模型最优配置为: 回溯窗口设为48, 隐藏层单元数为128, 丢失率为0.2。模型输出玛曲地区5个代表性站点在2018年逐小时尺度土壤水分估算值, 结果如图2所示。
图2 各站点2018年逐小时土壤水分时间序列图

Fig.2 Map of hourly soil moisture time series at all Stations in 2018

图2可知, Bi-LSTM模型能够较好地拟合土壤水分的时序变化趋势, 尤其在春夏交替和强降水期(6 -8月)波动响应明显。校正前的模拟数据在数值范围上偏离SMAP原始数据, 校正后通过引入前后SMAP与实测数据的比值系数R对预测序列进行了趋势约束, 使得模型输出在保持时间变化趋势一致性的同时, 量值更接近SMAP的观测水平。从模拟结果可以看出, 5个站点在2018年1-12月土壤水分变化规律存在明显差异性。在NST01站点, 3 -7月土壤水分呈稳步上升趋势, 7 -10月土壤水分变化规律呈现先减后增的波动趋势, 10月开始再次下降, 到12月降至全年最低; 在NST03站点, 1 -3月土壤水分表现出相对稳定状态, 3 -7月土壤水分呈现小幅波动, 平稳上升趋势, 至6月开始下降; 在NST08站点, 土壤水分自3月开始快速上升, 6 -7月出现小幅回落, 8 -9月受秋季降水和夜间露水共同作用, 第二次回升, 自11月以后随着气温下降和降水减少, 土壤水分逐渐变小; 在NST09站点, 3月开始土壤水分缓慢上升至5月; 6 -11月波动较大, 11月开始进入干季, 土壤水分迅速下降; 在NST25站点, 全年土壤水分变化幅度较小, 1 -10月小幅波动, 整体呈现上升态势, 11月波动明显, 至12月迅速降至全年最低点。综合5个站点的模拟结果, 可将玛曲地区土壤水分变化概括为“春增—夏稳—秋降—冬低”的四阶段模式:
春季(3 -5月)增水期: 融雪与春季降水共同驱动土壤水分快速累积, 所有站点均出现明显上升趋势。
夏季(6 -8月)高位波动期: 降水最为集中, 土壤水分变化明显, 但数值范围趋于稳定。
秋季(9 -10月)回落期: 降水量开始减少, 蒸散发逐步加强, 土壤水分呈全域下降趋势; 湿地边缘和河谷响应滞后约半个月。
冬季(11月至翌年2月)低水期: 降水与融雪停止, 土壤水分降至年度最低并趋于平稳, 各站点差异缩小。

4.2 逐小时土壤水分时空模拟

为进一步提高土壤水分的时间分辨率, 本研究选取2018年6月20日逐小时土壤水分模拟数据, 利用最小二乘法对实测土壤水分数据与SMAP重构值之间建立线性回归模型如表1所示, 模型p值均小于0.05, 通过显著性检验, 将6月20日的SMAP L3级土壤水分影像带入回归模型, 得到青藏高原逐小时土壤水分影像如图3所示。通过可视化展示不同时间点的土壤水分分布, 可以清晰观察到该区域土壤水分的时空变化特征。再对线性回归得到的逐小时土壤水分影像数据使用随机森林回归模型, 通过建立土壤水分与其他变量之间的关系, 生成逐小时土壤水分影像数据。
表1 实测土壤水分与SMAP重构值逐小时线性回归模型

Table 1 Hourly linear regression model between in-situ soil moisture measurements and SMAP reconstructed values

北京时 截距a/(m³·m-3 斜率b P_value 回归公式
00:00 -0.2498 1.3360 0.0179

Y=a+b×

SMAP

01:00 -0.1534 1.1582 0.0164
02:00 -0.1872 1.1790 0.0137
03:00 -0.2804 1.2741 0.0111
04:00 -0.2741 1.2647 0.0099
05:00 -0.2685 1.2563 0.0087
06:00 -0.2097 1.1608 0.0073
07:00 -0.2159 1.1602 0.0065
08:00 -0.1801 1.1092 0.0062
09:00 -0.1497 1.0586 0.0059
10:00 -0.1150 1.0086 0.0058
11:00 -0.0837 0.9609 0.0057
12:00 -0.0713 0.9364 0.0060
13:00 -0.0231 0.8469 0.0062
14:00 0.0253 0.7734 0.0059
15:00 0.0528 0.7228 0.0057
16:00 0.0766 0.6810 0.0055
17:00 0.0958 0.6471 0.0054
18:00 0.0281 0.7439 0.0052
19:00 0.0036 0.7738 0.0246
20:00 -0.0142 0.7979 0.0254
21:00 -0.0315 0.8204 0.0263
22:00 -0.0458 0.8390 0.0272
23:00 -0.0602 0.8577 0.0278
图3 2018年6月20日研究区逐小时土壤水分影像

Fig.3 Hourly soil moisture images of the study area on 20 June 2018

基于小时级回归重构结果, 排除了异常的极端降水或长时间干旱日, 鉴于日内降水过程的典型性, 本文选取2018年6月20日作为逐小时土壤水分影像的展示案例, 绘制了该日00:00 -23:00(北京时, 下同)的逐小时土壤水分空间分布(图3)。从图3中可看出, 该日的土壤水分对降水事件现出清晰的响应, 能够有效展示本研究模型捕捉降水驱动的土壤水分动态变化的能力, 并清晰刻画了地表土壤水分对降水过程的逐步响应和时空扩展特征。
从时间演化上看(图3), 06:00前后区域湿度变化不明显, 而从13:00起土壤水分出现小幅上升, 在18:00研究区整体土壤水分达到峰值后, 随后的时间段内略有下降。
结合研究区当日的逐小时降水过程(图4), 图3中的24幅土壤水分影像可清晰反映出地表土壤水分对降水过程的逐步响应和时空扩展特征。日内变化可划分为3个阶段:
图4 2018年6月20日研究区逐小时降水时间序列图

Fig.4 Time series chart of hourly precipitation in the study area on June 20, 2018

(1) 降水前阶段(00:00 -13:00)
00:00 -13:00, 区域内无降水。00:00 -05:00时间段内[图3(a)~(e)], 研究区大部分区域土壤水分含量整体较低, 其中02:00 -05:00[图3(c)~(e)]区域内土壤水分达到当日最低值。06:00 -13:00[图3(g)~(m)], 整个区域内, 土壤水分值逐小时上升, 至13:00土壤水分达到降水前最高值。
(2) 降水与水分快速上升阶段(14:00 -18:00)
14:00开始降水, 区域内土壤水分迅速上升, 16:00 -18:00[图3(q)~(r)]、 大部分区域土壤水分达到当日峰值, 反映出浅层土壤受降水直接补给的饱和过程。该阶段模拟图像与降水开始及增强时间点高度吻合, 说明模型对降水事件响应迅速, 具有良好的动态感知能力。
(3) 降水减弱与土壤水分回落阶段(19:00 - 23:00)
降水在18:00达到最大值后逐步减弱, 图3中19:00 -23:00高湿度区域逐渐收缩, 反映出降雨停止后土壤水分开始缓慢消退。坡地与高海拔地区因蒸散增强而引起土壤水分流失加速, 水分下降最为迅速; 而河谷周围的草地区域仍保持一定的湿润状态, 表明其具备更强的土壤水分蓄水能力。该阶段模拟图展示了降水结束后地表水分的动态调整过程, 与气象驱动条件高度一致。
在整个过程中, 研究区东北部与南部地区始终保持最高水分, 中北部区域则表现为典型的“先干后湿再干”三段式响应, 土壤水分变化幅度较大, 蒸散与径流作用主导其短时水分蒸散过程。区域整体土壤水分在降水达到峰值前后1~2 h内发生显著变化, 说明模型不仅能刻画趋势, 还能精确定位降水对土壤水分的影响时段。

4.3 模拟数据精度评估

为进一步评估所重构土壤水分数据的精度, 选取5个ISMN站点, 对比分析其模拟值与实测值在2018年内的均方根误差(RMSE)、 决定系数(R 2)、 Pearson相关系数(r)及偏差(Bias), 结果见表2
表2 土壤水分模拟值精度评估

Table 2 Accuracy evaluation of simulated soil moisture values

站点 海拔/m RMSE R 2 相关系数 Bias t检验p
NST01 3433 0.0092 0.8414 0.9173 0.0075 <0.001*
NST03 3437 0.0033 0.7918 0.8898 -0.0019 <0.001*
NST08 3465 0.0503 0.4969 0.7049 0.0216 0.0319*
NST09 3431 0.0321 0.5599 0.7482 0.0230 <0.001*
NST25 3587 0.0081 0.8735 0.9346 -0.0079 <0.001*

*表示p<0.05[*denotes p < 0.05]

表2可以看出, 不同站点模拟精度存在一定差异, 但总体而言, 各站点的模拟精度较高, p值均小于0.05, 通过显著性检验。NST25站点表现最优, R 2达0.8735, 相关系数为0.9346, 说明该站点模型拟合能力强, 误差较小; 而NST03站点精度相对较低, 可能与局地微地形或遥感像元混合等影响有关。总体而言, 模型能够有效再现土壤水分的动态过程, 精度评估结果表明模型对逐小时尺度的预测具备实用价值。
此外, Bias指标数值呈现正负波动, 整体偏差幅度较小, 未表现出明显的系统性低估或高估现象, 未来可通过偏差校正进一步提高模拟值的绝对精度。

4.4 空间降尺度模拟

在获得逐小时时间分辨率后, 为进一步提升空间分辨率至遥感应用级别(250 m), 本研究采用随机森林回归(Random Forest Regression)进行空间降尺度建模。以SMAP 9 km数据为因变量, 引入NDVI、 DEM、 Slope、 Aspect、 TRI、 LST等高分辨率多源数据为自变量, 建立土壤水分与环境因子的非线性映射关系, 实现250 m分辨率的土壤水分降尺度。随机森林模型通过Bagging策略与多棵决策树融合, 具有处理高维、 多变量输入且不易过拟合的优势。
由于不同环境变量的数值范围不同, 直接输入模型可能导致某些变量对模型学习产生主导作用。因此, 本研究采用四分位距(Interquartile Range, IQR)标准化方法, 用于各变量归一处理, 有效避免极端值影响模型学习过程, 进一步提高了模拟稳定性。标准化公式如下:
X n o r m = X - Q 1 Q 3 - Q 1
式中: Q 1 Q 3分别表示变量的25%和75%; X为原始数据点; X n o r m为标准化后的值。
表3列出了不同变量对模型的重要性评估结果。其中, NDVI的重要性值高达0.5808, 对模型的影响最大, 这个结果表明在高寒草甸地区, 植被的覆盖状况与土壤水分的分布密切相关, 这与已有研究结论一致(郭林茂等, 2022吴小丽, 2020); 其次是坡向与地表温度, 分别反映了地形辐射与蒸散能力对土壤水分的调控作用。随机森林特征重要性计算采用了置换重要性方法, 部分变量出现负值可能是因为在模型的训练中,该变量未能显著提升模型的预测精度,并可能与其他变量有高度相关从而引入了一些冗余信息。
表3 随机森林模型中不同特征变量的重要性

Table 3 Importance of different feature variables in Random Forest Models

变量 重要性
NDVI(植被指数) 0.5808
高程(DEM) -0.0427
坡度(Slope) -0.4991
坡向(Aspect) 0.2259
地表温度(LST) 0.2038
地形湿度指数(TRI) -0.1305
经度(Longitude) -0.1197
纬度(Latitude) -0.8715
本研究中, 因变量为SMAP土壤水分产品。为保证建模一致性, 所有自变量(NDVI、 DEM、 Slope、 Aspect、 TRI、 LST等)首先在GEE中进行空间重采样: 将高分辨率数据(如250 m NDVI、 30 m DEM)通过块平均(block mean pooling)聚合, 作为训练阶段的输入; 而低分辨率数据则采用双线性插值方法采样至9 km。在预测阶段, 利用训练好的随机森林模型, 以250 m分辨率的自变量(NDVI、 DEM等)作为输入, 得到250 m分辨率的土壤水分估算值, 从而实现SMAP产品的空间降尺度。
最终输出为250 m分辨率逐小时土壤水分影像, 能够较真实地反映玛曲地区复杂地形下土壤水分的空间异质性。
降尺度后的土壤水分空间格局在图5所示的高分辨率影像中表现尤为明显。降尺度后的影像相比SMAP原始9 km产品, 能够更清晰地区分不同地貌区间的水分差异, 揭示细尺度湿润-干旱斑块的空间嵌套关系。在图像配色中, 蓝色代表高土壤水分区域, 红色代表低水分区域, 整体呈现出“河谷低、 湿地区高、 高海拔山地偏干”的分布特征。其中, 河谷为水体主要分布区, 一般来说其土壤水分值应高于周边, 但常常被识别为低值区, 主要是由于SMAP这类微波遥感数据产品对水体具有高反射特性, 在水面区域的信号常出现饱和或无效, 导致反演时无法准确获取浅层土壤水分信息, 从而在结果中表现为“异常低值”。西南部高海拔区域地势陡峭、 土层浅薄、 植被稀疏, 降水径流快, 地表持水能力差, 因此表现为稳定的低水分区。
图5 SMAP土壤水分产品(a)与随机森林回归模型降尺度模拟结果(b)对比

Fig.5 Comparison of SMAP soil moisture product (a) with the downscaling results simulated by the random forest regression model (b)

降尺度后的土壤水分影像不仅显著提升了空间分辨率, 更准确刻画了地貌单元间的差异性, 反映了遥感数据与地表水文过程之间的深层耦合关系。

5 结论与讨论

本研究以青藏高原东缘的玛曲地区为典型高寒湿地研究区, 综合利用遥感数据、 来自ISMN的地面实测数据与多源辅助变量, 构建了基于Bi-LSTM模型与随机森林模型相结合的土壤水分高时空分辨率模拟方法。研究旨在弥补当前遥感产品在时间连续性和空间分辨率上的不足, 提升区域尺度土壤水分数据的适用性与准确性。主要结论如下:
(1) Bi-LSTM模型对逐小时的土壤水分预测具有较好的时序拟合能力。本研究使用ISMN站点的逐小时土壤水分数据做建模与测试,精度评估结果表明Bi-LSTM模型能够较为准确地捕捉土壤水分的日变化趋势与季节性波动特征,在夏季降水较为集中的时间段内表现出良好的时序响应性。趋势修正方法进一步提高了模型预测值与SMAP原始数据的量值一致性,使模拟结果兼具实测土壤水分数据的变化趋势和遥感数据的空间连续性优势。
(2) 引入逐小时回归与随机森林方法, 实现了SMAP土壤水分的时间插值与空间降尺度。本研究在Bi-LSTM模型输出基础上, 利用逐小时线性回归方法构建SMAP重构值与实测值的校准关系, 进而生成了具有连续逐小时分辨率的SMAP时序影像。同时, 采用随机森林回归模型, 结合NDVI、 LST、 DEM及其衍生因子, 实现了由9 km至250 m的空间分辨率转换。该过程有效融合多源环境信息, 提升了土壤水分估算的空间精度与地形适应性。
(3) 本研究所构建的模型在多个站点的精度验证中表现稳定,具备一定的区域适用性。基于对玛曲地区5个站点的模拟精度评估中, 模型整体RMSE控制在0.008~0.050之间, 决定系数R 2最高可达0.8735, 相关性显著。说明本研究方法可有效适用于青藏高原东缘等高寒复杂地形区的土壤水分模拟, 具备较强的稳定性与推广潜力。
现有遥感土壤水分研究多聚焦于空间降尺度(Sun and Cui, 2021Kumar et al, 2021赵伟等, 2022), 提升遥感产品的空间分辨率以满足小尺度生态或农田水文研究的需求, 这类研究通常默认原始产品的时间分辨率(如日尺度)保持不变, 忽略了土壤水分在日内过程(如蒸发、 降水响应)中的变化。
本研究使用Bi-LSTM模型和回归模型对SMAP数据进行逐小时动态重建,改进了原始产品在时间分辨率上的不足,同时利用随机森林回归模型融合多源高分辨率变量,实现了土壤水分数据从9 km到250 m的空间重建。该方法不仅能服务于生态过程精细模拟, 也为极端气象事件响应(如突发干旱或降水)监测提供更高时效的数据支撑。本研究仍存在一些不足之处, 如站点数量有限、 模型泛化能力需进一步在不同年份和区域验证, 未来可通过引入更多年份数据、 增加空间样本密度、 考虑深层土壤水分或耦合水热模型等手段, 进一步提升模型的泛化能力和生态适用性。
Chen L Xing M F He B B, et al, 2021.Estimating soil moisture over winter wheat fields during growing season using machine-learning methods[J].IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 14: 3706-3718.DOI: 10.1109/JSTARS.2021.3067890 .

Chen N C He Y Q Zhang X2017.NIR-red spectra-based disaggregation of SMAP soil moisture to 250 m resolution based on OzNet in Southeastern Australia[J].Remote Sensing9(1): 51.DOI: 10.3390/rs9010051 .

Dorigo W Himmelbauer I Aberer D, et al, 2021.The international soil moisture network: serving earth system science for over a decade[J].Hydrology and Earth System Sciences25(11): 5749-5804.DOI: 10.5194/hess-25-5749-2021 .

Farr T G Rosen P A Caro E, et al, 2007.The shuttle radar topography mission[J].Reviews of Geophysics45(2): 2005RG000183.DOI: 10.1029/2005RG000183 .

Filipović N Brdar S Mimić G, et al, 2022.Regional soil moisture prediction system based on Long Short-Term Memory network[J].Biosystems Engineering, 213: 30-38.DOI: 10.1016/j.biosystemseng.2021.11.019 .

Hersbach H Bell B Berrisford P, et al, 2020.The ERA5 global reanalysis[J].Quarterly Journal of the Royal Meteorological Society146(730): 1999-2049.DOI: 10.1002/qj.3803 .

Hochreiter S Schmidhuber J1997.Long short-term memory[J].Neural Computation9(8): 1735-1780.DOI: 10.1162/neco. 1997.9.8.1735 .

Kumar Y P Maheswaran R Agarwal A, et al, 2021.Intercomparison of downscaling methods for daily precipitation with emphasis on wavelet-based hybrid models[J].Journal of Hydrology, 599: 126373.DOI: 10.1016/j.jhydrol.2021.126373 .

Ma D Meng X H Luo S Q, et al, 2025.How does the continuous changes in spring soil moisture over the Tibetan Plateau affect the summer precipitation in East China?[J].Climate Dynamics63(4): 198.DOI: 10.1007/s00382-025-07671-2 .

O’Neill P Entekhabi D Njoku E, et al, 2010.The NASA soil moisture active passive (SMAP) mission: overview[C]//2010 IEEE International Geoscience and Remote Sensing Symposium.July 25-30, 2010, Honolulu, HI, USA.IEEE: 3236-3239.DOI: 10.1109/IGARSS.2010.5652291 .

Peng J Albergel C Balenzano A, et al, 2021.A roadmap for high-resolution satellite soil moisture applications-confronting product characteristics with user requirements[J].Remote Sensing of Environment, 252: 112162.DOI: 10.1016/j.rse.2020.112162 .

Probst P Boulesteix A L2018.To tune or not to tune the number of trees in random forest[J].Journal of Machine Learning Research, 18: 1-18.

Roberts T M Colwell I Chew C, et al, 2022.A deep-learning approach to soil moisture estimation with GNSS-R[J].Remote Sensing14(14): 3299.DOI: 10.3390/rs14143299 .

Sun H Cui Y J2021.Evaluating downscaling factors of microwave satellite soil moisture based on machine learning method[J].Remote Sensing13(1): 133.DOI: 10.3390/rs13010133 .

邴丹珲, 李毅, 朱丽, 等, 2012.黄河上游玛曲县退化草地现状、 成因及保护对策[J].安徽农业科学40(35): 17154-17155, 17178.DOI: 10.13989/j.cnki.0517-6611.2012.35.162.Bing D H

Li Y Zhu L, et al, 2012.Present situation, causes and protection countermeasures of degraded grassland in Maqu County in the upper reaches of the Yellow River[J].Journal of Anhui Agricultural Sciences40(35): 17154-17155, 17178.DOI: 10.13989/j.cnki.0517-6611.2012.35.162 .

曹慧宇, 2021.基于遥感的黄河源区冻土反演及冻土变化对径流的影响研究[D].北京: 中国地质大学(北京).Cao H Y, 2021.Inversion of frozen soil in the source region of the Yellow River based on remote sensing and study on the influence of frozen soil change on runoff[D].Beijing: China University of Geosciences.

董世玉, 朱忠礼, 徐自为, 等, 2023.黑河流域表层土壤水分干化特征研究[J].高原气象42(3): 771-784.DOI: 10.7522/j.issn.1000-0534.2022.00086.Dong S Y

Zhu Z L Xu Z W, et al, 2023.Characteristics of surface soil moisture drydown in the Heihe River Basin[J].Plateau Meteorology42(3): 771-784.DOI: 10.7522/j.issn.1000-0534.2022.00086 .

方西瑶, 蒋玲梅, 崔慧珍, 2022.基于Sentinel-1雷达数据的青藏高原地区土壤水分反演研究[J].遥感技术与应用37(6): 1447-1459.DOI: 10.11873/j.issn.1004-0323.2022.6.1447.Fang X Y

Jiang L M Cui H Z2022.Soil moisture retrieval in the Tibetan Plateau based on sentinel-1 radar data[J].Remote Sensing Technology and Application37(6): 1447-1459.DOI: 10.11873/j.issn.1004-0323.2022.6.1447 .

高雅, 2024.基于遥感数据和集成学习的土壤水分估算方法研究[D].哈尔滨: 哈尔滨工程大学.Gao Y, 2024.Research on Soil Moisture Estimation Based on Remote Sensing Data and Ensemble Learning[D].Harbin: Harbin Engineering University.

耿庆田, 刘植, 李清亮, 等, 2023.基于一种深度学习模型的土壤湿度预测[J].吉林大学学报(工学版)53(8): 2430-2436.DOI: 10.13229/j.cnki.jdxbgxb.20220125.Geng Q T

Liu Z Li Q L, et al, 2023.Prediction of soil moisture based on a deep learning model[J].Journal of Jilin University (Engineering and Technology Edition)53(8): 2430-2436.DOI: 10.13229/j.cnki.jdxbgxb.20220125 .

郭林茂, 王根绪, 宋春林, 等, 2022.多年冻土区下垫面条件对坡面关键水循环过程的影响分析[J].水科学进展33(3): 401-415.DOI: 10.14042/j.cnki.32.1309.2022.03.005.Guo L M

Wang G X Song C L, et al, 2022.Analysis on the influence of underlying surface conditions in permafrost regions on the key water cycle processes at slope scale[J].Advances in Water Science33(3): 401-415.DOI: 10.14042/j.cnki.32.1309.2022.03.005 .

侯雅, 李伟平, 左金清, 2025.土壤冻融过程中的水热参数化方案研究进展[J].高原气象44(1): 1-15.DOI: 10.7522/j.issn.1000-0534.2024.00060.Hou Y

Li W P Zuo J Q2025.Advances in the study of thermal and hydraulic parameterizations for soil freeze-thaw process[J].Plateau Meteorology44(1): 1-15.DOI: 10.7522/j.issn.1000-0534.2024.00060 .

贾燕, 金双根, 肖智宇, 等, 2023.全球导航卫星系统反射测量土壤水分遥感: 现状与机遇[J].武汉大学学报(信息科学版)48(11): 1784-1799.DOI: 10.13203/j.whugis20230253.Jia Y

Jin S G Xiao Z Y, et al, 2023.Soil moisture remote sensing using global navigation satellite system-reflectometry: current status and opportunity[J].Geomatics and Information Science of Wuhan University48(11): 1784-1799.DOI: 10.13203/j.whugis20230253 .

廖慧仁, 黄倩, 王梦圆, 等, 2024.黄土高原表层土壤湿度与降水关系的分析[J].高原气象43(3): 549-560.DOI: 10.7522/j.issn.1000-0534.2023.00075.Liao H R

Huang Q Wang M Y, et al, 2024.Analysis of the relationship between surface soil moisture and precipitation over the Loess Plateau[J].Plateau Meteorology43(3): 549-560.DOI: 10.7522/j.issn.1000-0534.2023.00075 .

刘会丹, 万雪芬, 崔剑, 等, 2023.基于深度强化学习的耕作层土壤水分、 温度预测[J].华南农业大学学报44(1): 84-92.DOI: 10.7671/j.issn.1001-411X.202201032.Liu H D

Wan X F Cui J, et al, 2023.Moisture and temperature prediction in tillage layer based on deep reinforcement learning[J].Journal of South China Agricultural University44(1): 84-92.DOI: 10.7671/j.issn.1001-411X.202201032 .

刘杨晓月, 杨雅萍, 2023.多源微波遥感融合大尺度区域土壤水分数据集研究进展综述[J].数据与计算发展前沿5(5): 119-127.DOI: 10.11871/jfdc.issn.2096-742X.2023.05.010.Liu Y

Yang Y P2023.Progress on large-scale soil moisture products by fusion of multi-source microwave remote sensing datasets: a review[J].Frontiers of Data&Computing5(5): 119-127.DOI: 10.11871/jfdc.issn.2096-742X.2023.05.010 .

卢调雪, 杨林山, 王婧茹, 等, 2025.祁连山浅山区灌丛草甸土壤冻融过程与水量平衡模拟研究[J].高原气象44(2): 349-361.DOI: 10.7522/j.issn.1000-0534.2024.00077.Lu D X

Yang L S Wang J R, et al, 2025.Simulation of soil freeze-thaw process and water balance in shrubland meadow in shallow mountain area of Qilian Mountains[J].Plateau Meteorology44(2): 349-361.DOI: 10.7522/j.issn.1000-0534.2024.00077 .

逯军峰, 董治宝, 胡光印, 等, 2012.甘肃省玛曲县土地沙漠化发展及其成因分析[J].中国沙漠32(3): 604-609.

Lu J F Dong Z B Hu G Y, et al, 2012.Aeolian desertification development and its causes in Maqu County of Gansu Province, China[J].Journal of Desert Research32(3): 604-609.

马英赛, 孟宪红, 韩博, 等, 2019.黄土高原土壤湿度对地表能量和大气边界层影响的观测研究[J].高原气象38(4): 705-715.DOI: 10.7522/j.issn.1000-0534.2019.00036. Ma Y S

Meng X H Han B, et al, 2019.Observations of soil moisture influence on surface energy dynamics and planetary boundary layer characteristics over the Loess Plateau[J].Plateau Meteorology38(4): 705-715.DOI: 10.7522/j.issn.1000-0534.2019.00036 .

王思超, 蔡玉林, 朱子正, 等, 2024.XGBoost和DSCGAN模型协同的SMAP土壤水分降尺度方法[J].地球信息科学学报26(9): 2213-2225.DOI: 10.12082/dqxxkx.2024.240152.Wang S C

Cai Y L Zhu Z Z, et al, 2024.Downscaling SMAP soil moisture using a combination of XGBoost and DSCGAN algorithms[J].Journal of Geo-Information Science26(9): 2213-2225.DOI: 10.12082/dqxxkx.2024.240152 .

吴小丽, 2020.近30年来青藏高原多年冻土区与季节性冻土区土壤水分变化差异[D].兰州: 兰州交通大学.Wu X L, 2020.Difference of soil moisture changes between permafrost regions and seasonal permafrost regions in Qinghai-Tibet Plateau in recent 30 years[D].Lanzhou: Lanzhou Jiatong University.

薛智暄, 张丽, 王新军, 等, 2023.古尔班通古特沙漠SMAP土壤水分产品降尺度分析[J].干旱区研究40(4): 583-593.DOI: 10.13866/j.azr.2023.04.07.Xue Z X

Zhang L Wang X J, et al, 2023.Downscaling analysis of SMAP soil moisture products in Gurbantunggut Desert[J].Arid Zone Research40(4): 583-593.DOI: 10.13866/j.azr.2023.04.07 .

张戈, 赖欣, 刘康, 2023.黄河源区玛曲土壤冻融过程中地表水热交换特征分析[J].高原气象42(3): 575-589.DOI: 10.7522/j.issn.1000-0534.2022.00083.Zhang G

Lai X Liu K2023.Characteristics of surface water and heat exchange during soil freezing and thawing of Maqu Station in the source area of the Yellow River[J].Plateau Meteorology42(3): 575-589.DOI: 10.7522/j.issn.1000-0534.2022.00083 .

张蕾, 郭安红, 宋迎波, 等, 2024.土壤水分数据融合及其在旱涝灾害多维度评估中的应用[J].农业工程学报40(13): 68-76.DOI: 10.11975/j.issn.1002-6819.202312128.Zhang L

Guo A H Song Y B, et al, 2024.Assessing drought and waterlogging in multiple dimensions using data fusion of soil water[J].Transactions of the Chinese Society of Agricultural Engineering40(13): 68-76.DOI: 10.11975/j.issn.1002-6819.202312128 .

赵伟, 文凤平, 蔡俊飞, 2022.被动微波土壤水分遥感产品空间降尺度研究: 方法、 进展及挑战[J].遥感学报26(9): 1699-1722.

Zhao W Wen F P Cai J F2022.Methods, progresses, and challenges of passive microwave soil moisture spatial downscaling[J].National Remote Sensing Bulletin26(9): 1699-1722.

郑涵, 王海峰, 2022.土壤水分计量技术的研究进展[J].计量科学与技术66(11): 31-36, 40.DOI: 10.12338/j.issn.2096-9015.2022.0169.Zheng H

Wang H F2022.Research progress of soil moisture measurement technology[J].Metrology Science and Technology66(11): 31-36, 40.DOI: 10.12338/j.issn.2096-9015.2022.0169 .

Outlines

/