1 引言
2 数据来源与方法介绍
2.1 数据来源
2.2 方法介绍
2.2.1 数据质控
2.2.2 模型特征选取
图2 关中地区海拔(填色, 单位: m)及2022 -2024年国家站能见度≤1 km发生频次空间分布图红色圆点中心为国家站, 其大小表示频次 Fig.2 The altitude (shading, unit: m) and spatial distribution of occurrence frequency that visibility ≤1 km at national stations in Guanzhong region from 2022 to 2024.The center of the red dot represents the position of the national station and the size represents the frequency |
表1 模型输入特征选取Table 1 Selection of model input features |
| 分类 | 特征因子 |
|---|---|
| 地面 | T 2m、 (T-Td)2m、 RH 2m、 WS 10m、 T 24h、Prs、 P 3h、 P 24h、 PM 2.5、 PM 10 |
| 高空 | RH 1000、 RH 925、 RH 850、 RH 700、 RH 600、 RH 500、 T 1000、 T 925、 T 850、 T 700、 T 600、 T 500、 U 1000、 U 925、 U 850、 U 700、 U 600、 U 500、 V 1000、 V 925、 V 850、 V 700、 V 600、 V 500、 |
| 其他 | Alt、 hour、 station_ID |
2.3 模型建立方案
表2 能见度分级Table 2 Visibility classification |
| 分级 | 能见度(VIS)/km |
|---|---|
| 0 | ≤1 |
| 1 | 1<VIS≤2 |
| 2 | 2<VIS≤5 |
| 3 | 5<VIS≤10 |
| 4 | >10 |
表3 LightGBM能见度分级预报模型主要参数Table 3 Main parameters of LightGBM visibility classification forecasting model |
| 参数名称 | 参数值 |
|---|---|
| 提升迭代轮数/个 | 10000 |
| 叶子节点数/个 | 80 |
| 叶子节点最小样本数/个 | 20 |
| 学习率 | 0.05 |
| 树最大深度 | 15 |
| 提升类型 | gbdt |
| 特征采样比例 | 0.8 |
| 样本采样比例 | 0.9 |
2.4 SHAP方法介绍
2.5 检验评估指标
3 结果及分析
3.1 模型预报效果检验
图3 LightGBM模型及ECMWF模式各等级能见度预报效果评估Fig.3 Evaluation of forecast performance for different visibility levels by LightGBM model and ECMWF |