文章快速检索     高级检索
  高原气象  2017, Vol. 36 Issue (1): 138-147  DOI: 10.7522/j.issn.1000-0534.2016.00014
0

引用本文 [复制中英文]

潘留杰, 张宏芳, 陈小婷, 等. 2017. ECMWF集合预报在中国中部地区的降水概率预报性能评估[J]. 高原气象, 36(1): 138-147. DOI: 10.7522/j.issn.1000-0534.2016.00014
[复制中文]
PAN Liujie, ZHANG Hongfang, CHEN Xiaoting, et al. 2017. Evaluation of Precipitation Probability Forecasts of ECMWF Ensemble Prediction System in Central China[J]. Plateau Meteorology, 36(1): 138-147. DOI: 10.7522/j.issn.1000-0534.2016.00014.
[复制英文]

资助项目

中国气象局旱区特色农业气象灾害监测预警与风险管理重点实验室开放基金(CAMF-201606);陕西省自然科学基础研究计划项目(2016JM4020);陕西省气象局面上科研项目(2016M-1)

作者简介

潘留杰 (1978-), 男, 陕西石泉人, 高级工程师, 从事天气预报与研究工作, E-mail:pljmtgh57245@sina.com

文章历史

收稿日期: 2015-09-08
定稿日期: 2016-02-03
ECMWF集合预报在中国中部地区的降水概率预报性能评估
潘留杰1,2, 张宏芳3, 陈小婷2, 屈丽玮2, 袁媛4     
1. 中国气象局旱区特色农业气象灾害监测预警与风险管理重点实验室, 银川 750002;
2. 陕西省气象台, 西安 710044;
3. 陕西省气象服务中心, 西安 710014;
4. 南京市气象局, 南京 210022
摘要: 利用2013、2014年5-10月ECMWF集合预报系统(EPS)输出的降水预报资料,CMORPH(NOAA Climate Prediction Center Morphing Method)卫星与全国30000余个自动气象观测站的逐小时降水量融合资料,基于Brier评分、Talagrand分布、ROC(Relative operating characteristic)分析等方法,研究ECMWF集合预报对我国中部降水的概率预报性能。主要结论如下(1)模式对小雨具有稳定的预报技巧,但预报概率偏大;对大雨以上量级降水的分辨能力不足,概率预报偏小。(2)Talagrand图整体表现为“U”型,模式对中等强度以上量级降水预报频次偏少;就不同量级降水的预报和观测频次一致程度来看,时效越长预报性能越稳定;第11天模式集合成员的发散度发生明显变化,Talagrand图呈“钟”型分布,预报评分显著下降。(3)预报日数越短,降水概率预报效果越好,平均而言,预报日数超过2天后,模式对12 h(24 h)小于30%(40%)的暴雨概率预报技巧低于气候预测。(4)模式24 h小雨命中率较12 h偏高,空报率偏低,预报技巧优于12 h;对暴雨来说,前6天12 h降水概率预报的ROC面积较24 h表现较好。
关键词: 集合预报    降水概率    ECMWF    ROC分析    
1 引言

集合预报是单一确定论预报向多值概率论预报转换的关键技术 (杜均和邓国, 2010; 杜均和陈静, 2010)。在集合预报出现之前, 概率预报通常是通过统计方法产生的 (Wilks, 2005), 但统计概率预报具有显著的缺陷, 它仅仅反映过去发生的天气状态。统计方法可以消除系统性误差, 但却无法消除随机性误差, 而集合预报能够消除随天气系统演变的随机性误差, 它的每个成员代表了天气状况发生的一种可能, 预报结果的不确定性可以通过预报成员的概率密度函数来体现, 从而实现更具有动力学意义的概率预报 (Stephenson et al, 2005)。这种概率预报能给预报人员提供更有价值的天气信息, 服务于实际预报业务。

无论预报系统本身多么优秀, 对预报系统及其产品进行客观评估, 仍然是获得有效的判别指标 (潘留杰等, 2014a, 2014b; 郝民等, 2011; 许建伟等, 2014; 刘佳等, 2014; 张利红和何光碧, 2014) 和提高预报水平的重要因素 (薛春芳和潘留杰, 2016; 何由等, 2012; 何晓凤等, 2014; 牛金龙等, 2014)。概率预报评估中最通用的方法是计算Brier评分, 它反映的是预报概率与通过给定阈值将观测划分为0或1两种情况下的平方差。Brier评分的主要不足在于尽管它能反映概率预报系统的优劣, 但在实际业务中很难提供简明的判别标准。1973年Murphy (1973)将Brier评分分解为:可靠性、分辨能力、不确定项三部分, 从而使其物理意义更加清晰。在实际应用中, 首先是发展了可靠性图 (Reliability diagram), 用来反映预报概率相对于观测频率的差异 (Hamill and Colucci, 1997); 其次是出现了区分概率预报命中率和空报率的ROC (Relative operating characteristic) 分析图 (Murphy, 1993), ROC分析是信号探测理论在预报检验评估中的应用, 它通过计算预报的命中率和空报率来区分预报系统对事件发生或者不发生的分辨能力, 从而使用户能够定量把握命中率和空报率所占比重。国内也开展了一些集合预报及其概率预报的检验评估工作, 段明铿等 (2012)使用NCEP集合预报系统 (EPS) 及其对应的再分析资料评估了模式在亚欧和北美地区500 hPa位势高度的预报性能差异; 刘永和等 (2013)利用全球多模式集合预报TIGGE资料评估了模式在沂沭河流域的6 h降水预报性能; 王敏等 (2012)对国家气象中心区域集合预报系统的2 m温度预报结果开展了一阶偏差和二阶离散度的校准研究, 并检验了其预报效果; 赵琳娜等 (2010)利用2008年7月1日至8月6日TIGGE集合预报资料评估了ECMWF、NCEP和CMA三家模式对淮河流域上游19个自动气象观测站的降水预报性能。这些工作极大的促进了集合预报相关技术在我国的发展和应用, 但总体来说, 我国在集合预报业务方面的研究和应用还远远不够。

近两年来, ECMWF集合预报及其概率预报产品在气象预报业务中受到极大的欢迎, 特别是降水概率预报产品, 客观上为用户提供了降水发生可能性的大小及其量级的可能振荡范围, 解决了预报员在降水量级可能变化幅度上的“拍脑袋”问题。但一方面由于概率预报产品在国内的应用时间相对较短, 用户对模式的预报性能还不十分清楚; 另一方面, 概率预报和确定性预报在预报性能检验方法上存在较大的差异。因此, 目前国内还没有针对ECMWF集合预报系统的降水概率产品长期预报能力的客观评估。本文以国家气象信息中心的CMORPH (NOAA Climate Prediction Center Morphing Method) 卫星与自动气象观测站的逐小时降水量融合产品为参照, 客观评估ECMWF集合预报对我国中部地区降水概率的预报能力, 以期为预报业务提供参考。

1.1 资料

观测资料采用中国气象科学数据信息网CMORPH (NOAA Climate Prediction Center Morphing Method) 卫星与全国3万多个自动观测站的逐时降水量融合产品 (http: //www.escience.gov.cn/metdata/page/index.html), 时段为2013、2014年5-10月, 空间分辨率0.1 °×0.1 °。有研究表明 (潘旸等, 2012), CMORPH卫星与自动站降水融合资料在我国夏季24 h累计降水平均偏差为-0.035 mm, 相关系数达0.908, 能够真实的表现实际降水分布, 可以作为参照物来评估模式的预报性能。

模式数据为同时期每日12:00(世界时, 下同) 起报的ECMWF降水集合预报产品, 集合成员数51个, 原始压码数据中编号为0~50, 其中0号成员为控制预报。模式分辨率为0.5 °×0.5 °, 为了方便处理, 插值空间分辨率成与观测一致的0.1 °×0.1 °。研究区域 (图 1) 设为我国的中部地区 (28°N41°N, 100°E118°E)。

图 1 研究所选取的具体范围 (黑色细线矩形框) Figure 1 The specific range of selected study area (black thin line rectangle)
1.2 方法

首先计算Brier评分及其分解项来评估模式的整体预报性能; 其次采用Talagrand图来衡量集合预报成员与观测值离散程度的分布差异, 以此判别预报成员的发散程度和可靠性。Brier评分 (BS) 及其分解计算公式分别如下:

$ \text{BS = }\frac{\text{1}}{N}\sum\limits_{i=1}^{N}{{{\left( {{p}_{i}}-{{o}_{i}} \right)}^{2}}={{R}_{\text{el}}}-{{R}_{\text{es}}}+{{U}_{\text{ncer}}}}, $ (1)

式中: N表示样本的大小, pi表示设定阈值降水的预报概率, oi表示对应阈值降水的观测, 超过阈值时值为1, 否则为0。分解后的三项分别为可靠性项Rel, 分辨能力项Res和不确定项Uncer, 其中:

$ \left\{ \begin{align} & {{R}_{\text{el}}}=\frac{\text{1}}{N}\sum\limits_{k=1}^{b}{\sum\limits_{i=1}^{{{N}_{k}}}{{{\left( {{p}_{k}}-{{{\bar{o}}}_{k}} \right)}^{2}}}} \\ & {{R}_{\text{es}}}=\frac{\text{1}}{N}\sum\limits_{k=1}^{b}{\sum\limits_{i=1}^{{{N}_{k}}}{{{\left( {{{\bar{o}}}_{k}}-\bar{o} \right)}^{2}}}} \\ & {{R}_{\text{ncer}}}=\frac{\text{1}}{N}\sum\limits_{k=1}^{b}{\sum\limits_{i=1}^{{{N}_{k}}}{{{\left( {{{\bar{o}}}_{k}}-{{{\bar{o}}}_{ki}} \right)}^{2}}}}{{o}_{i}} \\ \end{align} \right., $ (2)

式中: b表示概率区间分割数, pk表示第k个区间内的平均概率预报, ok表示落在第k个概率区间内的概率值预报成功的平均观测频率, 为全部的平均观测频率, oki表示落在第k个概率区间内的第i个观测。

最后通过ROC分析来寻找实际的预报指标, 并通过ROC面积进行总结, ROC面积的计算公式如下:

$ RO{{C}_{\text{AUC}}}=\frac{1}{2}\sum\limits_{i=1}^{b}{\text{(}Po{{d}_{i+1}}+Po{{d}_{i}}\text{)(}Pof{{d}_{i+1}}-Pof{{d}_{i}}\text{)}}, $ (3)

式中: ROCAUC表示ROC面积, PodiPofdi分别表示第i个概率区间内的命中率和空报率。

2 结果分析

在讨论概率技巧评分之前, 先简要阐述概率预报在整个时段内的整体表现。为了表述方便, 仅分析12 h、24 h两种间隔的累计降水量, 不同时段间隔的降水分级判别标准与惯常标准一致。需要说明的是, 在分析预报概率与观测频率的空间差异时, 24 h采用的是模式起报时刻之后的24~48 h (第2天) 的降水概率, 12 h则为24~36 h, 36~48 h两个时段的降水概率预报平均值。而在分析1~15天降水预报概率技巧时, 统一检验是逐日降水概率 (24 h) 和以12 h为间隔的一天内降水概率平均值的预报技巧。

从观测结果来看, 研究区域西南部为降水频率高值区, 并由西南向东北逐渐递减。12 h西南部观测降水发生的频率最大达0.6以上 (图 2a), 24 h则达到0.76以上 (图 2c)。值得注意的是, 无论在12 h还是24 h观测降水发生频率空间分布图上, 与内蒙交界的陕西北部地区均为小雨触发频率相对高值区, 而其东西两侧则相对较低, 在河北南部以及宁夏西北部的内蒙地区小雨发生频率降低到0.2以下, 东北部形成了一个“Ω”形的高脊。模式预报整体较好的刻画了小雨发生频率的空间分布形态, 由西南部向东北部递减的趋势与观测基本一致, 高、低值中心也与观测吻合较好, 主要不足在于模式预报的小雨发生频率系统性的偏高0.2以上, 此外模式对陕北北部与内蒙交界处高值区的预报位置偏东。

图 2 12 h (a, b) 和24 h (c, d) 时段内ECMWF模式预报的小雨 (a, c)、暴雨 (b, d) 降水概率 (彩色区) 与观测降水频率 (等值线) 的空间对比 Figure 2 The spatial contrast of ECMWF forecast probability (contour) and observation frequency (color area) for light (a, c) and torrential (b, d) rain in 12 (a, b) and 24 (c, d) hours, respectively

与小雨发生频率空间分布不同, 暴雨发生频率高值区主要位于陕西南部与重庆、四川的交界处, 此外河南和安徽的交界处、湖北东部为第二大值区。暴雨观测的大值中心12、24 h发生频率分别达到0.032 (图 2b) 和0.05以上 (图 2d)。模式预报的空间表现整体与观测一致, 但暴雨发生频率存在系统性的偏差, 暴雨频率高值中心平均偏少4倍以上, 而在研究区域的西北部, 24 h暴雨偏少频次达一个量级以上。

2.1 Brier评分及其分解

利用“二分法”将给定阈值的观测降水归类为“0”和“1”两种状态, 并计算其与预报概率的平方差就可以得到Brier评分。Brier评分及其分解项Rel是一种负向的评分指数, 当Brier分值越低时表示其预报效果越好, 但Brier评分对事件发生的气候频率敏感, 因此对极端天气事件来说, Brier评分有较好的表现, 并不表示具有实际的预报技巧, 但对概率预报来说, Brier评分仍然是评估降水概率预报能力的一个重要指数。需要说明的是, 检验时使用的是单向阈值, 这就是说当模式预报降水概率 > 0 mm, 无论观测发生多大量级的降水, 小雨即为预报正确, 其余类推。

图 3给出了Brier评分及其分解项可靠性和分辨能力随预报时效的演变图, 需要说明的是对Brier评分的不确定性项Uncer来说, 并没有理想值, 因此不做分析。图 3显示, 模式对小雨量级降水的Brier预报评分显著优于大雨和暴雨。从时间演变上来看, 预报时效为2天时, 12 h降水Brier评分突然增大, 预报效果变差。对12 h小雨预报来说, Brier评分在2~10天之间表现稳定 (图 3a), 甚至有所减小, 而对大雨和暴雨量级的降水来说, 2天之后的Brier评分整体为减小趋势。其分解项可靠性Rel的表现基本与Brier评分一致 (图 3b)。

图 3 12 h (a, b, c) 和24 h (d, e, f) 不同量级降水的Brier评分及其可靠性和分辨能力 Figure 3 Brier score of different magnitude precipitation, reliability and resolution in 12 (a, b, c) and 24 (d, e, f) hours, respectively

模式对12 h大雨和暴雨基本没有分辨能力 (图 3c)。因此, 就Brier评分来看, 模式对不同量级的降水1天之内的预报效果均为最好。对小雨来说, 2~10天的预报性能基本相当; 对大雨或暴雨来说, 尽管随着时效的增加Brier评分和可靠性有较好的表现, 但由于其分辨能力接近于0, 其预报性能的优劣是不确定的。

不同量级降水的24 h Brier评分的时间演变与12 h整体是一致的。从数值上来看, 小雨量级的降水的Brier评分较12 h略偏高, 12 h大雨和暴雨量级降水的Brier评分略偏低。值得重点关注的是在第11天, 12 h所有量级降水的Brier评分、可靠性显著变差, 分辨能力明显下降。而对24 h来说, 该时段的暴雨Brier评分、可靠性略有提高, 但其小雨量级降水的预报性能变差。分析其原因发现, 模式第11天的集合成员的概率分布做了较大调整, 这一点在将后续章节中具体阐述。

2.2 可靠性分析

按照集合预报“成员等同性”(equal-likelihood) 原则, 每个集合成员的预报准确率应该大致相同 (Hamill, 1997), 然而由于集合成员的发散度出现偏差, 系统中每个成员与观测的匹配程度并不相同。为了表示观测与集合预报成员的概率分布差异, 发展了Talagrand分布直方图 (Hamill, 2001)。计算Talagrand分布时首先把N个集合成员的预报值从小到大的顺序排列, 进而判断观测值落在某个区间的频率。按照这一原则, ECMWF的51个集合预报成员非降序排列后可划分为52个区间, 观测值落在每个区间的理想概率为0.019。

图 4给出了模式12 h间隔降水预报的Talagrand图, 为了表示方便, 仅绘制了奇数天Talagrand图的区间分布, 图中黑色直线表示理想情况下的分布曲线。整体看来, 模式预报的Talagrand分布与理想情况下的概率期望值还存在一定的差距, 两端值特别是左端值均明显偏大, 预报时效为1天的第一个区间的观测值落在理想曲线之外的概率偏大16%左右。按照Talagrand图的原理, 落在第一个区间和最后一个区间的分别表示集合预报结果整体偏大 (小), 表明模式对小量级降水预报频次整体偏多, 概率偏大, 而对大量级的降水频次预报偏少, 概率偏低, 这与图 2的表现结果具有一致性。比较不同预报天数的Talagrand分布, 发现随着预报时效的增加, 小量级降水预报频次偏多, 大量级的降水频次预报偏少的情况还有所改善。因此就Talagrand图来看, 距预报初始时刻越近, 其成员的概率分布表现反而较差, 时效较远, 不同量级降水与观测频率的匹配程度较为一致 (更加可靠)。但Talagrand图只考虑区域内预报与观测频次的匹配, 不关心空报和漏报的情况, 因此并不反映实际的预报效果。

图 4 ECMWF集合预报系统的12 h Talagrand分布 黑色直线为Talagrand分布的理想状态, 不同颜色表示预报时效 Figure 4 Talagrand distribution diagram for ECMWF 12 h precipitation forecast.Black solid line expresses ideal state of Talagrand distribution, different colors representing a different date of validity

已有的研究 (Hamill, 2001) 表明, 当Talagrand图呈“U”型分布时, 集合成员的发散度存在不足, 而当集合成员的发散度偏大时则为“钟型”分布。图 4表明ECWMF也存在集合预报系统发散度不足的普遍问题。注意到模式第11天的概率分布与其它预报时效呈现出显著差异, 分析温度、气压等其它要素时都表现出相同的结果 (图略), 分析认为第11天模式可能对集合成员的发散度有所调整, 但这只是一种推论, 且无法验证, 另一种可能性为第11天模式加入了海气耦合方案的作用。

前4天的逐24 h的Talagrand图表现如图 5所示, 可以看出前4天Talagrand图的演变与奇数天12 h间隔的Talagrand图 (图 4) 的前期表现基本一致。第一天 (图 5a), 模式在量级较小的降水预报频次偏多的情况最为明显, 落在第一区间的概率为0.186, 随着预报时效的增加则显著减小, 第2至第4天分别降为0.167、0.148和0.126。因此, 从日降水量预报来看, 模式同样表现出了初期小量级降水预报概率偏大, 大量级降水预报概率偏小的特性, 随着时效的增加, 不同区间的预报概率与观测频率的匹配程度较为一致。

图 5 ECMWF集合预报系统24 h (a), 48 h (b), 72 h (c) 和96 h (d) 时效的逐日降水预报Talagrand分布 Figure 5 Daily Talagrand distribution diagram for ECMWF precipitation forecast of 24 (a), 48 (b), 72 (c) and 96 (d) hours
2.3 ROC (Relat ive Operating Characteristic) 分析

ROC分析是通过计算预报的命中率和空报率来描述概率预报系统预报能力的一种方法。它是信号探测理论在预报检验中的应用。对确定性预报而言, 通过计算获得的命中率和空报率是一个给定的值, 而对概率预报首先需要对预报概率进行转换, 当预报概率不小于概率阈值时, 认为预报天气事件发生, 否则不发生; 然后然后利用概率阈值将概率转化为确定性预报。

ROC图中每条曲线上的点由不同概率阈值下的命中率和空报率确定, 自右上角到左下角的点包括点分别对应概率阈值大于0.05, 0.1, 0.15, 0.2, …, 1.0时的命中率和空报率, 当预报曲线越靠近对角线或在对角线右侧时, 表示命中率等于或低于空报率, 无预报技巧, 反之越靠近理想曲线表示预报效果越好。图 6给出了预报时效为15天的12 h不同量级降水的ROC分析图, 需要说明的是, 12 h命中率和空报率为一天内前后两个时段的平均值。降水的ROC曲线显示, 除第11天外, 随着预报时效的增加, ROC曲线整体逐渐向对角线靠近, 预报性能下降。对第11天的预报来说, 其预报性能比第15天预报还差, 预报性能较低。比较12 h、24 h (图略) 第11天ROC曲线向对角线的靠近程度, 发现12 h略优于24 h预报, 可能的原因是第11天24 h集合成员调整的幅度更大, 这与集合预报成员的Talagrand分布具有一致性 (图 4)。

图 6 ECMWF集合预报系统的12 h的降水预报ROC曲线 (a) 小雨, (b) 中雨, (c) 大雨, (d) 暴雨.图中不同颜色表示不同的预报时效, 对角线表示无预报技巧, 短点线表示理想状态 Figure 6 ROC charts for ECMWF 12 h precipitation forecast.(a) light rain, (b) moderate rain, (c) heavy rain, (d) torrential rain.The different colors representing a different period of validity, diagonal line indicates no forecast skill, short dotted line represents the ideal state

比较12、24 h (图略) ROC曲线, 发现对小雨来说, 24 h预报性能优于12 h。当预报时效为1天, 降水概率为5%以上时, 12 h时效命中率、空报率分别为0.887和0.581 (图 6a), 而24时效的命中率和空报率分别为0.922和0.636;当预报概率 > 0.95, 12、24 h命中率分别为0.483和0.545, 空报率分别为0.147和0.136。这种情况对高概率预报来说表现基本一致, 24 h命中率较12 h偏高, 空报率偏低, 预报效果较好。

与小雨ROC曲线相比较 (图 6a), 中雨ROC曲线 (图 6b) 在低概率区的空报率偏高, 但命中率略好于小雨, 从ROC曲线靠近理想曲线的程度来看, 模式对中雨量级降水的概率预报优于小雨。出现这种情况有两方面的原因, 首先是尽管检验的时段是相同的, 但分级后不同量级降水的样本数量仍然存在较大差异; 其次ROC曲线中同一集合预报系统的不同量级降水概率的性能不能简单比较, 譬如当概率均为5%时, 模式对小雨的命中率为84%, 空报率为0.59, 而中雨的命中率、空报率分别为0.87和0.65, 因此很难判别两者的优劣。同样, 当预报时效增加时, 预报对概率 < 15%时的大雨 (图 6c), ROC曲线位于对角线以下, 基本无预报性能; 而当概率高于0.95时, 24 h大雨命中率、空报率分别为0.746和0.344, 12 h命中率、空报率分别为0.678和0.274, 表现出类似的问题。对于暴雨预报而言, 预报时效越长, 低概率区ROC曲线位于对角线下方的概率预报区间就越长。暴雨概率>5%, 预报时效1天时, 12 h的空报率和命中率分别为0.833和0.687; 24 h分别为0.837和0.768, 具有一定的暴雨预报能力。而当预报时效为2天时, 空报率基本等于命中率。到第15天, 概率 < 40%, 则完全没有预报能力。

ROC面积就是ROC曲线下方包围的面积。与上述分析相对应, 理想预报结果的ROC面积为1, 面积越小则预报效果越差; 当ROC面积 < 0.5时, 说明系统的预报效果还不如气候预测。图 7给出了1~15天的12、24 h不同量级降水的ROC面积, 可以看出12 h预报的ROC面积均 > 0.5以上 (图 7a); 而对于24 h来说, 第11天的暴雨预报ROC面积仅为0.482 (图 7b), 对暴雨无预报能力, 此外集合成员发散度的调整也在ROC面积中表现明显, 无论是小雨还是暴雨, 第11天的ROC面积均急剧下降, 预报能力显著变弱。1~12天的小雨、大雨12小时预报的ROC面积基本一致 (图 7a), 在第13天之后才小雨预报ROC面积才略高于大雨, 但两者均远高于暴雨的ROC面积。24 h大雨、暴雨ROC面积和12 h基本一致, 但24 h大雨的ROC面积显著优于小雨。比较12 h、24 h不同量级的ROC面积, 发现除第11天外, 模式对24 h降水预报的ROC曲线总是优于12 h。因此, 整体来说24 h的降水概率预报性能较好。

图 7 12 h和24 h不同量级降水的ROC面积 Figure 7 ROC area for different magnitude rainfall of 12 (a) and 24 (b) hours
3 结论和讨论

集合数值预报不仅改变了用户的传统观念, 也是目前天气预报研究及业务中的热点方向, 特别是集合预报系统 (EPS) 提供的概率预报客观上解决了预报业务中对极端天气不确定因素的判定, 得到了各级预报业务人员的广泛认可和普遍应用。本文以国家气象信息中心的CMORPH (NOAA Climate Prediction Center Morphing Method) 卫星与自动气象观测站的逐小时降水量融合产品为参照物, 采用Brier评分、Talagrand分布、ROC分析等方法, 评估2013、2014年欧洲中期天气预报中心ECMWF集合预报系统对我国中部地区的降水概率预报性能, 主要结论如下:

(1) 模式预报整体上能够较好的把握不同量级降水的空间分布形态, 准确刻画了研究区域小雨发生频率由西南向东北逐渐递减以及陕西南部与重庆、四川的交界处的暴雨频率高发区, 但降水频次与观测存在较大的差异, 具体来说, 小雨预报概率较观测频率系统性的偏高0.2以上, 暴雨预报概率较观测频率至少偏低4倍以上。这种预报概率和观测频率上的差异也为实际预报业务提供了一定的思路, 对小雨预报来说, 由于预报概率较观测频率偏高, 因此实际使用时, 可以考虑当模式给出的概率值大一些的时候, 预报小雨发生, 相反, 对暴雨来说, 可以考虑概率值略小一些, 这也符合大降水预报中的“宁空勿漏”原则。

(2) Brier评分表明模式对小雨具有稳定的预报技巧, 分辨能力强, 随着预报时效的增加, Brier评分缓慢增大, 预报技巧降低。对大雨及暴雨以上量级的降水来说, 预报性能急剧减弱, 其原因主要是一方面预报的可靠性变差, 另一方面是分辨能力不足, 无法从气候背景中分辨出降水事件。集合成员的发散度整体表现不足, Talagrand图呈“U”型分布。Talagrand图落在第一个区间和最后一个区间的预报频次偏大, 表明模式对小量级降水预报频次整体偏多, 概率偏大, 而对大量级的降水频次预报偏少, 概率偏低; 这也和降水预报概率的空间分布在量级上的表现特性比较一致, 对业务中定性选择概率阈值来预报可能发生的降水有一定的指导意义。随着预报时效的增加, Talagrand分布逐渐向理想曲线靠拢, 小量级降水预报频次偏多, 大量级的降水频次预报偏少的情况有所改善; 第11天, 预报系统的集合成员分布函数发生变化, Talagrand呈“钟”型分布, 导致模式预报性能整体下降。

(3) ROC分析表明, 模式在高概率区, 命中率高、空报率低, 预报技巧好。在低概率区, 预报技巧显著下降。对小雨来说, 随着时效的增加, 预报技巧逐渐趋于气候概率; 对暴雨而言, 预报日数超过2天后, 12 h (24 h) 降水概率 < 30%(40%) 时, 预报技巧低于气候概率, 没有参考价值。ROC面积表明, 小雨24 h降水概率预报技巧优于12 h; 对暴雨而言, 前6天12 h降水概率预报的ROC面积较24 h表现较好, 但整体没有一致性变化趋势, 这在ROC曲线图上也有相同的表现。

本文评估了2013、2014年5-10月ECMWF集合预报系统在我国中部地区的降水概率预报性能。需要说明的是, ECMWF集合预报资料十分庞大, 导致数据处理和评估非常困难, 本文解码的2013、2014年510月的ECMWF原始压码资料单个文件为167 M, 总资料量达2880 GB, 客观上增加了检验的难度。尽管更长时间的资料的评估更有意义, 但一方面模式在不断的发展, 另一方面, 从统计学上来看, 初始预报时次长达12个月的逐15天降水预报检验结果是可信的。此外, 本文重点阐述了模式的降水概率预报性能, 其它诸如温度、风场等要素的客观检验有待进一步展开。

参考文献
Hamill T M, Colucci S J. 1997. Verification of Eta-RSM short range ensemble forecasts[J]. Mon Wea Rev, 125(6): 711–724.
Hamill T M. 2001. Interpretation of rank histograms for verifying ensemble forecasts[J]. Mon Wea Rev, 129(3): 550–560. DOI:10.1175/1520-0493(2001)129<0550:IORHFV>2.0.CO;2
Kharin K, Zwiers F W. 2007. Improved Seasonal Probability Forecasts[J]. J Climate, 16(11): 1684–1701.
Murphy A H. 1973. A new vector partition of the probability score[J]. J Appl Meteor, 12(4): 595–600. DOI:10.1175/1520-0450(1973)012<0595:ANVPOT>2.0.CO;2
Murphy A H. 1993. What is a good forecast? An essay on the nature of goodness in weather forecasting[J]. Wea Forecasting, 8(2): 281–293. DOI:10.1175/1520-0434(1993)008<0281:WIAGFA>2.0.CO;2
Stephenson D B, Coelho C A, Jolliffe I T. 2005. Two Extra Components in the Brier Score Decomposition[J]. Wea forecasting, 23(8): 752–757.
Wilks D S. 2005. Statistical Methods in the Atmospheric Sciences[M]. Pittsburgh: Academic Press, 234-251.
杜均, 陈静. 2010. 单一值预报向概率预报转变的基础-谈谈集合预报及其带来的变革[J]. 气象, 36(11): 1–11. Du Jun, Cheng Jing. 2010. The corner stone in facilitating the transition from deterministic to probabilistic forecasts-ensemble forecasting and its impact on numerical weather prediction[J]. Meteor Mon, 36(11): 1–11.
杜均, 邓国. 2010. 单一值预报向概率预报转变的价值-谈谈概率预报的检验和应用[J]. 气象, 36(12): 10–18. Du Jun, Deng Guo. 2010. The utility of the transition from deterministic to probabilistic weather forecasts-verification and application of probabilistic forecasts[J]. Meteor Mon, 36(12): 10–18.
段明铿, 王盘兴, 李驰钦. 2012. NCEP集合预报系统在亚欧和北美区域的预报效果对比[J]. 大气科学学报, 35(6): 641–651. Duan Mingkeng, Wang Panxing, Li Chiqin. 2012. Comparisons on forecast performance of NCEP ensemble prediction system between Eurasia and North America regions[J]. Trans Atmos Sci, 35(6): 641–651.
郝民, 徐枝芳, 陶士伟, 等. 2011. GRAPES RUC系统模拟研究及应用试验[J]. 高原气象, 30(6): 1573–1583. Hao Ming, Xu Zhifang, Tao Shiwei, et al. 2011. Simulation study and application experiment of GRAPES RUC system[J]. Plateau Meteor, 30(6): 1573–1583.
何晓凤, 周荣卫, 孙逸涵. 2014. 3个全球模式对近地层风场预报能力的对比检验[J]. 高原气象, 33(5): 1315–1322. DOI:10.7522/j.issn.1000-0534.2013.00093 He Xiaofeng, Zhou Rongwei, Sun Yihan. 2014. Verification on surface wind speed of three global circulation models in China[J]. Plateau Meteor, 33(5): 1315–1322. DOI:10.7522/j.issn.1000-0534.2013.00093
何由, 阳坤, 姚檀栋, 等. 2012. 基于WRF模式对青藏高原一次强降水的模拟[J]. 高原气象, 31(5): 1183–1191. He You, Yang Kun, Yao Chandong, et al. 2012. Numerical simulation of a heavy precipitation in Qinghai-Xizang Plateau based on WRF model[J]. Plateau Meteor, 31(5): 1183–1191.
刘佳, 徐金霞, 马振峰, 等. 2014. 第二代月动力延伸预报产品对西南汛期降水的预报检验[J]. 高原气象, 33(6): 1468–1479. DOI:10.7522/j.issn.1000-0534.2013.00168 Liu Jia, Xu Jinxia, Ma Zhengfeng, et al. 2014. Evaluation of flood season prediction in southwest region by the second-generation monthly dynamic extended-range forecast[J]. Plateau Meteor, 33(6): 1468–1479. DOI:10.7522/j.issn.1000-0534.2013.00168
刘永和, 严中伟, 冯锦明, 等. 2013. 基于TIGGE资料的沂沭河流域6小时降水集合预报能力分析[J]. 大气科学, 37(3): 539–551. Liu Yonghe, Yan Zhongwei, Feng Jinming, et al. 2013. Predictability of 6-hour precipitation in the Yishu River Basin based on TIGGE data[J]. Chinese J Atmos Sci, 37(3): 539–551.
牛金龙, 黄楚惠, 李国平, 等. 2015. 基于高分辨率资料的湿螺旋度指标及其对成都强降水的预报应用[J]. 高原气象, 34(4): 942–949. DOI:10.7522/j.issn.1000-0534.2014.00053 Niu Jinlong, Huang Chuhui, Liguoping, et al. 2015. Moist helicity indexes selection and checking in Chengdu region for heavy rainfall based on the fine data[J]. Plateau Meteor, 34(4): 942–949. DOI:10.7522/j.issn.1000-0534.2014.00053
潘留杰, 张宏芳, 王建鹏, 等. 2014a. 日本高分辨率模式对中国降水预报能力的客观检验[J]. 高原气象, 33(2): 483–494. DOI:10.7522/j.issn.1000-0534.2012.00188 Pan Liujie, Zhang Hongfang, Wang Jianpeng, et al. 2014a. An Objective Verification of Forecasting Ability of Japan High-Resolution Model Precipitation in China[J]. Plateau Meteor, 33(2): 483–494. DOI:10.7522/j.issn.1000-0534.2012.00188
潘留杰, 张宏芳, 王建鹏. 2014b. 数值天气预报检验方法研究进展[J]. 地球科学进展, 29(3): 327–335. Pan Liujie, Zhang Hongfang, Wang Jianpeng. 2014b. Progress on verification methods of numerical weather prediction[J]. Adv Earth Sci, 29(3): 327–335.
薛春芳, 潘留杰. 2016. 基于MODE方法的日本细网格模式降水预报的诊断分析[J]. 高原气象, 35(2): 406–418. DOI:10.7522/j.issn.1000-0534.2015.00010 Xue Chunfang, Pan Liujie. 2016. Object based diagnostic analysis of Japan thin-grid modes precipitation forecasting[J]. Plateau Meteor, 35(2): 406–418. DOI:10.7522/j.issn.1000-0534.2015.00010
潘旸, 沈艳, 宇婧婧, 等. 2012. 基于最优插值方法分析的中国区域地面观测与卫星反演逐时降水融合试验[J]. 气象学报, 70(6): 1381–1389. Pan Yang, Shen Yan, Yu Jingjing, et al. 2012. Analysis of the combined gauge-satellite hourly precipitation over China based on the OI technique[J]. Acta Meteor Sinica, 70(6): 1381–1389.
王敏, 李晓莉, 范广洲, 等. 2012. 区域集合预报系统2 m温度预报的校准技术[J]. 应用气象学报, 23(4): 395–401. Wang Min, Li Xiaoli, Fan Guangzhou, et al. 2012. Calibrating 2 m temperature forecast for the regional ensemble prediction system at NMC[J]. J Appl Metero Sci, 23(4): 395–401.
许建伟, 高艳红. 2014. WRF模式对夏季黑河流域气温和降水的模拟及检验[J]. 高原气象, 33(4): 937–946. DOI:10.7522/j.issn.1000-0534.2013.00149 Xu JianWei, Gao Yan Hong. 2014. Validation of summer surface air temperature and precipitation simulation over Heihe River Basin[J]. Plateau Meteor, 33(4): 937–946. DOI:10.7522/j.issn.1000-0534.2013.00149
张利红, 何光碧. 2014. GRAPES_Meso模式对2011年夏季青藏高原东部及周边区域的预报检验[J]. 高原气象, 33(1): 14–25. DOI:10.7522/j.issn.1000-0534.2012.00175 Zhang Lihong, He Guangbi. 2014. Verification for GRAPES_Meso model in eastern Qinghai-Xizang Plateau and its surroundings in summer of 2011[J]. Plateau Meteor, 33(1): 14–25. DOI:10.7522/j.issn.1000-0534.2012.00175
赵琳娜, 吴昊, 田付友, 等. 2010. 基于TIGGE资料的流域概率性降水预报评估[J]. 气象, 36(7): 133–142. DOI:10.7519/j.issn.1000-0526.2010.7.020 Zhao Linna, Liu Lin, Liu Ying, et al. 2010. Assessment of probabilistic precipitation forecasts for the Huaihe Basin using TIGGE data[J]. Meteor Mon, 36(7): 133–142. DOI:10.7519/j.issn.1000-0526.2010.7.020
Evaluation of Precipitation Probability Forecasts of ECMWF Ensemble Prediction System in Central China
PAN Liujie1,2 , ZHANG Hongfang3 , CHEN Xiaoting2 , QU Liwei2 , YUAN Yuan4     
1. Key Laboratory of Characteristic Agrometeorological Disaster Monitoring and Early Warning and Risk Management in Arid Regions, CMA, Yinchuan 750002, China;
2. Shaanxi Meteorological Observatory, Xian 710014, China;
3. Shaanxi Meteorological Service Centre, Xian 710014, China;
4. Nanjing Meteorological Bureau, Nanjing 210022, China
Abstract: Using precipitation forecasting data of ECMWF ensemble forecast from May to October in 2013 and 2014, hourly fusion precipitation data of CMORPH (NOAA Climate Prediction Center Morphing Method) satellites and gauged rainfall from about 30000 automatic weather stations, based on Brier score, Talagrand distribution and ROC (Relative operating characteristic) analysis, the precipitation probability forecast ability of ECMWF ensemble system in central China is studied.Results show that:ECMWF ensemble system has stable forecast skill for light rain, but probability forecast is large; the resolution for heavy rain or rainfall magnitude greater than heavy rain is low, and probability is small.Talagrand distribution overall show "U" shape, forecast frequency for moderate precipitation is less; as for the consistency of forecast and observation in different magnitude rainfall, the longer the forecast time is, forecast ability more stable; ensemble members' divergence have apparent changes in 11th forecast day, Talagrand distribution show "clocks" shape, forecast score decreased significantly.The shorter the forecast days, the better the precipitation probability forecast, on average, forecast time more than 2 days, forecast skill of 12 hours (24 hours) rainstorm probability less than 30% (40%) is lower than climatic prediction.24 hours precipitation forecast has higher hit rate and lower false rate compared with 12 hours forecast, forecast skill is better; in previous six days, ROC area of 12 hours precipitation probability forecast is better than 24 hours.
Key Words: Ensemble prediction    Precipitation probability    ECMWF    Relative Operational Character analysis