文章快速检索     高级检索
  高原气象  2017, Vol. 36 Issue (5): 1221-1233  DOI: 10.7522/j.issn.1000-0534.2016.00079
0

引用本文 [复制中英文]

吴子君, 张强, 石彦军, 等. 2017. 多种累积降水量分布函数在中国适用性的讨论[J]. 高原气象, 36(5): 1221-1233. DOI: 10.7522/j.issn.1000-0534.2016.00079
[复制中文]
Wu Zijun, Zhang Qiang, Shi Yanjun, et al. 2017. The Applicability of Several Distribution Functions Which used to Describe the Characteristics of Cumulative Precipitation in China[J]. Plateau Meteorology, 36(5): 1221-1233. DOI: 10.7522/j.issn.1000-0534.2016.00079.
[复制英文]

资助项目

国家重点基础发展研究计划项目(2013CB430200);国家自然科学基金项目(41630426)

作者简介

吴子君(1991-), 女, 甘肃兰州人, 硕士研究生, 主要从事干旱监测研究, E-mail:wuzj2010@lzu.edu.cn

文章历史

收稿日期: 2015-12-28
定稿日期: 2016-07-25
多种累积降水量分布函数在中国适用性的讨论
吴子君1,2, 张强3, 石彦军4, 金时强5, 张红丽1,2     
1. 兰州大学大气科学学院, 兰州 730000;
2. 中国气象局兰州干旱气象研究所, 兰州 730020;
3. 中国气象局兰州干旱气象研究所/甘肃省干旱气候变化与减灾重点实验室/中国气象局干旱气候变化与减灾重点开放实验室/甘肃省气象局, 兰州 730020;
4. 兰州大学信息科学与工程学院, 兰州 730000;
5. 堪萨斯州立大学统计系, 美国 堪萨斯州 66502
摘要: 为得到在多个时间尺度下, 均适于描述我国累积降水量分布特征的分布函数, 选择了伽马分布、广义极值分布、对数正态分布、韦伯分布、正态分布以及瑞利分布这6个分布进行详细检验。利用1961-2013年我国760个气象台站的月值降水数据, 分别在1, 3, 6, 9, 12和24个月这6个时间尺度下, 在全国范围内对6个分布进行了K-S检验。结果发现, 广义极值分布是最适于描述我国各时间尺度下累积降水量特征的分布函数, 其次为伽马分布, 瑞利分布最差。再对1个月和3个月时间尺度下的累积降水量分季节分地区进行详细讨论, 发现1个月时间尺度下, 春、夏、秋三季均是广义极值分布优于伽马分布, 而冬季时伽马分布优于广义极值分布, 但四个季节中在我国不同气候区内的具体情况亦有差异。3个月时间尺度下, 夏冬两季及全国各区域内, 均是广义极值分布优于伽马分布。
关键词: 累积降水量    分布函数    多时间尺度    
1 引言

降水是最重要的气候要素之一, 对表征某一区域的气候特征及资源具有重要意义(陈豫英等, 2010)。中国位于亚洲季风气候区, 受季风的影响, 全国大部分地区的降水变率非常明显, 且区域间气候也存在着明显差异, 因而导致了我国的降水特征无论是在时间上或是空间上, 都存在较大差异(钟军, 2013), 给降水特征的研究带来诸多不便。虽然目前已有一些物理、动力过程的解释, 但要很好的描述降水的时空分布却较为困难。从某种意义上说, 目前采用某些统计数值模式研究降水的气候特征和演变规律仍具有一定的可信度, 在一定程度上可弥补物理、动力学方法的不足, 因此, 对降水概率分布的研究, 历来为许多气候学家和统计学家所重视(丁裕国, 1994)。

近年来受到全球变暖的影响, 水循环加剧, 世界多地频发洪水、干旱以及台风等极端水文气象事件, 这与降水时空分布发生变异存在密切关系(Zhang et al, 2009; Xu et al, 2005)。我国不仅是世界上多发暴雨等强降水自然灾害的国家之一(栾晨等, 2012), 也常年受到干旱灾害的影响, 在我国, 每年因干旱造成的粮食减产占气象灾害粮食总损失的50%以上(黄荣辉等, 2012)。目前监测和研究干旱较为有效的一种方法是利用气温和降水量等资料建立干旱指数(John et al, 2005), 而近年来常用的一些干旱指数, 例如SPI指数、Z指数和CI指数等, 在计算和构建时, 均以假设累积降水量服从于某一分布类型为前提(王素萍等, 2015; 熊光洁等, 2014; 袁文平和周广胜, 2004; 张磊等, 2013; 李红英等, 2014; Mckee et al, 1993, 1995; Guttman, 1999), 可见对累积降水量分布类型的详细讨论, 对洪、旱等极端事件的监测及科学理解其时空变化特征具有重大意义。

早在1950年, 徐尔灏(1950)就对我国月降水的理论分布进行过研究检验, 发现我国各地年降水量基本上服从于正态分布。丁裕国(1994)经验证后发现, 伽马分布在拟合月降水时是最佳分布。程智(2011)利用广义极值分布对我国夏季降水的极端值分布进行拟合, 检验结果显示广义极值分布可以较好的拟合极端降水分布。王澄海等(2012)王芝兰等(2013)在假设一段时间的降水量服从广义极值分布的前提下, 构造了GEVI指数, 并通过对比发现, 在我国西北地区, GEVI指数在干旱监测和强度判定方面具有较大优势; 石彦军(2014)选择了对数正态分布、伽马分布、韦伯分布、广义帕累托分布、正态分布以及瑞利分布在多时间尺度下进行对比验证, 结果表明韦伯分布更适合描述新疆地区各时间尺度下累积降水量的分布特征; 王斌等(2011)对比了伽马分布、皮尔逊Ⅲ型分布和偏正态分布对哈尔滨市逐日降水过程的模拟情况, 认为伽马分布更适合描述哈尔滨市的逐日降水过程。时芳欣等(2014)选择了韦伯分布、伽马分布和截断正态分布, 通过对比发现, 韦伯分布是最适宜描述我国黄淮海地区降水特征的分布类型。但是, 目前还没有针对全国范围内不同时间尺度下的累积降水量分布特征的讨论。

综上所述, 选择伽马分布、广义极值分布、对数正态分布、韦伯分布、正态分布和瑞利分布, 对全国范围内降水量在不同时间尺度和不同季节的条件下进行检验, 以期得到更适合描述我国累积降水量分布特征的分布函数。

2 资料选取和方法介绍 2.1 资料选取

选取全国范围内的760个气象台站, 利用1961-2013年逐月降水资料进行计算和检验, 数据来源于中国气象科学数据共享服务网。

2.2 K-S检验

K-S检验法(Kolmogorov-Smirnov检验法), 最初由俄国数学家Kolmogorov(1933)于1933年提出, 之后俄国数学家Smirnov(1939)于1939年对其进行了改进, K-S检验常用来检验某一组样本数据是否服从某一理论分布。具体步骤如下(石彦军, 2014; 南波, 2012):

x1, x2, …, xn为未知分布的总体中抽取的一组样本, F(xi)表示指定的理论分布函数, Fn(xi)为经验分布函数。检验样本是否服从指定的分布可以表述为如下的假设检验:

$ {H_0}:\;{x_1},\;{x_2},\; \ldots ,\;{x_n}\sim F\left( {{x_i}} \right)\;, $ (1)

构造如下统计量:

$ {D_n} = \mathop {\max }\limits_{ - \infty < x < + \infty } \left| {{F_n}\left( {{x_i}} \right) - F\left( {{x_i}} \right)} \right|\;, $ (2)

式中: Dn为对应所有样本xi的经验分布Fn(xi)与理论分布F(xi)之差最大值的绝对值。

$ \lambda = \sqrt n {D_n}$, Kolmogorov证明, 对于任意的λ>0, 有:

$ \lim P\left( {{D_n} \le \frac{\lambda }{{\sqrt n }}} \right) = \theta \left( \lambda \right) = \sum\limits_{k = - \infty }^{ + \infty } {{{\left( { - 1} \right)}^k}{e^{ - 2{k^2}{\lambda ^2}}}} \;\;, $ (3)

如果xi的总体可以较好的服从于F(xi), 则Dn通常较小, 出现较大Dn的概率也较小, 若给定一个概率α, 令:

$ \alpha = 1 - \theta \left( \lambda \right) = 1 - \sum\limits_{k = - \infty }^{ + \infty } {{{\left( { - 1} \right)}^k}{e^{ - 2{k^2}{\lambda ^2}}}} \;\; , $ (4)

可以推算出α对应的临界值λα, 通常λα可在统计用表中查到。如果实测的Dn大于$ {\frac{\lambda }{{\sqrt n }}}$, 说明经验分布Fn(xi)与理论分布F(xi)的差异过大, 则拒绝原假设, 即认为xi总体上不能较好的服从于理论分布, 反之接受原假设。

3 各分布简介

本文对各分布的参数情况、累积分布函数及主要应用范围均进行了简单的介绍, 并在图 1中给出了这6个分布在参数不同时的概率密度函数(probability density function, PDF)图像。

图 1 6个分布的概率密度函数图像 (a)伽马函数, (b)广义极值分布, (c)对数正态分布, (d)韦伯分布, (e)正态分布, (f)瑞利分布 Figure 1 The probability density function images of six distributions. (a) Gamma distribution, (b) GEV distribution, (c) Log-normal distribution, (d) Weibull distribution, (e) Normal distribution, (f) Rayleigh distribution
3.1 伽马分布

伽马分布(Aksoy, 2000)有两个参数, 分别为形状参数α和尺度参数β, 且α>0, β>0。其累积分布函数为:

$ F\left( x \right) = \frac{1}{{\mathit{\Gamma} \left( \alpha \right)}}\gamma \left( {\alpha ,\;\beta x} \right),\;(x > 0) $ (5)

伽马分布主要应用于保险理赔、水文学、无线电通信、神经学以及基因学等方面。

3.2 广义极值分布

广义极值分布(Muraleedharan et al, 2011; Gueganand, 2014) 有三个参数:位置参数μ, 尺度参数σ和形状参数ξ, 其中μR, σ>0, ξR。广义极值分布实现了对3种类型极值分布函数的统一, 即:

ξ=-α-1<0时, 广义极值分布为Fréchet分布, 累积分布函数为:

$ F\left( {x;\;\mu ,\;\sigma ,\;\xi } \right) = \left\{ \begin{array}{l} {e^{ - {{\left[ { - \left( {x - \mu } \right)/\sigma } \right]}^\alpha }}},x < \;\mu \\ 1\;,\;\;\;\;\;\;\;\;\;\;x \ge \mu \end{array} \right. $ (6)

ξ=α-1>0时, 广义极值分布为Weibull分布, 其累积分布函数为:

$ F\left( {x;\;\mu ,\;\sigma ,\;\xi } \right) = \left\{ \begin{array}{l} 0\;,\;\;\;\;\;\;\;\;\;x \le \mu \\ {e^{ - {{\left[ {\left( {x - \mu } \right)/\sigma } \right]}^{ - \alpha }}}},x > \mu \end{array} \right. $ (7)

ξ=0时, 广义极值分布为Gumbel分布, 其累积分布函数为:

$ F\left( {x;\;\mu ,\;\sigma ,\;\xi } \right) = {e^{ - {e^{}} - \left( {x - \mu } \right)/\sigma }},\;x \in R $ (8)

广义极值分布主要应用于水文学、保险以及金融等领域。

3.3 对数正态分布

对数正态分布(Robert et al, 1979)有两个参数:位置参数μ和尺度参数σ, 其中μR, σ>0。其累积分布函数为:

$ F\left( x \right) = \frac{1}{2} + \frac{1}{2}{\rm{erf}}\left( {\frac{{{\rm{ln}}x - \mu }}{{\sqrt 2 \sigma }}} \right)\;,\;(x > 0) $ (9)

对数正态分布函数主要应用于生物学、医药学、胶体化学、高分子化学、水文学以及经济金融等领域。

3.4 韦伯分布

韦伯分布(SharifandIslam, 1980)有两个参数:尺度参数λ和形状参数k, 其中λ>0, k>0。其累积分布函数为:

$ F\left( x \right) = \left\{ \begin{array}{l} 1 - {e^{ - {{\left( {\frac{x}{\lambda }} \right)}^k}}},x \ge 0\\ 0\;,\;\;\;\;\;\;\;\;x < 0 \end{array} \right. $ (10)

韦伯分布主要应用于生存分析、电气工程、工业工程、天气预报、水文学、通信工程以及故障分析等领域。

3.5 正态分布

正态分布(Lukacs, 1942)有两个参数:即位置参数(平均值)μ和尺度参数σ(标准差), 其中μR, σ>0。其累积分布函数为:

$ F\left( x \right) = \frac{1}{2}\left[ {1 + {\rm{erf}}\left( {\frac{{x - \mu }}{{\sigma \sqrt {2\;} }}} \right)} \right],\;(x \in R) $ (11)

正态函数主要应用于生物学、金融、物理实验中的误差测量以及水文学等领域。

3.6 瑞利分布

瑞利分布(Siddiqui, 1962)有一个参数σ, 且σ>0。其累积分布函数为:

$ F\left( x \right) = 1 - {e^{ - {x^2}/2{\sigma ^2}}},\;\left( {x \ge 0} \right) $ (12)

瑞利分布主要应用于通信和计算机等领域。

4 结果分析 4.1 各分布K-S检验的结果

分别对1, 3, 6, 9, 12和24个月这6个时间尺度下的累积降水量进行详细讨论及检验。对于某一站点来说, 1个月时间尺度的累积降水量即为每个月当月的月降水量, 而3个月时间尺度的累积降水量即为连续3个月降水量的总和, 且全年滚动累积(即1-3月降水量的总和为3月的3个月累积降水量, 2-4月降水量的总和为4月的3个月累积降水量, 12月与第二年的1-2月降水量总和为第二年2月的3个月累积降水量等)。6, 9, 12和24个月时间尺度下的累积降水量同样按上述原则滚动累积。

分别对这6个时间尺度下6种分布在全国760个台站进行K-S检验后的通过率(图 2)做汇总统计可以看到, 1个月时间尺度下, 伽马分布和韦伯分布的通过率最高, 其次是广义极值分布和对数正态分布; 正态分布和瑞利分布通过率较低。从3个月时间尺度开始, 除了瑞利分布以外, 其余5个分布的通过率都有明显增长, 且通过率均保持在90%以上。瑞利分布的通过率在各时间尺度下都是最低的, 且随着时间尺度的增长, 通过率有明显的递减趋势, 到24个月时间尺度时, 其通过率已几乎为0。

图 2 6个时间尺度下各分布K-S检验的通过率 (a) 1个月, (b) 3个月, (c) 6个月, (d) 9个月, (e) 12个月, (f) 24个月 Figure 2 The passing rate of K-S test of every distribution on six time scales. (a) one month, (b) three months, (c) six months, (d) nine months, (e) twelve months, (f) twenty four months

由于K-S检验的原理是基于假设检验, 通过率只能表现出一组降水数据是否能以较大的概率服从于指定分布, 单纯考察通过率并不够严谨; 且除瑞利分布外, 各分布的通过率相对比较接近, 不能明显看出各分布的优劣程度。因此, 又对比了进行K-S检验时计算所得P值(即进行假设检验时原假设成立的概率), 在一次检验中, 如果某一个分布不仅通过了K-S检验, 且其对应的P值也是6个分布中最大的, 则可以认为该分布是本次检验中的最优分布。从6个时间尺度下各分布成为最优分布次数的百分率统计(图 3)中可以看到, 在各时间尺度下, 广义极值分布成为最优分布次数的百分率都是各分布中最高的, 且始终保持在30%以上, 在24个月时间尺度下的百分率最高, 达到35%以上。瑞利分布依旧是各时间尺度下百分率最低的分布。其余4个分布成为最优分布次数的百分率则随时间尺度的变化而变化:伽马分布和韦伯分布在时间尺度较小时, 其百分率较高, 而时间尺度较大时, 百分率较低。对数正态分布和正态分布则恰好相反, 在时间尺度较小时, 其百分率较低, 而时间尺度较大时, 百分率较高。

图 3 6个时间尺度下各分布成为最优分布的次数的百分率 (a) 1个月, (b) 3个月, (c) 6个月, (d) 9个月, (e) 12个月, (f) 24个月 Figure 3 The percentage of times of each distribution becoming the best distribution on six time scales. (a) one month, (b) three months, (c) six months, (d) nine months, (e) twelve months, (f) twenty four months
4.2 对各分布K-S检验分季节讨论的结果

通过对各分布K-S检验的结果分析可以看到, 各分布检验结果的差异主要体现在1个月和3个月的时间尺度上, 且对于较小时间尺度下的累积降水量来说, 季节性差异很大。因此有必要对1个月时间尺度的累积降水量检验结果分春、夏、秋、冬四季, 对3个月时间尺度的累积降水量检验结果分冬、夏两季, 再次进行详细的讨论。并且瑞利分布的检验结果不尽人意, 因此在之后的讨论中将不再包括瑞利分布。

此处选择1月、4月、7月和10月作为冬、春、夏、秋四季的代表月, 将各分布在四个季节下全国站点进行K-S检验的通过率汇总(图 4), 可以看出夏季时, 各分布K-S检验的通过率都是最高的, 均超过90%;春、秋两季的通过率次之, 且差别不大; 冬季时各分布检验的通过率都最低, 均低于80%。

图 4 1个月时间尺度下不同季节时各分布K-S检验的通过率 (a)春季, (b)夏季, (c)秋季, (d)冬季 Figure 4 The passing rate of K-S test of every distribution in four seasons on one-month time scale. (a) spring, (b) summer, (c) autumn, (d) winter

就不同季节的详细情况来看, 春、夏、秋三季中广义极值分布的K-S检验通过率均是最高的, 伽马分布和韦伯分布次之, 且通过率相差不大; 唯有在冬季时, 伽马分布和韦伯分布的通过率高于广义极值分布; 正态分布在四季中通过率都最低。

同样对各分布在四个季节时成为最优分布的次数百分率进行汇总(图 5)可以看出, 除了正态分布和对数正态分布依旧存在夏季百分率最高而冬季百分率最低的特征外, 其余3个分布的情况在各季节差异较大。广义极值分布在春季时百分率最高, 夏、秋季次之, 冬季最低; 韦伯分布在秋季时百分率最高, 春季次之, 夏、冬两季最低; 伽马分布则是在冬季时百分率最高, 夏、春两季次之, 秋季时最低。

图 5 1个月时间尺度下不同季节时各分布成为最优分布次数的百分率 (a)春季, (b)夏季, (c)秋季, (d)冬季 Figure 5 The percentage of times of each distribution becoming the best distribution in four seasons on one-month time scale. (a) spring, (b) summer, (c) autumn, (d) winter

就不同季节的详细情况来看, 在春、秋两季时, 广义极值分布成为最优分布的百分率最高, 其次为韦伯分布; 夏季时广义极值分布的百分率依旧最高, 其次为伽马分布; 冬季时, 伽马分布成为最优分布的百分率最高, 其次为广义极值分布。对数正态分布和正态分布在四个季节中百分率都是最低的。

综合图 4图 5的结果不难得出, 在全国范围内, 对于1个月时间尺度的累积降水量来说, 在春、夏、秋这三个季节, 广义极值分布都是最适于描述我国累积降水量分布特征的函数, 而对于冬季来说, 伽马分布更适于描述我国累积降水量的分布特征。

同样地, 分别给出3个月时间尺度下冬季和夏季各分布K-S检验的通过率(图 6)和各分布成为最优分布次数的百分率(图 7)。3个月时间尺度下, 各分布K-S检验的通过率依旧是夏季明显高于冬季。在夏季时, 广义极值分布的通过率最高, 其次为伽马分布和对数正态分布, 正态分布的通过率最低。成为最优分布次数的百分率依旧是广义极值分布最高, 其次为对数正态分布、伽马分布, 其余两个分布均较低。冬季时广义极值分布的通过率最高, 其次为伽马分布和韦伯分布, 正态分布的通过率最低。成为最优分布次数的百分率依旧是广义极值分布最高, 其次是伽马分布和韦伯分布, 对数正态分布和正态分布较低。

图 6 3个月时间尺度下夏(a)冬(b)两季各分布K-S检验的通过率 Figure 6 The passing rate of K-S test of every distribution in summer (a) and winter (b) on three-month time scale
图 7 3个月时间尺度下夏(a)冬(b)两季各分布成为最优分布的次数的百分率 Figure 7 The percentage of times of each distribution becoming the best distribution in summer (a) and winter (b) on three-month time scale

综合图 6图 7的结果可以看出, 在3个月时间尺度下, 全国范围内冬夏两季均是广义极值分布能够最好的描述我国累积降水量的分布特征。伽马分布在冬季时也能较好的描述我国累积降水量的分布特征。

为了能够更明显的看出各分布的优劣程度, 本文综合了以上各检验的结果, 对这6个分布进行评分(图 8), 可以看到在6种分布中, 分数最高的为广义极值分布, 其次是伽马分布, 再次是对数正态分布、韦伯分布和正态分布, 分数最低的是瑞利分布。

图 8 各分布评分结果 Figure 8 The scores of every distribution
4.3 广义极值分布最优的原因分析

探究了广义极值分布成为6种分布中最优分布的原因, 认为主要有以下两个方面:

首先从累积降水量自身的分布特征来看。以甘肃省的武都站点为代表, 给出了其6个时间尺度下累积降水量的频率分布直方图(图 9), 可以看出在较小的时间尺度下, 累积降水量的分布呈现明显的偏态分布特征, 随着时间尺度的增加, 累积降水量的分布逐渐呈现出较为明显的正态分布特征。因此, 只具有偏态或者正态特征的分布, 如瑞利分布和正态分布, 肯定无法较好的满足各个时间尺度的需求。通过各分布介绍中给出的各分布在不同参数下的概率密度函数曲线(图 1)可以看到, 其余4个分布在参数不同时, 即可有近似正态的分布特征, 也可有偏态的分布特征, 因此这4个分布的检验结果相对较好。

图 9 武都站点各时间尺度下累积降水量的频率分布 (a) 1个月, (b) 3个月, (c) 6个月, (d) 9个月, (e) 12个月, (f) 24个月 Figure 9 The frequency histogram of cumulative precipitation on every time scale at Wudu station. (a) one month, (b) three months, (c) six months, (d) nine months, (e) twelve months, (f) twenty four months

为了验证累积降水量的分布特征随时间尺度的变化规律(图 9), 图 10给出了正态分布在各时间尺度下K-S检验通过率及成为最优分布的次数百分率。从图 10可以看出, 正态分布在1个月和3个月时间尺度下K-S检验的通过率明显低于之后几个时间尺度的通过率。随着时间尺度的增加, 正态分布成为最优分布的次数呈明显的上升趋势。其次, 从各分布自身特征(见图 1)的角度来看, 瑞利分布有一个参数, 广义极值分布有3个参数, 其余4个分布都有两个参数。较多的参数使得广义极值分布具有更高的灵活性; 并且广义极值分布实现了对3种类型极值分布的统一, 3种分布的特性兼而有之, 又弥补了彼此的不足, 使其更加具有优势。

图 10 正态分布各时间尺度下K-S检验的通过率(a)及成为最优分布的次数的百分率(b) Figure 10 The passing rate of K-S test of Normal distribution (a) and the percentage of Normal distribution becoming the best distribution (b) on every time scale
5 在全国不同地区分季节对广义极值分布和伽马分布进行对比

讨论1个月和3个月时间尺度下不同季节的累积降水量分布特征, 发现广义极值分布表现最优, 伽马分布的检验结果也相对较好, 但是前文并没有关注到地域差异。中国大陆地域辽阔, 地形地貌复杂, 气候类型多样, 降水的时空分布差异较大。近年来, 对我国气候区域进行划分的相关研究不少, 目前较为普遍的一种划分方法是通过参考降水量和蒸发量等气象要素, 将我国分为极端干旱区、干旱区、半干旱区、半湿润区、湿润区以及极端湿润区(冉津江, 2014; 马柱国和符淙斌, 2005; 张煜星, 1998; 杨绚和李栋梁, 2008)。根据性质与成因不同, 干旱又可分为永久性干旱、阶段性干旱和季节性干旱等(钱正安等, 2011; 黄晚华等, 2013, 2010)。因此, 在结果讨论的基础上, 挑选出广义极值分布和伽马分布, 根据K-S检验的结果, 分别给出在1个月时间尺度(图 11)和3个月时间尺度下(图 12), 两种分布在不同季节时全国累积降水量分布特征的适用性分布。如果1个站点在进行K-S检验后, 伽马分布的P值较大, 可认为伽马分布更优, 即在图上标示出该站点, 广义极值分布同理。

图 11 1个月时间尺度下不同季节时伽马分布(左)与广义极值分布(右)全国适用性分布 (a)春季, (b)夏季, (c)秋季, (d)冬季 Figure 11 The applicability of Gamma distribution(left) and GEV distribution(right) all around China in four seasons on one month time scale. (a) spring, (b) summer, (c) autumn, (d) winter
图 12 3个月时间尺度下夏(a)、冬(b)两季时伽马分布(左)与广义极值分布(右)全国适用性分布 Figure 12 The applicability of Gamma distribution (left) and GEV distribution (right) all around China in summer (a) and winter (b) on three-month time scale

图 11图 12中可以看出, 在春、夏、秋三个季节中, 广义极值分布在全国范围内较优的站点数明显多于伽马分布, 而在冬季时, 伽马分布在全国范围内较优的站点数多于广义极值分布。但值得注意的是, 在不同地区也出现了一些差异:春季时, 在图中方框内标出的位于我国干旱半干旱地区的大片区域内, 伽马分布较优的站点数明显多于广义极值分布, 同时该片区域也属于半永久性干旱区, 干旱灾害发生较为频繁。夏季时, 在图中方框内标出的干旱与极端干旱地区内(图 11), 伽马分布较优的站点数比广义极值分布较优的站点数更为密集, 此外, 该片区域属于永久性干旱, 干旱灾害常年发生。秋季时, 伽马分布较优的站点数相比于广义极值分布最为稀少, 但也可以看到, 在图中方框内标出的位于半干旱区与半湿润区交界地带的小片区域, 以及位于湿润区的小片区域内, 伽马分布较优的站点数更为密集。冬季时, 伽马分布在全国范围内较优的站点数明显多于广义极值分布, 只有图中方框内所标出的位于极端湿润区的小片区域内, 广义极值分布较优的站点数更为密集。我国南方均处于半湿润区或湿润区, 降水量较丰富, 但也常会发生季节性干旱, 需引起重视。

同样给出在3个月时间尺度下, 两种分布在冬夏两季节时全国累积降水量分布特征的适用性分布图(图 12)。从图 12中可以看到, 3个月时间尺度下, 广义极值分布无论在夏季或是冬季, 在全国各区域内较优的站点数都明显多于伽马分布, 只有冬季时, 在图中方框内标出的干旱与极端干旱区的部分地区内, 伽马分布较优的站点数相对较多, 分布较为均匀。可见在3个月时间尺度下, 相对于伽马分布, 广义极值分布的优势则更为明显。

6 结论和讨论

为了挑选出在多个时间尺度下均适合描述我国累积降水量分布特征的分布函数, 选择了伽马分布、广义极值分布、对数正态分布、韦伯分布、正态分布和瑞利分布, 在1, 3, 6, 9, 12和24个月这6个时间尺度下, 对全国范围内的760个气象台站的累积降水量进行K-S检验, 得到以下结论:

(1) 在1个月时间尺度下, 伽马分布和韦伯分布的通过率最高, 从3个月时间尺度开始, 均是广义极值分布的通过率最高。瑞利分布的通过率在各时间尺度下都最低。且除了瑞利分布以外, 其余五个分布的通过率在3个月时间尺度之后, 都有明显的增长。

(2) 在各时间尺度下, 广义极值分布成为最优分布的百分率均是最高的, 瑞利分布均为最低。其余4个分布的百分率随时间尺度的变化而改变, 其中伽马分布和韦伯分布在时间尺度较小时, 百分率较高; 时间尺度较大时, 百分率较低。对数正态分布和正态分布则恰好相反。

(3) 在1个月时间尺度下, 春、夏、秋三个季节中, 广义极值分布都是最适于描述我国累积降水量分布特征的函数; 而在冬季, 伽马分布最适于描述我国累积降水量的分布特征。在3个月时间尺度下, 夏、冬两季均是广义极值分布能够最好的描述我国累积降水量的分布特征。

(4) 根据检验结果对6个分布进行评分, 在6个分布中, 分数最高的为广义极值分布, 其次是伽马分布, 再次是对数正态分布、韦伯分布和正态分布, 瑞利分布分数最低。

(5) 广义极值分布不仅有近似正态的分布特征, 也有偏态的分布特征; 且广义极值分布有3个参数, 具有更高的灵活性; 它还实现了对三种极值分布的统一, 在拟合中也具有更强的适应性, 从而成为六种分布中检验结果最好的分布。

(6) 在广义极值分布和伽马分布的全国累积降水量分布特征的适用性分布图上可以看到, 在1个月时间尺度下, 春、夏、秋三季中均是广义极值分布较优的站点数更多、分布更为密集, 但各季中也有部分区域伽马分布较优的站点数多于广义极值分布, 如春季时干旱半干旱地区的部分区域、夏季时干旱与极端干旱区的部分区域以及秋季时湿润区的部分区域等; 冬季时伽马分布较优的站点数更密集, 但在极端湿润区广义极值分布较优的站点数更多。3个月时间尺度下, 夏冬两季均是广义极值分布较优的站点数在全国各区的分布更为密集。

在多个时间尺度和不同季节的条件下对我国累积降水量的分布特征进行了详细讨论, 发现相比于其他分布, 广义极值分布优势最为明显, 但在第5部分的讨论中也可以看到, 在全国的不同地区存在一定差异。本文对我国不同气候区内详细情况的分析讨论还比较欠缺, 这将在今后的工作中继续展开。

参考文献
Aksoy H. 2000. Use of Gamma Distribution in hydrological analysis[J]. Turkish Journal of Engineering and Environmental Sciences, 24(6): 419–428.
Guegan D, Hassani B. 2014. A Mathematical resurgence of risk management:an extreme modeling of expert opinions[J]. Frontiers in Finance and Economics, 11(1): 25–45.
Guttman N B. 1999. Accepting the standardized precipitation index:A calculation algorithm1[J]. Journal of the American Water Resources Association: 311–322.
Kolmogorov А Н. 1933. Sulla determinazione empirica di una leggi di distribuzione[J]. Giorn Ist Ital Attuari, 4: 83–91.
Lukacs E. 1942. A characterization of the normal distribution[J]. The Annals of Mathematical Statistics, 13(1): 91–93. DOI:10.1214/aoms/1177731647
McKee T B, Doesken N J, Kleist J. 1995. Drought monitoring with multiple time scales[C] Proceedings of the 9th Conference on Applied Climatology. Dallas, Boston, MA:American Meteorological Society, 233-236. https://www.researchgate.net/publication/245975152_Drought_Monitoring_With_Multiple_Time_Scales
McKee T B, Doesken N J, Kleist J. 1993. The relationship of drought frequency and duration to time scales[C] Proceedings of the 8th Conference on Applied Climatology. Boston, MA:American Meteorological Society, 17(22):179-183. http://www.mfkp.org/INRMM/article/14027580
Muraleedharan G, Guedes C, Lucas C. 2011. Characteristic and moment Generating Functions of Generalized Extreme Value Distribution(GEV), sea level rise, coastal engineering, shorelines and tides[J]. Nova Science Publishers. Chapter-14, pp. 269-276.
Robert W, Freeman D H, Johnson M F. 1979. Justification for the lognormal distribution as a model for blood pressure[J]. Journal of Chronic Diseases, 32(3): 245–250. DOI:10.1016/0021-9681(79)90070-5
Sharif M N, Islam M N. 1980. The Weibull distribution as a general model for forecasting technological change[J]. Technological Forecasting and Social Change, 18(3): 247–256. DOI:10.1016/0040-1625(80)90026-8
Siddiqui M M. 1962. Some problems connected with rayleigh distributions[J]. Journal of Research of the National Bureau of Standards, 66(2): 167–174.
Smirnov N V. 1939. Estimate of deviation between empirical distribution functions in two independent samples[J]. Bulletin Moscow University, 2(2): 3–16.
Xu Chongyu, Widden E, Halldin S. 2005. Modeling Hydrological Consequences of Climate Change-progress and Challenge[J]. Adv Atmos Sci, 22(6): 789–797. DOI:10.1007/BF02918679
Zhang Qiang, Xu Chongyu, Chen Yongqin, et al. 2009. Spatial assessment of hydrologic alteration across the Pearl River Delta, China, and possible underlying causes[J]. Hydrological Processes, 23: 1565–1574. DOI:10.1002/hyp.v23:11
JohnK, JohnA D, 周跃武, 等. 2005. 干旱的定量化:干旱指数的评价[J]. 干旱气象, 2: 85–94. DOI:10.3969/j.issn.1006-7639.2005.02.016 John K, John A D, Zhou Yaowu, et al. 2005. The quantification of drought:an evaluation of drought indices[J]. Arid Meteor, 2: 85–94. DOI:10.3969/j.issn.1006-7639.2005.02.016
陈豫英, 陈楠, 王式功, 等. 2010. 中蒙干旱半干旱区降水的时空变化特征(Ⅰ):年降水特征及5~9月降水的REOF分析[J]. 高原气象, 29(1): 33–43. Chen Yuying, Chen Nan, Wang Shigong, et al. 2010. Temporal and spatial change features of precipitation over China-Mongolia Arid-and Semiarid-Areas(Ⅰ):Annual rainfall feature and May~September on REOF analyses[J]. Plateau Meteor, 29(1): 33–43.
程智. 2011. 中国汛期降水及其极端值的统计推断模型研究[D]. 兰州: 兰州大学, 1-43. Cheng Zhi. 2011. Statistical models for predicting summer rainfall and its extremes in China[D]. Lanzhou:Lanzhou University, 1-43. http: //cdmd. cnki. com. cn/Article/CDMD-10730-1011140310. htm
丁裕国. 1994. 降水量Γ分布模式的普适性研究[J]. 大气科学, 18(5): 552–560. Ding Yuguo. 1994. Research of Universality for Γ distribution model of precipitation[J]. Chinese J Atmos Sci, 18(5): 552–560.
段莹, 王文, 蔡晓军. 2013. PDSI、SPEI及CI指数在2010/2011年冬、春季江淮流域干旱过程的应用分析[J]. 高原气象, 33(4): 1126–1139. DOI:10.7522/j.issn.1000-0534.2012.00106 Duan Ying, Wang Wen, Cai Xiaojun. 2013. Applied analyses on palmer, SPEI and CI Indices of drought process in Yangtze-Huaihe River basins during winter of 2010/spring of 2011[J]. Plateau Meteor, 33(4): 1126–1139. DOI:10.7522/j.issn.1000-0534.2012.00106
黄荣辉, 刘永, 王林, 等. 2012. 2009年秋至2010年春我国西南地区严重干旱的成因分析[J]. 大气科学, 36(3): 443–457. DOI:10.3878/j.issn.1006-9895.2011.11101 Huang Ronghui, Liu Yong, Wang Lin, et al. 2012. Analyses of the causes of severe drought occurring in Southwest China from the fall of 2009 to the spring of 2010[J]. Chinese J Atmos Sci, 36(3): 443–457. DOI:10.3878/j.issn.1006-9895.2011.11101
黄晚华, 隋月, 杨晓光, 等. 2013. 气候变化背景下中国南方地区季节性干旱特征与适应Ⅴ.南方地区季节性干旱特征分区和评述[J]. 应用生态学报, 24(10): 2917–2925. Huang Wanhua, Sui Yue, Yang Xiaoguang, et al. 2013. Characteristics and adaptation of seasonal drought in southern China under the background of climate change. Ⅴ. seasonal drought characteristics division and assessment in southern China[J]. Chinese Journal of Applied Ecology, 24(10): 2917–2925.
黄晚华, 杨晓光, 李茂松, 等. 2010. 基于标准化降水指数的中国南方季节性干旱近58a演变特征[J]. 农业工程报, 26(7): 50–59. Huang Wanhuan, Yang Xiaoguang, Li Maosong, et al. 2010. Evolution characteristics of seasonal drought in the south of China during the past 58 years based on standardized precipitation index[J]. Transactions of the Chinese Society of Agricultural Engineering, 26(7): 50–59.
李红英, 张晓煜, 王静, 等. 2014. 基于CI指数的宁夏干旱致灾因子特征指标分析[J]. 高原气象, 33(4): 995–1001. DOI:10.7522/j.issn.1000-0534.2013.00043 Li Hongying, Zhang Xiaoyu, Wang Jing, et al. 2014. Analysis of drought disasters-causing factors in Ningxia Based on CI Index[J]. Plateau Meteor, 33(4): 995–1001. DOI:10.7522/j.issn.1000-0534.2013.00043
栾晨, 宋敏红, 蔡英, 等. 2012. 西北区西部夏半年强降水分布与变化特征[J]. 高原气象, 31(3): 629–637. Luan Chen, Song Minhong, Cai Ying, et al. 2012. Distribution and change feature of intense precipitation in the west part of Northwestern China during summer half years[J]. Plateau Meteor, 31(3): 629–637.
马柱国, 符淙斌. 2005. 中国干旱和半干旱带的10年际演变特征[J]. 地球物理学报, 48(3): 519–525. Ma Zhuguo, Fu Congbin. 2005. Decadal variations of arid and semi-arid boundary in China[J]. Chinese J Geophys, 48(3): 519–525.
南波. 2012. 基于K-S检验法的雪荷载统计分析[J]. 兰州理工大学学报, 38(1): 115–119. Nan Bo. 2012. Statistical analysis of snow load based on K-S inspection method[J]. Journal of Lanzhou University of Technology, 38(1): 115–119.
钱正安, 宋敏红, 李万源, 等. 2011. 全球、中蒙干旱区及其部分地区降水分布细节[J]. 高原气象, 30(1): 1–12. Qian Zheng'an, Song Minhong, Li Wanyuan, et al. 2011. Global, China-Mongolia Arid-and Semiarid-Areas (CMASA) and the details of precipitation distribution in part regions of CMASA[J]. Plateau Meteor, 30(1): 1–12.
冉津江. 2014. 我国干旱半干旱区温度和降水的时空分布特征[D]. 兰州: 兰州大学, 1-60. Ran Jinjiang. 2014. The spatial and temporal characteristics of temperature and precipitation in arid and semi-arid regions of China[D]. Lanzhou:Lanzhou University, 1-60. http: //cdmd. cnki. com. cn/Article/CDMD-10730-1014302202. htm
石彦军. 2014. 新疆区域性极端干旱事件及其数值模拟和预测研究[D]. 兰州: 兰州大学, 1-97. Shi Yanjun. 2014. Research on regional extreme drought events and their numerical simulation and prediction in Xinjiang area[D]. Lanzhou:Lanzhou University, 1-97. http: //cdmd. cnki. com. cn/article/cdmd-10730-1015519398. htm
时芳欣, 郝振纯, 杨传国, 等. 2014. 黄淮海地区降水概率分布类型分析[J]. 水电能源科学(9): 1–5. Shi Fangxin, Hao Zhenchun, Yang Chuanguo, et al. 2014. Analysis of probability distribution of precipitation in Yellow HuaihaiRegion[J]. Water Resources and Power(9): 1–5.
王斌, 付强, 王敏, 等. 2011. 几种模拟逐日降水的分布函数比较分析[J]. 数学的实践与认识, 41(9): 128–133. Wang Bin, Fu Qiang, Wang Min, et al. 2011. Comparative analysis on three distribution functions simulating daily rainfall[J]. Mathematics in Practice and Theory, 41(9): 128–133.
王澄海, 王芝兰, 郭毅鹏. 2012. GEV干旱指数及其在气象干旱预测和监测中的应用和检验[J]. 地球科学进展, 27(9): 957–968. Wang Chenghai, Wang Zhilan, Guo Yipeng. 2012. Application and verification of drought index in meteorology drought monitor and prediction[J]. Adv Earth Sci, 27(9): 957–968.
王素萍, 王劲松, 张强, 等. 2015. 几种干旱指标对西南和华南区域月尺度干旱监测的适用性评价[J]. 高原气象, 34(6): 1616–1624. DOI:10.7522/j.issn.1000-0534.2014.00089 Wang Suping, Wang Jingsong, Zhang Qiang, et al. 2015. Applicability evaluation of drought indices in monthly scale drought monitoring in southwestern and southern China[J]. Plateau Meteor, 34(6): 1616–1624. DOI:10.7522/j.issn.1000-0534.2014.00089
王芝兰, 王劲松, 李耀辉, 等. 2013. 标准化降水指数与广义极值分布干旱指数在西北地区应用的对比分析[J]. 高原气象, 32(3): 839–847. DOI:10.7522/j.issn.1000-0534.2012.00077 Wang Zhilan, Wang Chenghai, Li Yaohui, et al. 2013. Comparison of application between generalized extreme value index and standardized precipitation index in northwest China[J]. Plateau Meteor, 32(3): 839–847. DOI:10.7522/j.issn.1000-0534.2012.00077
熊光洁, 王式功, 李崇银, 等. 2014. 三种干旱指数对西南地区适用性分析[J]. 高原气象, 33(3): 686–697. DOI:10.7522/j.issn.1000-0534.2013.00007 Xiong Guangjie, Wang Shigong, Li Chongyin, et al. 2014. Analysis of applicability of three drought indices for drought events in southwest China[J]. Plateau Meteor, 33(3): 686–697. DOI:10.7522/j.issn.1000-0534.2013.00007
徐尔灏. 1950. 论年雨量之常态性[J]. 气象学报, 21(1): 17–34. Xu Erhao. 1950. On the normality of annual rainfall[J]. Acta Meteor Sinica, 21(1): 17–34.
杨绚, 李栋梁. 2008. 中国干旱气候分区及其降水量变化特征[J]. 干旱气象, 26(2): 17–24. Yang Xuan, Li Dongliang. 2008. Precipitation variation characteristics and arid climate division in China[J]. Arid Meteor, 26(2): 17–24.
袁文平, 周广胜. 2004. 标准化降水指标与Z指数在我国应用的对比分析[J]. 植物生态学报, 28(4): 523–529. DOI:10.17521/cjpe.2004.0071 Yuan Wenping, Zhou Guangsheng. 2004. Comparison between standardized precipitation index and Z-Index in China[J]. Chinese J Plant Ecology, 28(4): 523–529. DOI:10.17521/cjpe.2004.0071
张磊, 潘婕, 陶生才, 等. 2013. 基于标准化降水指数的近51a山东临沂市旱涝时空特征[J]. 干旱气象, 31(4): 695–701. Zhang Lei, Pan Jie, Tao Shengcai, et al. 2013. Spatial and temporal characteristics of drought/flood in linyi based on Standard Precipitation Index (SPI) in recent 51 years[J]. Arid Meteor, 31(4): 695–701.
张煜星. 1998. 中国荒漠化气候类型的分布[J]. 干旱区研究, 15(2): 46–50. Zhang Yuxing. 1998. Distribution of climatic type of Chinese desertification[J]. Arid Zone Res, 15(2): 46–50.
钟军. 2013. 中国降水的时空和概率分布特征[D]. 南京: 南京信息工程大学, 1-57. Zhong Jun. 2013. Temporal-spatial and probability of distribution of precipitation in China[D]. Nanjing:Nanjing University of Information Science% Technology, 1-57. http: //cdmd. cnki. com. cn/Article/CDMD-10300-1013340520. htm
The Applicability of Several Distribution Functions Which used to Describe the Characteristics of Cumulative Precipitation in China
WU Zijun1,2 , ZHANG Qiang3 , SHI Yanjun4 , JIN Shiqiang5 , ZHANG Hongli1,2     
1. School of AtmosphericSciences, Lanzhou University, Lanzhou 730000, China;
2. Lanzhou Institute of Arid Meteorology of Chinese Meteorological Administration, Lanzhou 730020, China;
3. Lanzhou Institute of Arid Meteorology of Chinese Meteorological Administration, Lanzhou/Key Laboratory of Arid Climatic Changing and Reducing Disaster of Gansu Province/Open Laboratory of Arid Climatic Changing and Disaster of Chinese Meteorological Administration/Gansu Metrological Bureau, Lanzhou 730020, China;
4. School of Information Science and Engineering, Lanzhou University, Lanzhou 730000, China;
5. Department of Statistics, Kansas State University, Kansas State 66502, USA
Abstract: In order to find out the best distribution to describe the characteristics of cumulative precipitation on multiple time scales in China, Gamma distribution, Generalized Extreme Value distribution (GEV distribution), Log-normal distribution, Weibull distribution, Normal distribution and Rayleigh distribution were chosen.On the six time scales of one, three, six, nine, twelve, twenty-four months, a nationwide K-S test was taken on these six distributions with the 1961-2013 monthly precipitation datas of 760 meteorological stations in China.The results show that among the six distributions, the GEV distribution is the most suitable function for describing the cumulative precipitation characteristics on every timescale in China, followed by Gamma distribution, Rayleigh distribution is the least suitable one.After a detailed discuss for every season and different part of China on one month time scale and three month time scale, it turned out that on the one month time scale, GEV distribution is better than Gamma distribution in spring, summer and autumn, while Gamma distribution is better than GEV distribution in winter, however, there are some exceptions in different climatic region of China in every season.On the three month time scale, GEV distribution is better than Gamma distribution in both summer and winter, as well as in all regions of China.
Key Words: Cumulative precipitation    Distribution functions    Multiple time scales