当前位置:文档之家› 回归

回归

第5章水文统计方法10.学习水文统计方法要注意什么?水文统计方法部分内容这部分内容十分重要。

因为水文统计的一些基本概念、基本方法,比如随机事件、随机变量、概率、统计规律、频率曲线、适线法、相关分析等,不但在水资源管理这门课程中要经常用到,而且是水利工程专业人员应当掌握的最基本的知识。

水文统计方法这部分内容又比较抽象,而且在认识具有随机性的事物时,要求在思维方法上有所转变,更增加了学习的难度。

这就使得水文统计方法成为既是重点又是难点的内容。

在学习水文统计方法时,一方面要充分重视,注意多下一些功夫,另一方面仍要着重理解和掌握基本概念、基本理论、基本方法,并注意掌握一些最实用的内容。

11.什么是随机事件和概率(1)随机事件在客观世界中,不断地出现和发生一些事物和现象。

这些事物和现象可以统称为事件。

时间的发生有一定的条件。

经分析,就因果关系来看,有一类事件是在一定的条件下必然发生的(如水到0度会结冰,一年会有四个季节)。

这种在一定的条件下必然发生的事件称为必然事件。

另有一类事件在一定的条件下是必然不发生的(如石头不能孵化成小鸡,太阳不会从西边出来)。

这种在一定的条件下必然不发生的事件称为不可能事件。

必然事件或不可能事件虽然不同,但又具有共性,即在因果关系上都具有确定性。

除了必然事件和不可能事件以外,在客观世界中还有另外一类事件,这类事件发生的条件和事件的发生与否之间没有确定的因果关系。

这种发生的条件和发生与否之间没有确定的因果关系的事件称为随机事件。

在长期的实践中人们发现,虽然对随机事件作一两次或少数几次观察,随机事件的发生与否没有什么规律,但如果进行大量的观察或试验,又可以发现随机事件具有一定的规律性。

比如一枚硬币,投掷一次或几次的时候看不出什么规律,但是在同样的条件下反复多次进行试验,把硬币投掷成千上万次,就会发现硬币落地时正面朝上和反面朝上的次数大致是相等的。

再比如,一条河流的某一个断面的年径流量在各个年份是不相同的,但进行长期观测,如观测30年、50年、80年,就会发现年径流量的多年平均值是一个稳定数值。

随机事件所具有的这种规律称为统计规律。

具有统计规律的随机事件的范围是很广泛的。

随机事件可以是具有属性性质的,比如投掷硬币落地的时候哪一面朝上,出生的婴儿是男孩还是女孩,天气是晴、是阴,有没有雨、雪,商业上股票买卖的盈亏,城市里交通事故的发生等等。

随机事件也可以是具有数量性质的,比如射手打靶的环数,建筑结构试件破坏的强度,某条河流发生洪水的洪峰流量等等。

(2)概率在数学中有两个分支,即概率论和数理统计。

研究随机事件统计规律的学科称为概率论。

由随机现象的一部分实测资料研究和推求随机事件全体的规律的学科称为数理统计。

概率是表示统计规律的方式。

用概率可以表示和度量在一定条件下随机事件出现或发生的可能性。

针对不同的情况,概率有不同的定义。

按照数理统计的观点,事物和现象都可以看为是试验的结果。

如果试验只有有限个不同的试验结果,并且它们发生的机会都是相同的,又是相互排斥的,则事件概率的计算公式为n mA P )(式中 P (A )——随机事件A 的概率;n ——进行试验可能发生结果的总数;m ——进行试验中可能发生事件A 的结果数。

例如,掷骰子(俗称“掷色子”)的情况就符合以上公式的条件。

因掷骰子可能发生的结果是有限的(1到6点),试验可能发生结果的总数是6;同时骰子是一个均匀的6面体,掷骰子掷成1点到6点的可能性都是相同的,又是相互排斥的(一次掷一个骰子不可能同时出现两个点)。

如果定义Z 为随即事件“掷骰子的点数大于2”,则符合Z 的结果为3、4、5、6点4种情况,即事件Z 可能发生的结果数是4。

按照上述公式,Z 的概率 667.064)(==Z P像这种比较简单的,等可能性、相互排斥的情况,是概率论初期的主要研究对象。

故按上面公式确定的事件概率称为古典概率。

在客观世界里中,随机事件并不都是等可能性的。

如射手打靶打中的环数是随机事件,但打中0环到10环各环的可能性并不相同,优秀的射手打中9环、10环的可能性大,而新手打中1环、2环的可能性就较大。

一条河流出现大洪水的可能性和一般洪水的可能性显然也是不同的。

为了表示不是等可能性情况的统计规律,概率论中队概率给出了更一般的定义 。

在同样条件下进行试验,将事件A 出现的次数μ 称为频数,将频数μ与试验次数n 的比值称为频率,记为P (A ),则n A P μ=)(大量的实践证明,当着试验的次数充分大的时候,随机事件的频率会趋于稳定。

概率的统计定义如下:在一组不变的条件下,重复作n 次试验,记μ是事件A 发生的次数,当试验次数很大时,如果频率μ/n 稳定地在某一数值p的附近摆动,而且一般说来随着试验次数的增多,这种摆动的幅度愈变愈小,则称A为随机事件,并称数值p为随机事件A的概率,记作P(A)= p(以上可简单地说成,频率具有稳定性的事件叫做随机事件,频率的稳定值叫作随机事件的概率)。

概率的统计定义它既适用于事件出现机会相等的情况,又适用于事件出现机会不相等的一般情况。

前述的必然事件和不可能事件发生的可能性也可以用概率表示。

必然事件的概率等于1.0(表示事件必然发生);不可能事件的概率等于0(表示事件发生的可能性是0,必然不发生);一般随机事件的概率介于0和1.0之间。

对于概率的统计定义还需注意,进行统计试验的条件必须是不变的。

如果条件发生了变化,即使试验的次数再多,也不能求得随机事件真正的概率。

如要确定某一个射手打靶射中不同环数的概率,必须让射手在同样的条件下进行射击,如射击的射程、靶型、武器、风力等都不应改变。

类似地,进行水文统计时,水文现象的各种有关因素也应当是不变的。

如果流域的自然地理条件已经发生了比较大的变化,还把不同条件下的水文资料放在一起进行统计就不合理了。

下面将要介绍,发生这种情况的时候,应当把实测水文资料进行必要的还原和修正以后,再进行统计计算。

12.什么是随机变量,怎样表示随机变量的概率分布?要进行水资源管理工作及对水资源进行配置、节约和保护,必须了解和掌握水资源的规律,必须预测未来水资源的情势。

但因影响水资源的因素十分众多和复杂,目前还难于通过成因分析,对水资源进行准确的长期预报。

实际工作中采用的基本方法是对于水文实测资料进行分析、计算,研究和掌握水文现象的统计规律,然后按照统计规律对未来的水资源情势进行估计。

而这样做,需要对随机事件定量化地表示,为此引入随机变量。

按照概率论理论,随机变量是对应于试验结果,表示试验结果的数量。

如在工地上检验一批钢筋,可以随机抽取几组试件进行检验,每一组试件检验不合格的根数就是随机变量。

又如某条河流,其历年的最大洪峰流量、最高水位、洪水持续时间等都可看为随机变量。

随机变量的数学定义为:在一组不变的条件下,试验的每一个可能结果都唯一对应到一个实数值,则称实数变量为随机变量(“唯一对应”又称“一一对应”,是指每一个试验结果,就只对应一个数据,而每一个数据,又只对应一个试验结果)。

随机变量常用大写字母来表示,如随机变量X(注意这里大写的X是变量,X的取值可以是x1、x2、……x n,即X表示随机取值的系列x1、x2、……x n)。

随机变量可以分为两类:(1)离散型随机变量如果随机变量是可数的,即随机变量的取值是和自然数一一对应的,就称为离散型随机变量。

离散型随机变量不能在两个相邻随机变量取值之间取值。

离散型随机变量可以是有限的,也可以是无限的,但必须是可数的。

(2)连续型随机变量如果随机变量的取值是不可数的,也就是在有限区间里面,随机变量可以取任何值,就称为连续型随机变量。

比如,某一个长途汽车站,每隔30分钟有一班车发往某地。

对于一位不知道长途汽车时刻表的旅客,来车站等车到出发的时间是一个随机变量,这个随机变量取值可以是从0到30分钟区间的任意值,所以是一个连续型随机变量。

连续型随机变量是普遍存在的。

水文变量,如降雨量、降雨时间、蒸发量、河流的流量、水量、水位等等,都是连续型随机变量。

对于随机变量,仅仅知道它的可能取值是不够的,更为重要的是了解各种取值出现的可能性有多大,也就是明确随机变量各种取值的概率,掌握它的统计规律。

随机变量取值与其概率的对应关系称为随机变量的概率分布。

对于离散型随机变量,可以用列举的方式表示它的概率分布。

列举的方法可以是列表,画图等。

我们的文字教材中举了例子。

对于连续型随机变量,因为它是不可数的,不能一一列举,所以也就也不能用列举的方法表示概率分布。

比如前面提到的乘客在长途汽车站等车的例子,等车时间可以是0到30分钟区间里的任何时间,故无法列举所有的随机变量及其相应概率。

实际上,等车时间在0到30分钟的任何时间的可能性是相等的,对于这个区间的任意时间,其概率等于无穷大分之一,即近似等于0。

从这个例子可以看出,列举连续型随机变量各个值的概率不仅做不到,而且实际上是没有意义的。

为此,我们转而研究和分析连续性随机变量在某一个区间取值的概率。

在工程水文里面,就是研究某一水文变量大于或等于某一数值的概率。

对于一个随机变量,大于或等于不同数值的概率是不同的。

当随机变量取为不同数值时,随机变量大于等于此值的概率也随之而变,即概率是随机变量取值的函数。

这一函数称之为随机变量的概率分布函数。

分布函数的公式为F(x)= P(X≥x)式中X ——随机变量;x——随机变量X的取值;P(X≥x)——随机变量X取值大于或等于x的概率;F(x)——随机变量X的分布函数。

随机变量的分布函数可用曲线的形式表示。

在工程水文里面,又习惯于将水文变量取值大于或等于某一数值的概率称为该变量的频率,同时将表示水文变量分布函数的曲线称为频率曲线。

分布函数、水文变量的频率,以及频率曲线这些概念均十分重要,需注意理解和掌握。

对于连续性随机变量,还有另一种表示概率分布的形式——概率密度函数。

按照概率论的定义,概率密度函数是分布函数的导数。

概率密度函数在某一个区间的积分值,表示随机变量在这个区间取值的概率。

在工程水文中,频率是水文变量取值大于或等于某一数值的概率,因此,水文变量的频率就是概率密度函数从变量取值到正无穷大区间的积分值。

用公式表示,水文变量频率和概率密度函数之间的关系可以写为(字幕)⎰∞=≥=xdxxpxXPxF)()()(此式中, F(x)是随机变量X的分布函数值,也就是水文变量X取值为x时候的的频率,而p(x)是概率密度函数。

如前述,水文变量的分布函数可以用频率曲线表示。

类似地,概率密度函数也可以用概率密度函数曲线表示。

因分布函数和概率密度函数之间存在着对应关系,频率曲线和概率密度函数曲线之间也存在着对应关系,这种对应关系可以用文字教材的图5.3表示。

图5.3中,左边是概率密度函数曲线,右边是频率曲线。

相关主题