本科毕业论文( 2013届)题目: 大数定律及其应用学院: 数学与信息科学学院专业: 统计学班级: 09统计姓名:学号:指导老师:完成日期: 2013年4月1日目录§1、引言 (1)§2、大数定律的发展历程 (3)§3、常见的大数定律及中心极限定理 (4)§3.1常见的大数定律 (4)§3.2常见的中心极限定理 (5)§4、大数定律的应用 (6)§4.1大数定律在数学分析中的应用 (6)§4.1.1 在积分方面的应用 (6)§4.1.2 在极限中的应用 (7)§4.2大数定律在生产生活中的应用 (9)§4.2.1 误差方面的应用 (9)§4.2.2 估计数学期望和方差 (7)§4.3大数定律在经济中的应用 (8)§4.3.1 大数定律在保险业中的应用 (8)§4.3.2 大数定律在银行经营管理中的应用 (9)§5、结束语 (10)§6、致谢 (10)参考文献 (11). .大数定律及其应用(温州大学数学与信息科学学院 09统计)摘要:大数定律顾名思义就是指当样本数据量很大的时候,然后某一变量就会呈现出某种规律性,这一呈现出规律性的变量就是我们经常说的平均值,即当样本数据量很大的时候,平均结果将稳定于某一稳定值。
大数定律在概率论中的重要性不言而喻,而且其在数学领域以及经济生活领域也有着非常重要的作用。
本文列举了我们在大学阶段经常遇到的一些大数定律和中心极限定理,通过一些具体的例题,介绍了常见的大数定律和中心极限定理在一些重要领域的应用,具体包括在数学分析中求极限和积分,预测误差,近似计算,以及在保险业和银行经营管理方面的应用,进一步阐明了大数定律与中心极限定理在各分支学科中的重要作用和应用价值。
关键词:大数定律;中心极限定理;经济生活;应用§1、引言大数定律对于很多人来说都很陌生,即使学过概率论的也说不出个所以然。
记得刚学大数定律的时候,觉得这个定理好难理解,书本反复翻了几次还是不懂。
感觉这定理没什么作用,理论性这么强,没什么应用价值。
直到后来学了中心极限定理,介绍了其大量应用,例如在保险业中的应用,可以说保险业离不开中心极限定理。
这才知道自己错了,原来大数定律也有着非常重要的作用,因为中心极限定理正是基于大数定律的基础上而发展出来的定理,没有大数定律作为基础是不会有中心极限定理的。
大数定律与中心极限定理是概率论中具有标志性的两类定理,其作用恰如一颗纽带,很好地承接了概率论与数理统计。
大数定律所要阐明的是大量随机现象平均结果的稳定性,即当样本量很大的情况下,样本的平均值可以近似看作总体平均值。
因为在实际生活中,当我们要考查某一变量,总体数据统计起来往往难度过大甚至不可能,这时我们就需要用到大数定律。
我们先统计总体的一个样本量,这个样本量要足够大,一般根据总体而定,然后考查这个样本数据的特征,最后样本数据的结果可以近似看作是总体的结果。
例如:我们要考查某一地区居民的月平均消费水平,如果要去统计这一地区所有居民月消费额工作量就会太大,有了大数定律,我们只要抽取足够数量的居民,统计他们的月消费额,最后这一样本量的平均值就可以近似看作这一地区居民平均消费额。
这种思想恰恰是概率论中最为重要的思想,而这种思想在数学领域也有着相当重要的作用。
对于中心极限定理我们要更为熟悉,它比大数定律论述更为详细具体。
中心极限定理主要论述的是其他分布和正态分布之间的某种内在关系,一般对于某一总体,不管其服从什么分布,泊松分布也好,二项分布也好,只要考查的样本数据量足够大,那么样本的均值就近似服从正态分布。
§2、大数定律的发展历程对于大数定律,不少人可能有所耳闻,但是对于大数定律的发展历史,可能就很少有人清楚了。
我们都知道,大数定律研究的是随机现象统计规律性的一类定理,当我们大量重复某一相同的实验的时候,其最后的实验结果可能会稳定在某一数值附近。
就像抛硬币一样,当我们不断地抛,抛个上千次,甚至上万次,我们会发现,正面或者反面向上的次数都会接近一半。
除了抛硬币,现实中还有许许多多这样的例子,像掷骰子,最著名的实验就是泊松抛针实验。
这些实验都像我们传达了一个共同的信息,那就是大量重复实验最终的结果都会比较稳定。
那稳定性到底是什么?怎样去用数学语言把它表达出来?这其中会不会有某种规律性?是必然的还是偶然的?这一系列问题其实就是大数定律要研究的问题。
很早的时候,人们其实就发现了这一规律性现象,也有不少的数学家对这一现象进行了研究,这其中就包括伯努利(后来人们为了纪念他,都认为他是第一个研究这一问题的人,其实在他之前也早有数学家研究过)。
伯努利在1713年提出了一个极限定理,当时这个定理还没有名称,后来人们称这个定理为伯努利大数定律。
因此概率论历史上第一个有关大数定律的极限定理是属于伯努利的,它是概率论和数理统计学的基本定律,属于弱大数定律的范畴。
我们知道,当大量重复某一实验时,最后的频率无限接近事件概率。
而伯努利成功地通过数学语言将现实生活中这种现象表达出来,赋予其确切的数学含义。
他让人们对于这一类问题有了新的认识,有了更深刻的理解,为后来的人们研究大数定律问题指明了方向,起到了引领作用,其为大数定律的发展奠定了基础。
除了伯努利之外,还有许许多多的数学家为大数定律的发展做出了重要的贡献,有的甚至花了毕生的心血,像德莫佛—拉普拉斯,李雅普诺夫,林德伯格,费勒,切比雪夫,辛钦等等。
这些人对于大数定律乃至概率论的进步所起的作用都是不可估量的。
1733年,德莫佛—拉普拉斯经过推理证明,得出了二项分布的极限分布是正态分布的结论,后来他又在原来的基础上做了改进,证明了不止二项分布满足这个条件,其他任何分布都是可以的,为中心极限定理的发展做出了伟大的贡献。
在这之后大数定律的发展出现了停滞。
直到20世纪,李雅普诺夫又在拉普拉斯定理的基础上做了自己的创新,他得出了特征函数法,将大数定律的研究延伸到函数层面,这对中心极限定理的发展有着重要的意义。
到1920年,数学家们开始探讨中心极限定理在什么条件下普遍成立,这才有了后来发表的林德伯格条件和费勒条件,这些成果对中心极限定理的发展都功不可没。
经过几百年的发展,大数定律体系已经很完善了,也出现了更多更广泛的大数定律,例如切比雪夫大数定律,辛钦大数定律,泊松大数定律,马尔科夫大数定律等等。
正是这些数学家们的不断研究,大数定律才得以如此迅速发展,才得以完善。
§3、常见的大数定律及中心极限定理§3.1常见的大数定律大数定律形式有很多种,我们仅介绍几种最常用的大数定律。
定理1(伯努利大数定律)在n 重伯努利实验中,假设某一事件总共出现的次数为n μ,并且每次试验中该事件发生的概率是p ,其中0<p<1,那么对于0ε∀>,都有说明:这个定理以严谨的数学公式说明了我们刚才谈到的现实中经常出现的现象,即当大量重复某一实验时,最后实验的频率无限接近实验的概率。
所以,在现实生活和工作中,当试验次数相当大时,就可以灵活地运用这个定理。
定理2(切比雪夫大数定律) 假设12,,n ξξξ⋅⋅⋅⋅⋅⋅是一列随机变量,并且两两互不相关,它们的方差有界,即存在常数0C >,使得,1,2,3i D C i ξ≤=⋅⋅⋅,那么对于任意的0ε>,都有在上述的定理中,因为用到切比雪夫不等式,而切比雪夫不等式对方差有这方面要求,其实方差这个条件并不是必要的。
例如独立同分布时的辛钦大数定律。
定理3(辛钦大数定律) 假设12,,n ξξξ⋅⋅⋅⋅⋅⋅是独立同分布的随机变量序列,并且数学期望()1,2i E a i ξ==⋅⋅⋅,且a 是有限的,则对于任意的0ε>,有 上式也可表示为11lim n p i n i a n ξ→∞==∑或()11n p i i a n n ξ=−−→→∞∑,并且称11n i i n ξ=∑依概率收敛于。
定理4(泊松大数定律)假设12,,n ξξξ⋅⋅⋅⋅⋅⋅是一组随机变量序列,且两两相互独立,并且有 ()1n n P p ξ==,()0n n P q ξ==,其中p , q 满足条件:1n n p q +=,那么我们称12,,n ξξξ⋅⋅⋅⋅⋅⋅服从泊松大数定律。
其实从某种程度上来讲,泊松大数定律可以认为是伯努利大数定律的延伸与普及,我们知道伯努利大数定律以严谨的数学公式说明了现实中经常出现的现象,即当大量重复某一实验时,最后实验的频率无限接近实验的概率。
但泊松大数定律说明的是,独立进行的随机试验的频率依旧具有其平稳性,即使实验条件发生变化。
这就是泊松大数定律比伯努利大数定律更为宽泛的地方。
定理5(马尔科夫大数定律)对于随机变量序列12,,n ξξξ⋅⋅⋅⋅⋅⋅,若有则有1111lim 1n ni i n i i P E n n ξξε→∞==⎛⎫-<= ⎪⎝⎭∑∑. §3.2常见的中心极限定理定理 6(列维——林德伯格中心极限定理)假设随机变量12,,ξξ是一系列独立同分布的随机变量,其数学期望k E aξ=和方差22(0),1,2,k D k ξσσ=>=,则对任意实数x ,都有 我们又称定理6为独立同分布的中心极限定理,从这个定理可以看出正态分布在概率论中的特殊地位,不管k ξ呈何种分布,但只要n →∞,则有随机变量或者我们可以说,当n →∞时,对于一系列随机变量k ξ,只要满足独立同分布,则1nk k ξ=∑ 近似地服从正态分布2(,)N n n μσ。
定理 7 (拉普拉斯中心极限定理)假设随机变量X n服从二项分布(,)B n p ,那么对于任意的有界区间[,]a b ,恒有表达式成立,这就说明正态分布是二项分布的极限分布。
一般地,如果(,)X B n p ,则这个公式给出了当n 较大时,关于二项分布的概率计算方法。
定理 8 (林德伯格定理) 假设12,,ξξ是一系列随机变量序列,且相互独立,而且还符合林德伯格的前提假设,则对任何存在的x ,都有这个定理证明了以下结论:大量微小而且独立的随机因素引起并积累而成的变量,必将是一个正态随机变量。
由林德伯格条件可看到定理并不要求各个加项“同分布”,因而它比前面的列维——林德伯格中心极限定理更全面,事实上列维——林德伯格中心极限定理可以由该定理推出。
说明:中心极限定理讨论的问题是独立随机变量和的分布的极限问题,通常在一定条件下,这些分布弱收敛于退化分布,我们称这就是大数定律。
而中心极限定理要证明的问题是,随机变量和的分布与正态分布之间的关系,在其服从正态分布的基础上再来探讨需满足的条件。