概率论与数理统计学习报告学院学号:姓名:概率论与数理统计学习报告通过短短一学期的学习,虽然学习、研究地并不深入,但该课程的每一处内容都有不同的奇妙吸引着我,让我对它在生活中饰演的角色充满遐想;它将我带入了一个由随机变量为桥梁,通过表面偶然性找出其内在规律性,从而与其它的数学分支建立联系的世界,让我对这种进行大量的随机重复实验,通过分析研究得出统计规律性的过程产生了极大地兴趣。
我很喜欢这门课程,但也不得不说课后在它上面花的时间并不多,因此学得还不深入,但它真的深深地吸引了我,我一定会找时间进一步深入地学习它。
先简单地介绍一下概率论与数理统计这门学科。
概率论是基于给出随机现象的数学模型,并用数学语言来描述它们,然后研究其基本规律,透过表面的偶然性,找出其内在的规律性,建立随机现象与数学其他分支的桥梁,使得人们可以利用已成熟的数学工具和方法来研究随机现象,进而也为其他数学分支和其他新兴学科提供了解决问题的新思路和新方法。
数理统计是以概率论为基础,基于有效的观测、收集、整理、分析带有随机性的数据来研究随机现象,进而对所观察的问题作出推断和预测,直至为采取一定的决策和行动提供依据和建议。
概率论与数理统计是研究随机现象及其规律性的一门数学学科。
研究随机现象的规律性有其独特的思想方法,它不是寻求出现每一现象的一切物理因素,不能用研究确定性现象的方法研究随机现象,而是承认在所研究的问题中存在一些人们不能认识或者根本不知道的随机因素作用下,发生随机现象。
这样,人们既可以通过试验来观察随机现象,揭示其规律性,作出决策,也可根据实际问题的具体情况找出随机现象的规律,作出决策。
至今,概率论与数理统计的理论与方法已经广泛应用于自然科学、社会科学以及人文科学等各个领域中,并随着计算机的普及,概率论与数理统计已成为处理信息、制定决策的重要理论和方法。
它们不仅是许多新兴学科,如信息论、控制论、排队论、可靠性论以及人工智能的数学理论基础,而且与其他领域的新兴学科的相互交叉而产生了许多新的分支和边缘学科,如生物统计、统计物理、数理金融、神经网络统计分析、统计计算等。
概率论应用随机变量与随机变量的概率分布、数字特征及特征函数为数学工具对随机现象进行描述、分析与研究,其前提条件是假设随机变量的概率分布是已知的;而数理统计中作为研究对象的随机变量的概率分布是完全未知的,或者分布类型已知,但其中的某些参数或某些数字特征是未知的。
概率论研究问题的方法是从假设、命题、已知的随机现象的事实出发,按一定的逻辑推理得到结论,在方法上是演绎式的。
而统计学的方法是归纳式的,从所研究地对象的全体中随机抽取一部分进行试验或观测,以获得试验数据,依据试验数据所获取的信息,对整体进行推断,是归纳而得到结论的。
因此掌握它特有的学习方法是很重要的。
在学习的过程中,不论是老师提出的一些希望我们课后讨论的问题还是自己在做作业看书过程中遇到的一些问题都引发了我的一些思考,或许解答得并不全面甚至还可能是不正确的,但确实是自己的一点思考,提出来以后逐步地去解决完善吧。
< 一 >随机事件及其概率问题:(1)事件 A二P(A)=O,那么P(A)=O= ■■对吗?解析:此种说法不对。
概率论里说了不可能事件的发生概率是 0,但0概率事件可能发生•比如在宇宙中抽一个人,抽到你的概率。
这就是一个0概率事件可能发生的例子!随机变量分连续和离散两种,它们各自的分布描述是不同的。
对于离散随机变量,如果它的事件域是有限个事件,则可以认为概率为0的事件一定不会发生,概率为1的事件必然发生。
但若事件是无限的,则还要具体分析。
既然 0概率事件都是有可能发生的,那么概率趋近于零的事件果然有可能发生,只不过我们平时在处理问题的时候,把概率趋近于零的事件算作0概率事件,只是算作,不是绝对的是。
对于连续性随机变量,单个具体点的概率密度值为一有界常数,这个值可以是任意的(包括 0和1),但因为点是没有长度的,所以该点的概率密度积分为 0 (因为该点概率密度值有界),即该点所对应的事件发生的概率为0,但这个事件仍然是可能发生的,因为这个事件在事件域内。
也就是说,概率为0的事件并不一定不会发生。
同理,某个点的概率密度值为 1,但该点的概率密度积分仍为0,所以概率为1的事件也不一定必然发生。
总之,对于连续性随机变量,讨论单个点的概率是没有意义的(都为 0),我们讨论的是,这个随机变量落在一个区间内的概率。
匚(2)事件A、B、C,它们两两独立,是否 A、B、C 一定是相互独立?解析:不一定。
举一个反例:某一个袋中有 4个球,一个白色,一个黑色,一个红色,一个为这三色,现任取一个球观察颜色。
可知:设事件111 / / P(AB)二 P(AC)二 P(BC)P(A)P(B)二 P(A)P(C)二 P(B)P(C)二 A 、B 、C 两两4 2 21111独立,又P(ABC)=-= - - - =P(A)P(B)P(C)= A 、B 、C 不是相互独立。
所以几4 2 2 2 个事件两两独立不一定它们就是相互独立。
(对于此反例, 有一个问题就是11 1 P (AB) =P(AC) =P(BC) ,P(A)P(B) =P(A)P(C) = P(B)P(C),虽然在数 4 2 2值上相等,但会是一个数值上的巧合吗?P(AB) = P(A)P(B) —定成立吗?) (3)独立与互不相容的关系:(独立条件:P(AB)二P(A)P(B),互不相容条件:P(AB) =0) 解析:若 0 ::: P(A) :::1,0 ::: P(B) ::: 1,则 a : A 、B 独立,P(AB) = P(A)P(B) • 0= A 、B 相容。
b: A 、B 不独立,P(AB) = 0= A 、B 互不相容; P(AB) = P(A)P(B ) 0= A 、B 相容(4) A 与B 互相独立,C B , A 、C 是否一定互相独立?解析:A 、C 不一定独立。
举一反例:如图:概率论中引入随机变量,从而使研究对象由随机事件扩大为随机变量,对于随机变量的分布函数,我们能够用微积分为工具进行研究,强有力的数学分析工具大大地增强了我们研究随机现象的手段 -------------------------------研究随机现象手段P(AB) =P(A) P(B)=0, C B <二 > 随机变量及其分布问题:C 不独<三 > 随机变量数字特征与极限定理:我们都知道随机变量的概率分布能够完整地描述随机变量的统计规律,但在许多的实际问题中,求概率分布并不容易,另一方面,有时不需要知道随机变量的概率分布,而只需要知道他的某些数字特征就够了。
数字特征虽然不像概率分布那样完整地描述了随机变量的统计规律,但它能集中地反映随机变量的某些统计特性,而且许多重要分布中的参数都与数字特征有关,因而数字特征在概率论与数理统计中占有重要地位。
我们也学习了几种常见的分布的数字特征,包括期望、方差、协方差、相关系数以及矩等。
(1)不相关与独立之间的关系:解析:不相关的等价命题:1。
—0 2。
cov(x,y)=0 3。
E(XY)二E(X)E(Y) 4。
D(X+Y)=D(X)+D(Y) 独立=E(XY) = E(X)E(Y)(有数字特征)=不相关结论:(1)X与丫独立,则X与丫一定不相关(2)X与丫不相关,则X与丫不一定独立证明:(1)由于X与Y独立,所以f(xy)=f(x)f(y), (f为概率密度函数)于是:E(XY)二// f(xy)dxdy= // [f(x)*f(y)]dxdy二/f(x)dx* / f(y)dy=E(X)E(Y) 所以:E(XY)二E(X)E(Y),即 X, 丫不相关。
(2)反例:X=cost,丫二si nt,其中t是(0,2 n上的均匀分布随机变量。
易得X和丫不相关,因为:E(XY)二E(cost sint)= (1/2 n) * j sint cost dt = 0E(X)= (1/2 n) * j cost dt =,E(Y)二(1/2 n) * j sint dt = 0所以E(XY)二E(X)E(Y)。
但是他们是不独立的。
因为:X和Y各自的概率密度函数在(-1,1)上有值,但是XY的联合概率密度只在单位圆内有值,所以f(XY)不等于f(x)*f(y),两者不独立。
(2)切比雪夫不等式:P〔X -E(X) _丄D孕Z切比雪夫不等式给出了在随机变量 X的分布未知的情况下,利用E(X)和D(X)对X 的概率分布进行估计的方法,有很广泛的应用。
(3)注意一些应用中的独立条件:1。
概率密度f(x,y) = f X(x)f Y ( y) ; 2。
卷积公式.f Z(z)二:f x(x)f Y(z-x)dx ; 3。
N个独立正态分布之和仍然是正态分布—-^0n n n、X i > N(' 叫,'V) ; 4。
E(XY) =E(X)E(Y),D(X Y) =D(X) • D(Y)i 1i =1 i =1<四 > 数理统计与参数估计:数理统计以概率论为理论基础,根据试验或观测到的数据,研究如何利用有效的方法对这些已知的数据进行整理、分析和推断,从而对研究对象的性质和统计规律作出合理科学的估计和判断。
然而在实际问题中,所研究的总体分布类型往往是已知的,但依赖于一个或几个的未知参数,如何从样本估计总体的未知参数就成为数理统计的基本问题之一。
通过学习,简单地了解了一些关于点估计和区间估计的问题,能够解决一些简单的实际问题。
(1)如何推导出的样本方差:S2(X i -X) X i2- nx)n -1 i』n -12推导过程:X~N (导2),X ~N (»)。
(注意独立条件)n-2 - 2)由S 2是D(X)的 n (n-1) n = X^ x 幺…是样本均值,那么为什么样本方差是除以 .而不是n 呢?对于一个随机变量:,分别表示其数学期望和方差,从中随机抽取 n II 个样本 ——•、•,、— •是样本均值,记’'为-的方差和期Z X j X i j 4,j i n -1 x i - X = x i = x i n —1 个样本,V X j 3 2 j f 〜N (-d,n 一如 +3n Tn无偏估计从,中随机抽取n 宀占莎f 是样本方差。
D(X)= Dy Xi)=吉D(HiXj=*(殆D(XJ)_•nE(X2) = D(X) + E2(X)=晋+"2E(S2) = E(岛SXi(X-N)2) =角E(y -計) =古E(UE-2兀龙+巧)E(UX?) = nE(Xf)=n(D(Xi) + E2(Xi))E(ZXi 兀瓦)=E(X Etj A;)=n(2?(X) + E2{\ ))=n俘+ /)E(S2)=尙e + 厨一右(字+厨=cr2概率论与数理统计与生活实际问题有着很密切的联系。