当前位置:文档之家› 第3章抽样与抽样分布详解

第3章抽样与抽样分布详解

※※※※※※※※※※※●正态分布及其应用:◎引言:无论是二项分布还是泊松分布,它们都有一个共同的特点,即当n逐渐增大时,都将趋近于对称分布,进而趋近于正态分布,因此,二项分布和泊松分布的概率表,通常只列出n=20的概率,当n≥30时,两个分布都趋近于正态分布。

◎正态分布(高斯分布),是一种常用的典型的概率分布。

18世纪德国的数学家和天文学家高斯在正态分布理论发展过程中做过突出贡献,因此也被称作“高斯分布”。

※正态分布的重要地位:1、在实际观察到社会、经济、自然现象的数据表现上,其频率分布与正态分布十分接近;2、正态分布的固有性质,给抽样推断理论提供了必要的基础,使它在抽样分布、区间估计、假设检验中被广泛应用。

●正态分布的概率密度函数:式中:x在正负无穷之间;μ、σ2为参数;e=2.7183;π=3.14159;可记为X~N(μ,σ2)。

◎1、正态分布曲线特征:(1)曲线为对称分布,在X=μ处达到极大值;(2)曲线两尾端趋向无穷小,但永不与横轴相交;(3)曲线的形状取决于标准差的大小;(4)曲线的位置取决于平均数的大小;(5)曲线的平均数、中位数、众数相等;(6)曲线下全部面积为1,并在一定标准差倍数范围内,所含的概率比重是相同的。

◎2、数理统计证明:1)、平均数加减一个标准差(μ±σ1)的范围,包含总体全面积的68.26%;◎3、标准正态分布表的使用: ☆怎样将各种形状的正态分布转换为标准正态分布呢?标准正态分布要求:Z的倍数。

Z值可以看成是σ的标准单位。

原始分布:μ=60,σ=20μ=60分布:μ=0 σ=1习题:▲教材P117,16 17◆习题1、假如某一学院的入学考试分数是服从平均数为450,标准差为100的正态分布,求:(1)有多少学生比率的得分在400—500之间?(2)若某一学生得分是630分,则比他更好和更差的学生其比率各为多少?解:(1) Z1=(400-450)/100= -0.5Z2=(500-450)/100= 0.5与Z=0.5对应的概率为0.691462400 450 500 则:P(400≥x<500 = 0.691462-0.5 = 0.191462×2 = 0.382924 (2)Z=(630-450)/100=1.8则:P (x <630== 0.9641P (x ≥630)=1-0.9641= 0.0359◆习题2、教材P101,11150[-Z] 200-Z 200 Z ◆习题3、美国某大型商场牙膏销量,据信是服从每周平均数为10000盒,标准差为1500盒的正态分布。

问:(1)任意一周牙膏销量超过12000盒的概率是多少?(2)为使公司库存充裕,以满足每周需求高达95%的概率,问库存应备多少盒牙膏?解: (1) Z=(12000-10000)/1500=1.33,与1.33对应的概率=0.4082,超过12000盒的10000 12000 概率=1- 0.908241=0.091759(9.176%)。

0.95 (2)与0.95概率对应的Z 值为1.645,(X-10000)/15000=1.645,X=12468(盒)。

◆习题4、某一出口产品(容器),技术资料显示,其填装量为服从标准差为0.6盎司的正态分布。

若填装重量少于18盎司的比率为2%,问其平均填装重量为多少?与比率1-0.02=0.98,对应的Z=-2.05,(18-μ)/0.6=-2.05,μ=19.23(盎司)18◆习题5、已知某加工厂工人日包装量为平均每人25件,从中抽取一人,其日包装量小于10件的概率为7.78%,问工人日包装量的标准差是多少?1-0.0778=0.9222,对应的Z=1.42所以:与0.0778对应的Z=-1.42则;(10-25)/σ=-1.42σ=10.56(件)第四章抽样与抽样分布抽样调查的必要性告诉人们,在许多情况下不必要或不可能进行全面调查,这时,要了解总体的情况,只能由样本统计量估计总体参数。

※常用的抽样方法※1、简单随机抽样重复抽样等概率(纯随机抽样)不重复抽样等可能2、分层抽样先分组,后抽样。

(分类抽样) 4个优点P106(3)3、系统抽样:有序排列确定起点间隔抽取(机械抽样、等距抽样)随机性4、整群抽样:简便。

前提是总体分布均匀。

〖〖〖〖〖〖〖〖〖〖〖〖〖〖〖〖〖〖〖〖〖〖〖〖〖*〗〗〗〗〗〗〗〗〗〗〗〗〗〗〗〗〗〗〗〗〗〗〗〗〗◎抽样分布与中心极限定理●1、抽样分布:全部可能样本统计量的概率分布叫做抽样分布。

(总体分布、样本分布):以下是一个极端的例子:假定一个实验小组有四人N=4,其写作成绩分别为:21、20、19、18(分)(25为满分)。

若样本容量n=2,则全部可能样本(不重复抽样)是6个,6个样本及它们的平均数、准差如下表:样本容量n=2,则全部可能样本(重复抽样)是16个:x频数频率(%)18.0 1 0.0618.5 2 0.1319.0 3 0.1919.5 4 0.2520.0 3 0.1920.5 2 0.1321.0 1 0.06合计16 1.00?? 对比平均数抽样分布图:接近正态分布。

18 18.5 19 19.5 20 20.5 21●2、中心极限定理:数理统计证明:(1)当总体很大时,无论它呈现何种分布,只要样本容量n 足够大,那么样本平均数的抽样分布,必定趋近于正态分布;(2)从正态总体中抽取的全部可能样本,无论样本容量有多大,样本平均数的抽样分布必定遵从于正态分布;即使是非正态总体,只要n ≥30,其抽样分布必定趋近于正态分布;见书P102图3.25(3)抽样分布的平均数等于总体平均数:=μ ;(4)且随着样本容量的增加,x σ; 见书P109图3.28见书P102图3.25 ★x σ也称为“抽样平均误差”。

在区间估计中,样本容量n 越大,样本平均数围绕总体平均数摆动的幅度越小,样本平均数的分布曲线变得又窄又高,它意味着样本平均数落在总体平均数附近的概率也相应增大。

◆极限定理在区间估计中的作用:可以确定从总体中抽取一个随机样本,其平均数出现在一个指定值域内的概率。

●3、平均数的抽样分布及应用:(见PPT)▲例题:假定某大型公司全部推销员个人营业额(月)的总体分布如下图1,现从中抽取一个包括30人的随机样本,其样本平均数大于15750元的概率是多少?图1:总体分布:σ=2000 图2:抽样分布X解:由于n≥30,是容量为30的所有可能样本之一,15750是所有样本平均数随机变量之一,见图2。

根据中心极限定理作适当变换,下列关系式成立:所以:Z=2.05,查表,对应概率为0.4798,故大于15750元的概率为0.5-0.4798=0.02。

▲教材P118,18(1)20;2;(2)正态;(3)-2.25;(4)1.5▲教材P118,18(1)1-0.97725=0.02275;(2)1-0.933193=0.0668;(3)1-0.99379=0.00621;(4)(0.97725 -0.5)+(0.841345-0.5)=0.818595;(5)1-0.99865=0.00135。

▲教材P118,19(1)0.8944;(2)0.0228;(3)0.1292;(4)0.9699。

※教材P118,20(2)1;(3)不一定。

▲教材P118,22趋于正态分布※教材P118,23(1)n=49≥30,正态分布;(美元)(2)0.5;大于217的概率是1-0.969258=0.030742;在P(209—217)=(0.969258-0.5)×2 = 0.938516※教材P119,(1406 1.68333;正态分布。

(2)1-0.998999=0.001001(3)是。

因为Z=-3.09,超出了±3Z,出现了小概率。

▲教材P18(1)增加;(2)减少。

※教材P119(1)n=50≥30,正态。

(2)P (X ≤830)≈0;(因为Z=-4.7);(3)生产过程不正常;(4)仍是正态; P (X ≤830)=0.0582),(Z=1.57)。

※教材P119,0027.02)99865.01()33(:)2(015.04%13:)1(=⨯-=≥≥-==x x x x p σσσ(3)由(1)可知【【【【【【【【【【【【【【【【【【【【【【◎】】】】】】】】】】】】】】】】】】】】】】 ●4、有限总体(或不重复抽样)修正系数:◎问题的提出:用样本估计总体时比较下列误差谁大?无限总体有限总体重复抽样 不重复抽样1。

※当抽样比例n/N ≤0.05时,可以省略修正系数;当抽样比例n/N >0.05时,一般需要使用修正系数,原平 ▲案例:从阿根廷、加拿大、美国到货三批玉米,分别为600包、6000包、60000包。

合同规定三批玉米平均每包重量都是80公斤,标准差都是4公斤。

要求:(1)若从每批玉米中都抽取300包为样本,分别计算它们的平均误差。

有何启示?(要求都使用修正系数)◎三批玉米的抽样比例n/N分别为:阿300/600=0.5;加300/6000=0.05;美300/60000=0.005〖〖〖〖〖〖〖〖〖〖〖〖〖〖〖〖〖〖〖〖〖〖〖※〗〗〗〗〗〗〗〗〗〗〗〗〗〗〗〗〗〗〗〗〗〗〗▲习题1:某地有200家外贸企业,年平均出口额为90万美元,标准差为27万美元,随机抽取36家企业调查,问其年平均出口额在100万美元以上的概率为多少?▲习题2:某食品公司收购一批鲜蛋共1500箱,平均每箱为25.75斤,标准差5.25公斤。

问由100箱组成的一个随机样本所计算的平均重量在25—27公斤之间的概率有多大?超过26公斤的概率有多大?●5、比例的抽样分布:当总体中各元素只能以“成功”和“失败”表示时,用P 表示“成功”的比例,(1-P )表示“失败”的比例。

中心极限定理证明:P 不接近0或1,且n很大时,其抽样分布趋近于正态分布。

比例抽样分布的平均误差为:无限总体(或重复抽样)有限总体(或不重复抽样 ▲ 例题:据资料记录,二年级的学生中有43%人,阅读某类文章后表示有困难,现随机抽取100人阅读同类文章,问:感到有困难的学生占五成以下的概率是多少?▲习题1、一家工厂在正常情况下产品次品率为8%,若产品批量比较大,随机抽取100个产品进行检验,求次品率在7%—9%之间的概率。

●6、t分布:(小样本理论)◎t分布也称“学生分布”。

1908—1909年,英国统计学家戈塞特(Gosset),以笔名(Student)陆续在《生物计量学》杂志上发表了三篇文章:“平均数的概差”、“相关系数的概差”、“论非随机样本平均数的分布”,从而奠定了“小样本理论”的基础,并使他获得了崇高的荣誉。

相关主题