统计学复习笔记第七章参数估计一、思考题1. 解释估计量和估计值在参数估计中,用来估计总体参数的统计量称为估计量。
估计量也是随机变量。
如样本均值,样本比例、样本方差等。
根据一个具体的样本计算出来的估计量的数值称为估计值。
2. 简述评价估计量好坏的标准(1)无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。
(2)有效性:是指估计量的方差尽可能小。
对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。
(3)—致性:是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。
3. 怎样理解置信区间在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。
置信区间的论述是由区间和置信度两部分组成。
有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数,这是不负责的表现。
因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。
在公布调查结果时给出被调查人数是负责任的表现。
这样则可以由此推算出置信度(由后面给出的公式),反之亦然。
4. 解释95%的置信区间的含义是什么置信区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。
也就是说,无穷次重复抽样所得到的所有区间中有95% (的区间)包含参数。
不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区间以0.95的概率覆盖总体参数。
5. 简述样本量与置信水平、总体方差、估计误差的关系。
1. 估计总体均值时样本量n为其中:E22. 样本量n与置信水平1- a、总体方差•:、估计误差E之间的关系为与置信水平成正比,在其他条件不变的情况下,置信水平越大,所需要的样本量越大;与总体方差成正比,总体的差异越大,所要求的样本量也越大;与与总体方差成正比,样本量与估计误差的平方成反比,即可以接受的估计误差的平方越大,所需的样本量越小。
二、练习题1. 从一个标准差为5的总体中采用重复抽样方法抽出一个样本量为40的样本,样本均值为25。
1)样本均值的抽样标准差二x等于多少?2)在95%的置信水平下,估计误差是多少?解:1)已知尸5,n 二40,x = 25J = 5 /V40 〜0.79估计误差 E = 1.96 X 5-V40 〜1.552. 某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本。
1)假定总体标准差为15元,求样本均值的抽样标准误差2)在95%的置信水平下,求估计误差3)如果样本均值为120元,求总体均值□的95%的置信区间解:1)已知(r= 15,n 二49)X ? C JS = 15 + 49 = 2.14a估计误差 E = 1.96 X 15-V49 〜4.23) 已知x = 120v 置信区间为X士E其置信区间二120 士4.23. 从一个总体中随机抽取n =100的随机样本,得到X=104560, 假定总体标准差(r= 85414,试构建总体均值□的95%的置信区间。
解:已知n =100, X=104560,卢85414,1-:= 95%,二 - -':,由于是正态总体,且总体标准差已知。
总体均值J在1-置信水平下的置信区间为10x 土电2石"0%46609士恢X 85414“ 100=105.36 — 3.92= 二湖翔葩刼6741.1444. 从总体中抽取一个n =100的简单随机样本,得到X=81, s=12。
要求:1) 构建□的90%的置信区间。
2) 构建□的95%的置信区间。
3) 构建□的99%的置信区间。
解:由于是正态总体,但总体标准差未知。
总体均值’在1「置信水平下的置信区间公式为牙+亍"石 81 士% X 12-V 100 = 81 士勾 X 1.21) 1“ = 90% % - 1.65其置信区间为81 士 1.982) 1- : = 95% , J 一其置信区间为81 士 2.3523) 1- « = 99% % -2.58其置信区间为81 士 3.0965. 利用下面的信息,构建总体均值的置信区间。
1) X = 25,卢 3.5, n =60,置信水平为 95%2) X =119, s =23.89, n =75,置信水平为 98%3) X =3.149, s =0.974, n =32,置信水平为 90% 解:T X -Z-.②——或X - ••• 1) 1-:= 95% , 其置信区间为:25 ± 1.96 X 3.5-V 60=25 士 0.8852 ) 1- : = 98%,贝卩:=0.02, : /2=0.01,1- : /2=0.99,查标 准正态分布表,可知:亠二—2.33其置信区间为:119 士 2.33 X 23.89-V 75=119 士 6.345知25訂96Z : 2-未知)3) 1- a = 90% 7讹匸 1.65其置信区间为:3.149 士 1.65 X 0.974 + 32士 0.2846. 利用下面的信息,构建总体均值 卩的置信区间:1) 总体服从正态分布,且已知 (r= 500 , n = 15 , x =8900,置信 水平为95%。
解: N=15,为小样本正态分布,但 (T 已知。
贝卩1-〉= 95%信水平为95%解:为大样本总体非正态分布,但。
已知。
则1-〉= 95%,信水平为90%。
解:为大样本总体非正态分布,且 c 未知,1-Q = 90%,锻"1.65。
其置信区间为:匚 8900士 1.65 X 500-V 35= (8761 9039) 4) 总体不服从正态分布, c 未知,n = 35 , x =8900, s =500,置 信水平为99%。
•••置信区间为: 8900士 1.96 X 500-V 15= (8646.73,6 9祜3.2 )= (101.44,109.28) 叡―U -乂。
其置信区间公式为 =d x "r =105.36_1.96 10252) 总体不服从正态分布,且已知 卢500 , n = 35 , x =8900,置二置信区间为: 8900士 1.96 X 500-V 35= (87339二处6.1 ) = 1101.44,109.28 乱―巳。
其置信区间公式为 10253) 总体不服从正态分布, c 未知,n = 35 , x =8900, s =500,置=3.149 = 105.36-1.96解:为大样本总体非正态分布,且。
未知,1" = 99% % " 2.58。
x + z * -其置信区间为:“」一8900士 2.58 X 500-V35=(8681.99118.1 )7. 某大学为了解学生每天上网的时间,在全校7500名学生中采取重复抽样方法随机抽取36人,调查他们每天上网的时间,得到下面的数据(单位:小时)(略)。
求该校大学生平均上网时间的置信区间,置信水平分别为90%及=—解:先求样本均值:广=3.32_ 11 JzJ ___再求样本标准差:1牙土如手二置信区间公式:匚8. 从一个正态总体中随机抽取样本量为8的样本,各样本值分别为:10, 8, 12, 15, 6, 13, 5, 11。
求总体均值□的95%置信区间解:本题为一个小样本正态分布,。
未知。
疋=—先求样本均值:广=80宁8=10土忆一乔g 二]i-l __________再求样本标准差: 1 " ' = V84/7 = 3.4641于是,丄:的置信水平为1二的置信区间是已知1 .二,n = 8,贝卩二.丄,a /2=0.025,查自由度为If -n-1 = 7的一分布表得临界值 ■- 2.45所以,置信区间为:10士 2.45 X 3.4641 "79. 某居民小区为研究职工上班从家里到单位的距离, 抽取了由16 个人组成的一个随机样本,他们到单位的距离分别是:10, 3, 14, 8, 6, 9, 12, 11, 7, 5, 10, 15, 9, 16, 13, 2。
假设总体服从正态分 布,求职工上班从家里到单位平均距离的 95%的置信区间。
解:小样本正态分布,。
未知。
已知,n = 16,卜:::11「」,则Q H.」,位=a /2=0.025,查自由度为n-1 = 15的:分布表得临界值-2.14样本均值 .■ =150/16=9.375于是,丄:的置信水平为1二的置信区间是9.375 士 2.14X 4.11 -V16再求样本标准差:V 253.75/154.11乞(爲10. 从一批零件是随机抽取36个,测得其平均长度是149・5,标准差是1・93。
1)求确定该种零件平均长度的95%的置信区间。
2)在上面估计中,你使用了统计中的哪一个重要定理?请解释。
解:1)这是一个大样本分布。
已知N=36, x= 149.5, S =1.93, 1-沪0.95,二I 」。
x + z & -其置信区间为:.J- 149.5± 1.96X 1.93 -V362)中心极限定理论证:如果总体变量存在有限的平均数和方差,那么,不论这个总体的分布如何,随着样本容量' 的增加,样本均值的分布便趋近正态分布。
在现实生活中,一个随机变量服从正态分布未必很多,但是多个随机变量和的分布趋于正态分布则是普遍存在的。
样本均值也是一种随机变量和的分布,因此在样本容量■;'充分大的条件下,样本均值也趋近于正态分布,这为抽样误差的概率估计理论提供了理论基础。
11. 某企业生产的袋装食品采用自动打包机包装,每袋标准重量为100克,现从某天生产的一批产品中按重复抽样随机抽取50包进行检查,测得每包重量如下:(略)已知食品包重服从正态分布,要求:1)确定该种食品平均重量的95%勺置信区间。
2)如果规定食品重量低于100克属于不合格,确定该批食品合格率的95%勺置信区间。
解:1)本题为一个大样本正态分布,。
未知。
已知N=50,^=100, 1-a=0.95,厂一一①每组组中值分别为97、99、101、103、105,即此50包样本平均值 f = ( 97+99+101 + 103+105 /5 = 101②样本标准差为:S — Y—---------1= V{( 97-101 ) 2 X2 +( 99-101 ) 2 X3 +( 101-101 )2X 34 +( 103-101 ) 2X 7+( 105-101 ) 2X 4}-( 50-1 ) ~ 1.666③其置信区间为:匚101± 1.96 X 1.666-V502 ) v 不合格包数(V 100克)为2+3=5包,5/50 = 10% (不合格率),即P = 90%。