统计学复习笔记第七章参数估计一、思考题1.解释估计量和估计值在参数估计中,用来估计总体参数的统计量称为估计量。
估计量也是随机变量。
如样本均值,样本比例、样本方差等。
根据一个具体的样本计算出来的估计量的数值称为估计值。
2.简述评价估计量好坏的标准(1)无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。
(2)有效性:是指估计量的方差尽可能小。
对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。
(3)一致性:是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。
3.怎样理解置信区间在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。
置信区间的论述是由区间和置信度两部分组成。
有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数,这是不负责的表现。
因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。
在公布调查结果时给出被调查人数是负责任的表现。
这样则可以由此推算出置信度(由后面给出的公式),反之亦然。
4.解释95%的置信区间的含义是什么置信区间 95%仅仅描述用来构造该区间上下界的统计量(是随机的 )覆盖总体参数的概率。
也就是说,无穷次重复抽样所得到的所有区间中有 95%(的区间)包含参数。
不要认为由某一样本数据得到总体参数的某一个 95%置信区间,就以为该区间以的概率覆盖总体参数。
5.简述样本量与置信水平、总体方差、估计误差的关系。
1.估计总体均值时样本量 n 为( z222) 22 E zn22其中:2E 2n2.样本量n与置信水平1-α、总体方差、估计误差E之间的关系为与置信水平成正比,在其他条件不变的情况下,置信水平越大,所需要的样本量越大;与总体方差成正比,总体的差异越大,所要求的样本量也越大;与与总体方差成正比,样本量与估计误差的平方成反比,即可以接受的估计误差的平方越大,所需的样本量越小。
二、练习题1.从一个标准差为 5 的总体中采用重复抽样方法抽出一个样本量为40 的样本,样本均值为 25。
1) 样本均值的抽样标准差x 等于多少x2)在 95%的置信水平下,估计误差是多少解: 1)已知σ= 5,n = 40,x = 25∵xxn n∴x =5 /√ 40 ≈x2)已知∵E z22n∴估计误差 E = ×5÷√ 40 ≈2.某快餐店想要估计每位顾客午餐的平均花费金额,在为期 3 周的时间里选取 49 名顾客组成了一个简单随机样本。
1)假定总体标准差为 15 元,求样本均值的抽样标准误差。
2)在 95%的置信水平下,求估计误差。
3)如果样本均值为 120 元,求总体均值μ的 95%的置信区间。
解: 1)已知σ= 15,n = 49xxn∵xnxn∴x = 15÷√49 =x2)已知∵ E z 22n∴估计误差 E = ×15÷√ 49 ≈3)已知x = 120∵置信区间为 x ±E∴其置信区间 = 120±3.从一个总体中随机抽取n =100 的随机样本,得到x=104560,假定总体标准差σ= 85414,试构建总体均值μ的95%的置信区间。
x解:已知 n =100, =104560,σ= 85414,1-=95% ,由于是正态总体,且总体标准差已知。
总体均值在1-置信水平下的置信区间为x z 2105.3610 1.962 n 104560 ±25×85414÷√ 100 105.36 3.92= 104560 ±101.44,109.284.从总体中抽取一个n =100 的简单随机样本,得到x=81,s=12。
要求:1)构建μ的90%的置信区间。
2)构建μ的95%的置信区间。
3)构建μ的99%的置信区间。
解:由于是正态总体,但总体标准差未知。
总体均值在 1-置信水平下的置信区间公式为81±×12÷√ 100 = 81±×1)1-=90%,其置信区间为81 ±2)1-=95% ,其置信区间为81 ±3)1-=99%,其置信区间为 81 ±5.利用下面的信息,构建总体均值的置信区间。
1)x = 25,σ= ,n =60,置信水平为 95%2)x =119,s =,n =75,置信水平为98%3)x =,s =,n =32,置信水平为 90%解:∵x z22n 或x z22sn(未知)∴1) 1-=95% ,其置信区间为: 25±×÷√ 60= 25±2)1-=98% ,则=, /2=, 1-/2=,查标准正态分布表 ,可知 :其置信区间为 : 119±×÷√ 75= 119±3)1-=90%,其置信区间为 : ±×÷√ 32= ±6. 利用下面的信息,构建总体均值μ的置信区间:1) 总体服从正态分布,且已知 σ= 500,n = 15, x =8900,置信水平为 95%。
解: N=15,为小样本正态分布,但 σ已知。
则 1-=95%, 。
其置信区间公式为xz22105.36 10 1.96n25∴置信区间为: 8900±× 500÷√ 15=( ,) 105.36 3.92101.44,109.282) 总体不服从正态分布,且已知 σ= 500,n = 35, x=8900,置信水平为 95%。
解:为大样本总体非正态分布, 但 σ已知。
则 1-=95%,。
其置信区间公式为xz22105.36 10 1.96n25∴置信区间为: 8900±× 500÷√ 35=(105.36 3.92)101.44,109.283) 总体不服从正态分布, σ未知, n = 35,x =8900,s =500,置信水平为 90%。
解:为大样本总体非正态分布,且σ未知, 1-=90%,。
其置信区间为:8900±× 500÷√ 35=(8761 9039)4) 总体不服从正态分布, σ未知, n = 35,x =8900,s =500,置信水平为 99%。
解:为大样本总体非正态分布,且 σ未知, 1-=99%, 。
其置信区间为:8900±× 500÷√ 35=()7.某大学为了解学生每天上网的时间,在全校7500 名学生中采取重复抽样方法随机抽取36 人,调查他们每天上网的时间,得到下面的数据(单位:小时)(略)。
求该校大学生平均上网时间的置信区间,置信水平分别为 90%解:先求样本均值:=再求样本标准差:置信区间公式:8.从一个正态总体中随机抽取样本量为 8 的样本,各样本值分别为:10,8,12,15,6,13,5,11。
求总体均值μ的95%置信区间。
解:本题为一个小样本正态分布,σ未知。
先求样本均值:= 80÷8=10再求样本标准差:=√84/7 =于是 ,的置信水平为的置信区间是,已知,n = 8,则,α/2=,查自由度为 n-1 = 7的分布表得临界值所以,置信区间为:10±×÷√ 79.某居民小区为研究职工上班从家里到单位的距离,抽取了由16个人组成的一个随机样本,他们到单位的距离分别是:10,3,14,8,6,9, 12,11,7, 5,10,15,9,16, 13, 2。
假设总体服从正态分布,求职工上班从家里到单位平均距离的95%的置信区间。
解:小样本正态分布,σ未知。
已知,n = 16,,则,α/2=,查自由度为 n-1 = 15的分布表得临界值样本均值=150/16=再求样本标准差:=√15≈于是 ,的置信水平为的置信区间是,±×÷√ 1610.从一批零件是随机抽取36 个,测得其平均长度是,标准差是。
1) 求确定该种零件平均长度的95%的置信区间。
2)在上面估计中,你使用了统计中的哪一个重要定理请解释。
解:1)这是一个大样本分布。
已知N=36,x= , S =,1-α=,。
其置信区间为:±×÷√ 362)中心极限定理论证:如果总体变量存在有限的平均数和方差,那么,不论这个总体的分布如何,随着样本容量的增加,样本均值的分布便趋近正态分布。
在现实生活中,一个随机变量服从正态分布未必很多,但是多个随机变量和的分布趋于正态分布则是普遍存在的。
样本均值也是一种随机变量和的分布,因此在样本容量充分大的条件下,样本均值也趋近于正态分布,这为抽样误差的概率估计理论提供了理论基础。
11.某企业生产的袋装食品采用自动打包机包装,每袋标准重量为100 克,现从某天生产的一批产品中按重复抽样随机抽取 50 包进行检查,测得每包重量如下:(略)已知食品包重服从正态分布,要求:1)确定该种食品平均重量的95%的置信区间。
2)如果规定食品重量低于100 克属于不合格,确定该批食品合格率的 95%的置信区间。
解: 1)本题为一个大样本正态分布,σ未知。
已知N=50,μ =100,1-α=,。
①每组组中值分别为97、99、101、103、105,即此 50 包样本平均值= (97+99+101+103+105)/5 = 101② 样本标准差为:=√{( 97-101) 2× 2+( 99-101)2 ×3+( 101-101 ) 2×34+( 103-101 )2× 7+( 105-101) 2× 4}÷( 50-1)≈③其置信区间为:101±×÷√ 502)∵ 不合格包数(< 100 克)为 2+3=5 包,5/50 = 10%(不合格率),即 P = 90%。
∴该批食品合格率的95%置信区间为:=±×√×÷ 50= ±×12.假设总体服从正态分布,利用下面的数据构建总体均值μ的99%的置信区间。
(略)解:样本均值样本标准差:尽管总体服从正态分布,但是样本 n=25 是小样本,且总体标准差未知,应该用 T 统计量估计。
1-α=,则α=, α/2=,查自由度为 n-1= 24 的分布表得临界值的置信水平为的置信区间是,13.一家研究机构想估计在网络公司工作的员工每周加班的平均时间,为此随机抽取了18 个员工,得到他们每周加班的时间数据如下(单位:小时):(略)假定员工每周加班的时间服从正态分布,估计网络公司员工平均每周加班时间的90%的置信区间。