统计学复习笔记第七章 参数估计一、 思考题1. 解释估计量和估计值在参数估计中,用来估计总体参数的统计量称为估计量。
估计量也是随机变量。
如样本均值,样本比例、样本方差等。
根据一个具体的样本计算出来的估计量的数值称为估计值。
2. 简述评价估计量好坏的标准(1)无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。
(2)有效性:是指估计量的方差尽可能小。
对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。
(3)一致性:是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。
3. 怎样理解置信区间在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。
置信区间的论述是由区间和置信度两部分组成。
有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数,这是不负责的表现。
因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。
在公布调查结果时给出被调查人数是负责任的表现。
这样则可以由此推算出置信度(由后面给出的公式),反之亦然。
4. 解释95%的置信区间的含义是什么置信区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。
也就是说,无穷次重复抽样所得到的所有区间中有95%(的区间)包含参数。
不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区间以0.95的概率覆盖总体参数。
5. 简述样本量与置信水平、总体方差、估计误差的关系。
1. 估计总体均值时样本量n 为2. 样本量n 与置信水平1-α、总体方差、估计误差E 之间的关系为其中: 2222α2222)(E z n σα=n z E σα2=▪ 与置信水平成正比,在其他条件不变的情况下,置信水平越大,所需要的样本量越大;▪ 与总体方差成正比,总体的差异越大,所要求的样本量也越大;▪ 与与总体方差成正比,样本量与估计误差的平方成反比,即可以接受的估计误差的平方越大,所需的样本量越小。
二、 练习题1. 从一个标准差为5的总体中采用重复抽样方法抽出一个样本量为40的样本,样本均值为25。
1) 样本均值的抽样标准差等于多少?2) 在95%的置信水平下,估计误差是多少?解:已知总体标准差σ=5,样本容量n=40,为大样本,样本均值x =25, (1)样本均值的抽样标准差x σ=0.7906 (2)已知置信水平1-α=95%,得 α/2Z =1.96,于是,允许误差是E =α/2Z ×0.7906=1.5496。
2. 某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本。
1) 假定总体标准差为15元,求样本均值的抽样标准误差。
2) 在95%的置信水平下,求估计误差。
3) 如果样本均值为120元,求总体均值µ的95%的置信区间。
解:(1)已假定总体标准差为σ=15元,则样本均值的抽样标准误差为 x σσ15=2.1429 x x x(2)已知置信水平1-α=95%,得 α/2Z =1.96,于是,允许误差是E =n α/2σZ =1.96×2.1429=4.2000。
(3)已知样本均值为x =120元,置信水平1-α=95%,得 α/2Z =1.96,这时总体均值的置信区间为 n±α/2σx Z =120±4.2=124.2115.8 可知,如果样本均值为120元,总体均值95%的置信区间为(115.8,124.2)元。
3. 从一个总体中随机抽取n =100的随机样本,得到=104560,假定总体标准差σ = 85414,试构建总体均值µ的95%的置信区间。
解: 已知n =100, =104560,σ = 85414,1-α=95% ,由于是正态总体,且总体标准差已知。
总体均值μ在1-α置信水平下的置信区间为104560 ± 1.96×85414÷√100= 104560 ±16741.1444. 从总体中抽取一个n =100的简单随机样本,得到 =81,s=12。
要求:1) 构建µ的90%的置信区间。
2) 构建µ的95%的置信区间。
3) 构建µ的99%的置信区间。
解:由于是正态总体,但总体标准差未知。
总体均值μ在1-α置信水平下的置信区间公式为x x 2α()28.109,44.10192.336.105251096.136.1052=±=⨯±=±n z x σαx81±×12÷√100 = 81±×1.21)1-α=90%, 1.65 其置信区间为 81 ± 1.982)1-α=95% ,其置信区间为 81 ± 2.3523) 1-α=99%, 2.58其置信区间为 81 ± 3.0965. 利用下面的信息,构建总体均值的置信区间。
1) = 25,σ = 3.5,n =60,置信水平为95%2) =119,s =23.89,n =75,置信水平为98%3) =3.149,s =0.974,n =32,置信水平为90%解:∵ ∴ 1) 1-α=95% ,其置信区间为:25±1.96×3.5÷√60= 25±0.8852) 1-α=98% ,则α=0.02, α/2=0.01, 1-α/2=0.99,查标准正态分布表,可知: 2.33其置信区间为: 119±2.33×23.89÷√75= 119±6.3453) 1-α=90%, 1.65其置信区间为: 3.149±1.65×0.974÷√32x x x 22未知αα)(22未知或σσααns z x n z x ±±= 3.149±0.2846. 利用下面的信息,构建总体均值µ的置信区间:1) 总体服从正态分布,且已知σ = 500,n = 15,=8900,置信水平为95%。
解: N=15,为小样本正态分布,但σ已知。
则1-α=95%,。
其置信区间公式为 ∴置信区间为:8900±1.96×500÷√15=(8646.7 , 9153.2)2) 总体不服从正态分布,且已知σ = 500,n = 35, =8900,置信水平为95%。
解:为大样本总体非正态分布,但σ已知。
则1-α=95%,。
其置信区间公式为 ∴置信区间为:8900±1.96×500÷√35=(8733.9 9066.1)3) 总体不服从正态分布,σ未知,n = 35, =8900,s =500,置信水平为90%。
解:为大样本总体非正态分布,且σ未知,1-α=90%,1.65。
其置信区间为:8900±1.65×500÷√35=(8761 9039)4) 总体不服从正态分布,σ未知,n = 35, =8900,s =500,置信水平为99%。
解:为大样本总体非正态分布,且σ未知,1-α=99%, 2.58。
2α()28.109,44.10192.336.105251096.136.1052=±=⨯±=±n z x σαx x 2α()28.109,44.10192.336.105251096.136.1052=±=⨯±=±n z x σαx x其置信区间为:8900±2.58×500÷√35=(8681.9 9118.1)7.某大学为了解学生每天上网的时间,在全校7500名学生中采取不重复抽样方法随机抽取36人,调查他们每天上网的时间,得到下面的数据(单位:小时):3.3 3.1 6.2 5.8 2.34.15.4 4.5 3.24.4 2.05.4 2.66.4 1.8 3.5 5.7 2.32.1 1.9 1.2 5.1 4.3 4.23.6 0.8 1.54.7 1.4 1.2 2.9 3.5 2.4 0.5 3.6 2.5求该校大学生平均上网时间的置信区间,置信水平分别为90%、95%和99%。
8.从一个正态总体中随机抽取样本量为8的样本,各样本值分别为:10,8,12,15,6,13,5,11。
求总体均值µ的95%置信区间。
解:本题为一个小样本正态分布,σ未知。
先求样本均值:= 80÷8=10再求样本标准差:= √84/7 = 3.4641于是 , 的置信水平为的置信区间是,已知,n = 8,则,α/2=0.025,查自由度为n-1 = 7的分布表得临界值 2.45所以,置信区间为:10±2.45×3.4641÷√79.某居民小区为研究职工上班从家里到单位的距离,抽取了由16个人组成的一个随机样本,他们到单位的距离分别是:10,3,14,8,6,9,12,11,7,5,10,15,9,16,13,2。
假设总体服从正态分布,求职工上班从家里到单位平均距离的95%的置信区间。
10.从一批零件是随机抽取36个,测得其平均长度是149.5,标准差是1.93。
2)求确定该种零件平均长度的95%的置信区间。
3)在上面估计中,你使用了统计中的哪一个重要定理?请解释。
解:1)这是一个大样本分布。
已知N=36,= 149.5,S =1.93,x1-α=0.95,。
其置信区间为:149.5±1.96×1.93÷√36 2)中心极限定理论证:如果总体变量存在有限的平均数和方差,那么,不论这个总体的分布如何,随着样本容量的增加,样本均值的分布便趋近正态分布。
在现实生活中,一个随机变量服从正态分布未必很多,但是多个随机变量和的分布趋于正态分布则是普遍存在的。
样本均值也是一种随机变量和的分布,因此在样本容量充分大的条件下,样本均值也趋近于正态分布,这为抽样误差的概率估计理论提供了理论基础。
11.某企业生产的袋装食品采用自动打包机包装,每袋标准重量为100克,现从某天生产的一批产品中按重复抽样随机抽取50包进行检查,测得每包重量如下:(略)已知食品包重服从正态分布,要求:1)确定该种食品平均重量的95%的置信区间。
2)如果规定食品重量低于100克属于不合格,确定该批食品合格率的95%的置信区间。
12.假设总体服从正态分布,利用下面的数据构建总体均值μ的99%的置信区间。
解: 样本均值样本标准差:尽管总体服从正态分布,但是样本n=25是小样本,且总体标准差未知,应该用T 统计量估计。