当前位置：文档之家› 统计学第七章、第八章课后题包括答案.docx

统计学第七章、第八章课后题包括答案.docx

统计学复习笔记第七章参数估计一、思考题1．解释估计量和估计值在参数估计中，用来估计总体参数的统计量称为估计量。

估计量也是随机变量。

如样本均值，样本比例、样本方差等。

根据一个具体的样本计算出来的估计量的数值称为估计值。

2．简述评价估计量好坏的标准（1）无偏性：是指估计量抽样分布的期望值等于被估计的总体参数。

（2）有效性：是指估计量的方差尽可能小。

对同一总体参数的两个无偏估计量，有更小方差的估计量更有效。

（3）一致性：是指随着样本量的增大，点估计量的值越来越接近被估总体的参数。

3．怎样理解置信区间在区间估计中，由样本统计量所构造的总体参数的估计区间称为置信区间。

置信区间的论述是由区间和置信度两部分组成。

有些新闻媒体报道一些调查结果只给出百分比和误差（即置信区间），并不说明置信度，也不给出被调查的人数，这是不负责的表现。

因为降低置信度可以使置信区间变窄（显得“精确”），有误导读者之嫌。

在公布调查结果时给出被调查人数是负责任的表现。

这样则可以由此推算出置信度（由后面给出的公式），反之亦然。

4．解释95%的置信区间的含义是什么置信区间 95%仅仅描述用来构造该区间上下界的统计量(是随机的 )覆盖总体参数的概率。

也就是说，无穷次重复抽样所得到的所有区间中有 95%（的区间）包含参数。

不要认为由某一样本数据得到总体参数的某一个 95%置信区间，就以为该区间以的概率覆盖总体参数。

5．简述样本量与置信水平、总体方差、估计误差的关系。

1.估计总体均值时样本量 n 为( z222) 22 E zn22其中：2E 2n2.样本量n与置信水平1-α、总体方差、估计误差E之间的关系为与置信水平成正比，在其他条件不变的情况下，置信水平越大，所需要的样本量越大；与总体方差成正比，总体的差异越大，所要求的样本量也越大；与与总体方差成正比，样本量与估计误差的平方成反比，即可以接受的估计误差的平方越大，所需的样本量越小。

二、练习题1．从一个标准差为 5 的总体中采用重复抽样方法抽出一个样本量为40 的样本，样本均值为 25。

1) 样本均值的抽样标准差x 等于多少x2)在 95%的置信水平下，估计误差是多少解： 1）已知σ= 5，n = 40，x = 25∵xxn n∴x =5 ／√ 40 ≈x2）已知∵E z22n∴估计误差 E = ×5÷√ 40 ≈2．某快餐店想要估计每位顾客午餐的平均花费金额，在为期 3 周的时间里选取 49 名顾客组成了一个简单随机样本。

1)假定总体标准差为 15 元，求样本均值的抽样标准误差。

2)在 95%的置信水平下，求估计误差。

3)如果样本均值为 120 元，求总体均值μ的 95%的置信区间。

解： 1）已知σ= 15，n = 49xxn∵xnxn∴x = 15÷√49 =x2）已知∵ E z 22n∴估计误差 E = ×15÷√ 49 ≈3）已知x = 120∵置信区间为 x ±E∴其置信区间 = 120±3．从一个总体中随机抽取n =100 的随机样本，得到x=104560，假定总体标准差σ= 85414，试构建总体均值μ的95%的置信区间。

x解：已知 n =100， =104560，σ= 85414，1-＝95% ，由于是正态总体，且总体标准差已知。

总体均值在1-置信水平下的置信区间为x z 2105.3610 1.962 n 104560 ±25×85414÷√ 100 105.36 3.92= 104560 ±101.44,109.284．从总体中抽取一个n =100 的简单随机样本，得到x=81，s=12。

要求：1）构建μ的90%的置信区间。

2）构建μ的95%的置信区间。

3）构建μ的99%的置信区间。

解：由于是正态总体，但总体标准差未知。

总体均值在 1-置信水平下的置信区间公式为81±×12÷√ 100 = 81±×1）1-＝90%，其置信区间为81 ±2）1-＝95% ，其置信区间为81 ±3)1-＝99%，其置信区间为 81 ±5．利用下面的信息，构建总体均值的置信区间。

1）x = 25，σ= ，n =60，置信水平为 95%2）x =119，s =，n =75，置信水平为98%3）x =，s =，n =32，置信水平为 90%解：∵x z22n 或x z22sn(未知)∴1） 1-＝95% ，其置信区间为： 25±×÷√ 60= 25±2）1-＝98% ，则=, /2=, 1-/2=,查标准正态分布表 ,可知 :其置信区间为 : 119±×÷√ 75= 119±3)1-＝90%，其置信区间为 : ±×÷√ 32= ±6．利用下面的信息，构建总体均值μ的置信区间：1）总体服从正态分布，且已知 σ= 500，n = 15， x =8900，置信水平为 95%。

解： N=15，为小样本正态分布，但 σ已知。

则 1-＝95%，。

其置信区间公式为xz22105.36 10 1.96n25∴置信区间为： 8900±× 500÷√ 15=（ ,） 105.36 3.92101.44,109.282）总体不服从正态分布，且已知 σ= 500，n = 35， x=8900，置信水平为 95%。

解：为大样本总体非正态分布，但 σ已知。

则 1-＝95%，。

其置信区间公式为xz22105.36 10 1.96n25∴置信区间为： 8900±× 500÷√ 35=（105.36 3.92）101.44,109.283）总体不服从正态分布， σ未知， n = 35，x =8900，s =500，置信水平为 90%。

解：为大样本总体非正态分布，且σ未知， 1-＝90%，。

其置信区间为：8900±× 500÷√ 35=（8761 9039）4）总体不服从正态分布， σ未知， n = 35，x =8900，s =500，置信水平为 99%。

解：为大样本总体非正态分布，且 σ未知， 1-＝99%，。

其置信区间为：8900±× 500÷√ 35=（）7．某大学为了解学生每天上网的时间，在全校7500 名学生中采取重复抽样方法随机抽取36 人，调查他们每天上网的时间，得到下面的数据（单位：小时）（略）。

求该校大学生平均上网时间的置信区间，置信水平分别为 90%解：先求样本均值：=再求样本标准差：置信区间公式：8．从一个正态总体中随机抽取样本量为 8 的样本，各样本值分别为：10，8，12，15，6，13，5，11。

求总体均值μ的95%置信区间。

解：本题为一个小样本正态分布，σ未知。

先求样本均值：= 80÷8=10再求样本标准差：=√84/7 =于是 ,的置信水平为的置信区间是,已知，n = 8，则,α/2=，查自由度为 n-1 = 7的分布表得临界值所以，置信区间为：10±×÷√ 79．某居民小区为研究职工上班从家里到单位的距离，抽取了由16个人组成的一个随机样本，他们到单位的距离分别是：10，3，14，8，6，9， 12，11，7， 5，10，15，9，16， 13， 2。

假设总体服从正态分布，求职工上班从家里到单位平均距离的95%的置信区间。

解：小样本正态分布，σ未知。

已知，n = 16，，则,α/2=，查自由度为 n-1 = 15的分布表得临界值样本均值=150/16=再求样本标准差：=√15≈于是 ,的置信水平为的置信区间是,±×÷√ 1610．从一批零件是随机抽取36 个，测得其平均长度是，标准差是。

1) 求确定该种零件平均长度的95%的置信区间。

2)在上面估计中，你使用了统计中的哪一个重要定理请解释。

解：1）这是一个大样本分布。

已知N=36，x= ， S =，1-α=，。

其置信区间为：±×÷√ 362）中心极限定理论证：如果总体变量存在有限的平均数和方差，那么，不论这个总体的分布如何，随着样本容量的增加，样本均值的分布便趋近正态分布。

在现实生活中，一个随机变量服从正态分布未必很多，但是多个随机变量和的分布趋于正态分布则是普遍存在的。

样本均值也是一种随机变量和的分布，因此在样本容量充分大的条件下，样本均值也趋近于正态分布，这为抽样误差的概率估计理论提供了理论基础。

11．某企业生产的袋装食品采用自动打包机包装，每袋标准重量为100 克，现从某天生产的一批产品中按重复抽样随机抽取 50 包进行检查，测得每包重量如下：（略）已知食品包重服从正态分布，要求：1）确定该种食品平均重量的95%的置信区间。

2）如果规定食品重量低于100 克属于不合格，确定该批食品合格率的 95%的置信区间。

解： 1）本题为一个大样本正态分布，σ未知。

已知N=50，μ =100，1-α=，。

①每组组中值分别为97、99、101、103、105，即此 50 包样本平均值= （97+99+101+103+105）/5 = 101② 样本标准差为：=√｛（ 97-101） 2× 2＋（ 99-101）2 ×3＋（ 101-101 ） 2×34＋（ 103-101 ）2× 7＋（ 105-101） 2× 4｝÷（ 50-1）≈③其置信区间为：101±×÷√ 502）∵ 不合格包数（＜ 100 克）为 2+3=5 包，5/50 = 10%（不合格率），即 P = 90%。

∴该批食品合格率的95%置信区间为：=±×√×÷ 50= ±×12．假设总体服从正态分布，利用下面的数据构建总体均值μ的99%的置信区间。

（略）解：样本均值样本标准差：尽管总体服从正态分布，但是样本 n=25 是小样本，且总体标准差未知，应该用 T 统计量估计。

1-α=，则α=, α/2=，查自由度为 n-1= 24 的分布表得临界值的置信水平为的置信区间是,13．一家研究机构想估计在网络公司工作的员工每周加班的平均时间，为此随机抽取了18 个员工，得到他们每周加班的时间数据如下（单位：小时）：（略）假定员工每周加班的时间服从正态分布，估计网络公司员工平均每周加班时间的90%的置信区间。

e商务文档

统计学第七章、第八章课后题包括答案.docx

相关文档推荐：