(二)区间估计 区间估计是指用样本指标、抽样误差和概率所构造的区间以估计总体指标存在的可能范围。 在进行区间估计的时候,根据所给定的条件不同,总体平均数和总体成数的估计有两条模式可供选择: 第一套:给定置信度要求,去推算抽样误差的可能范围。 第二套:根据已给定的抽样误差范围,求出概率保证程度。 1. 总体平均数的区间估计 按照第一套模式,根据置信度Ft()的要求,估计极限抽样误差的可能范围)(或px,并指出估计区间(置信区间)。具体步骤是: (1)抽取样本,并根据调查所得的样本单位标志值,计算样本平均数x;计算样本标准差;在大样本下用以代替总体标准差推算抽样平均误差。 (2)根据给定的置信度Ft()的要求,查《正态分布概率表》,求得概率度t值。 (3)根据概率度t和抽样平均误差x计算极限抽样误差的可能范围xxt,并据以计算置信区间的上下限。 例14 麦当劳餐馆在7周内抽查49位顾客的消费额(元)如下,求在概率95%的保证下,顾客平均消费额的置信区间。 15 24 38 26 30 42 18 30 25 26 34 44 20 35 24 26 34 48 18 28 46 19 30 36 42 24 32 45 36 21 47 26 28 31 42 45 36 24 28 27 32 36 47 35 22 24 32 46 26 第一步:根据样本计算样本平均数和标准差:
xxn32 (元)
Snxx2945().(元),用样本标准差代替总体标准差945.(元) 样本平均误差 xn94549135..(元) 第二步:根据给定的置信度Ft()95%,查概率表得t196. 第三步:根据概率度t和抽样平均误差推算抽样极限误差的可能范围。
65.235.196.1xxt(元) 将xx,的值代入区间估计公式
)(65.34)(35.2965.23265.232元元XXxXxxx
计算结果表明,以95%的概率保证,麦当劳餐馆顾客消费额在29.35~34.65元之间。 例15 某高校有5 000名学生,随机抽取250名调查每周收看电视的时间,分组资料见表4—7。 试按不重置抽样方法,以95.45%的概率推断该校全部学生每周收看电视时间的可能范围。
表4—7 每周收看电视时间(小时) 组中值x 学生人数f
2以下 2~4 4~6 6~8 8~10 1 3 5 7 9 22 56 92 60 20 250
巳知:N=5 000, n=250, 由Ft().9545%查表得t2 首先,计算样本指标
样本平均数 xxfn12235659276092025012502505()小时 样本方差
222222215355575952256926020250Sxxn()()()()()()
=11362504544. 由于不知道总体方差,所以用样本方差代替总体方差。 样本平均误差 xnnN21454425012505000013().().()小时 第二步:计算极限抽样误差 xx
t2013026..()小时
第三步:确定置信区间 5-0.26X5026. 4.74X526. 计算结果表明, 全部学生每周平均看电视的时间在4.74—5.26小时之间。 例16 某保险公司从投保人中随机抽取36人,计算出此36人的平均年龄x395.岁,巳知投保人年龄分布近似正态分布,标准差为7.2岁,试求所有投保人平均年龄99%的置信区间。 解 已知 x395.岁 72. n36 根据置信度Ftt().99%,258查正态分布概率表得 计算极限抽样误差
xtn22258362581443097.2....(岁) 总体的置信区间为 xXxxx 395309395309....X 36414259..X 计算结果表明:以99%的把握度保证,投保人
年龄在36.41~42.59岁之间。 例17 某研究机构进行了一项调查来估计吸烟者一月花在抽烟上的平均支出,该机构随机抽取了容量为200的样本进行调查,得到样本平均数为110元,样本标准差为30元,试以95%的把握度估计全部吸烟者月均烟钱支出的置信区间。 解 巳知x110, S30, n20030; Ft().096查概率分布表得t206. 由于不知道总体方差,所以用样本方差代替。计算极限抽样误差:
xtSn20630200437..(元) 置信区间: xxxXx 110—4.37X110437.
1056311437..X 结论,我们有95%的把握认为吸烟者月均烟钱
支出在105.63~114.37元之间。 例18 某年某地区抽查了400户农民家庭年人均穿衣的消费支出,得到平均值为220元,标准差为86元,试以95%的置信水平估计该地区农民家庭年人均穿衣的消费支出。 解 因为 n=400是大样本,则有 t196. ,极限抽样误差为
)(42.84008696.1元ntx
置信区间: 220—8.4222042.8X 211.58元元42.228X 结论,我们有95%的把握认为该地区农民家庭年人均穿衣的消费支出,在3211.58元至228.42元之间。 此例可以看出,样本容量越大,样本平均数越接近总体平均数。 第二套是根据给定的极限抽样误差范围x,求概率保证程度Ft()。具体步骤是: (1)抽取样本,根据样本单位标志值计算样本算术平均数,作为总体平均数的估计值,并计算样本标准差以推算抽样平均误差x。 (2)根据给定的极限抽样误差范围x,估计总体平均数的置信区间,即估计总体平均数的下限xx
和总体平均数的上限xx。
(3)根据给定的极限抽样误差x,除以抽样平均误差x,求出概率度t,即,xxt再根据t值查《正态
分布概率表》,求出相应的置信度Ft()。 例7 某乡水稻总面积20 000亩,以不重置抽样方法从中随机抽取500亩实割实测求得样本平均亩产x550千克,标准差为65千克。要求极限抽样误差不超过5.74千克,试对该乡水稻的亩产和总产量作估计。 解 第一步 根据算出的样本平均亩产x550千克, 样本标准差65千克,计
xnnN221500150020000
28765()().
(千克)
第二步 根据给定的x574.千克,计算该乡平均亩产和总产量的上限和下限。 亩产下限=xx55057454426..(千克) 总产量下限=2000054426108852..万(千克) 亩产上限=xx55057455574..(千克) 总产量上限=2000055574111148..万(千克) 第三步:根据txx5742872..,查概率表得F().209545或95.45%. 区间估计:以概率95.45%保证的保证程,估计该乡水稻平均亩产在544.26~555.74千克之间;总产量在1088.52~1111.48万千克之间。 2.总体成数的区间估计 总体成数估计和总体平均数估计相类似,也有两套模式。 第一套模式是根据给一的置信度Ft()要求,估计极限抽样误差范围p。现举例说明具体步骤: 例19 在一项新广告活动的跟踪调查中,在被调查的400中有240人会记起广告标语。假定在95.45%概率保证程度下,能记起广告标语占总体比率的置信区间是多少? 首先,根据样本资料计算 抽样成数 pnn124040060% 抽样方差 2160%160%)0604024Spp()(...
抽样平均误差 pppn()...102440000245245%
其次,根据假定的置信度Ft().9545% ,查概率表求得t2 。 最后,求出被估计的总体比率的置信区间
pp
t2245%49%...
总体比率的置信区间: pPppp 60%49%60%49%..P 55.1%P649%.
计算结果说明,以概率95.45%的保证程度,估计会记起广告标语的人数占总体比率在55.1%~64.9%之间。 第二套模式是根据已经给定的极限抽样误差范围p,求概率保证程度。具体步骤是: (1)抽取样本,计算样本成数p及标准差p,并据此推算抽样平均误差p。 (2)根据给定的极限抽样误差范围p,估计总体成数置信区间的下限pp和上限pp。 (3)将极限抽样误差p除以抽样平均误差p,求出概率度t值,再根据t值查概率表,求出相应的置信度Ft()。