统计学课后题答案
或:
12 10
8 6 4 2 0
95 105 115 125 135 145 155
直方图
(2)茎叶图
树茎
树叶
8 9 10 11 12 13 14 15
1. 已知下表资料:
78 257 033455788 023455677899 0345679 5678 26 2
第三章
日产量(件) 25 30 35 40 45
当 Z Z0.05 1.645 ,该校大学生平均上网时间的 90%置信区间为:
2
x Z
2
s 3.3167 1.645 0.2682 (2.8755 ,3.7579 ) 小时 n
当 Z Z0.025 1.96 ,该校大学生平均上网时间的 95%置信区间为:
2
x Z
2
s 3.3167 1.96 0.2682 (2.7910 ,3.8424 ) 小时 n
2
(3)总体不服从正态分布, 未知,因此使用样本方差代替总体方差,Z Z0.05 1.645 ,
2
则 的 90%置信区间为:
x Z
2
s 8900 1.645 84.5154 (8760 .9722 ,9039 .0278 ) n
(4)总体不服从正态分布, 未知,因此使用样本方差代替总体方差, Z Z0.025 1.96 ,
该检验属于右侧单边检验,因此得到拒绝域为:W {z z1 z0.99 2.3263} ;
在大样本条件下检验统计量为: z
x 0
3.1113 2.32563 ,落入拒绝域中,因
n
此拒绝原假设,认为如今每个家庭每天收看电视的平均时间较十年前显著增加了。
(或利用 Excel 的“1-NORMSDIST(3.1113)”函数得到检验 P=0.0009<0.01,则拒
解:
单位产品成本 (元/件) 10~12 12~14 14~18 合计
单位数
2 3 4 9
产量比重(%) f/∑f 20 42 38 100
组中值 (元)x
11 13 16 -
这 9 个企业的平均单位成本= x x f =13.74(元) f
X·f/∑f
2.2 5.46 6.08 13.74
3.某专业统计学考试成绩资料如下:
vLeabharlann x100%5.23 100% 15.23% 34.35
5.一家公司在招收职员时,首先要通过两项能力测试。在 A 项测试中,平均分数是 80 分,
标准差是 15 分;在 B 项测试中,平均分数是 200 分,标准差是 50 分。一位应试者在 A 项
测试中得了 95 分,在 B 项测试中得了 225 分。与平均分数相比,该位应试者哪一项测试
按成绩分组(分) 60 以下 60~70 70~80 80~90 90~100 100 以上
合计
试计算众数、中位数。
学生数(人) 4 8
14 20
9 5 60
解:众数的计算:
根据资料知众数在 80~90 这一组,故 L=80,d=90-80=10,fm=20,fm-1=14,fm+1=9,
Mo L
fm fm1
d
fm fm1 fm fm1
80
20
20 14
14 20
9
10
83.53
(分)
中位数的计算:
根据 f 60 30 和向上累积频数信息知,中位数在 80~90 这一组。 22
M e L
f
2 Sm1 d 80 30 26 10 82 (分)
fme
20
4.利用练习题 1 题资料计算 200 名工人日产量的标准差,并计算离散系数。(只按照频数计
结论:对同一资料,采用频数和频率资料计算的变量值的平均数是一致的。
2.某企业集团将其所属的生产同种产品的 9 个下属单位按其生产该产品平均单位成本的分
组资料如下表:
单位产品成本(元/件) 10~12 12~14 14~18 合计
单位数 2 3 4 9
试计算这 9 个企业的平均单位成本。
产量比重(%) 20 42 38 100
第二章
3.某公司下属 40 个销售点 2012 年的商品销售收入数据如下:
单位:万元
152
124
129
116
100
103
92
95
127
104
105
119
114
115
87
103
118
142
135
125
117
108
105
110
107
137
120
136
117
108
97
88
123
115
119
138
112
146
nd 1
384 10 1
6.53
, t
(10 1)
2.262
2
则自信心得分之差 d 1 - 2 的 95%的置信区间为:
d
t0.025 (9)
sd n
11 2.262 6.53 10
11 4.67
(6.33,15.67)
结论:
8.从两个总体中各抽取一个 n1 n2 250 的独立随机样本,来自总体 1 的样本比例为 p1 40% ,来自总体 2 的样本比例为 p2 30% 。
(1) E(x) x 200
(2)
2 x
2 n
2500 100
25 , x
2 x
5
(3)根据中心极限定理, x 近似服从均值为 200,标准差为 5 的正态分布。
4.解:已知: 0.4 , n 500 ,同时由于样本量很大,可以看作重置抽样来处理。
根据公式 4.7 可以得到:
(1) E( p) 0.4
构造 (1 - 2 ) 的置信区间,置信水平分别为 90%和 95%。 解:由题目可以得到: n1 n2 250 , p1 0.4 , p2 0.3 ,
当 Z Z0.05 1.645 , (1 - 2 ) 的 90%置信区间为:
2
p1 p2 Z0.95
p1(1 p1) p2 (1 p2 ) (3.021%,16.98%)
n1
n2
当 Z Z0.025 1.96 , (1 - 2 ) 的 95%置信区间为:
2
p1 p2 Z0.975
p1(1 p1) p2 (1 p2 ) (1.684%,18.32%)
n1
n2
结论:
第六章
1.解:由题目可以得到: n 200 , 2.5 ;
提出原假设与备择假设: H0 : 6.7 , H1 : 6.7 ;
合计
工人数(人) 20 50 80 36 14 200
数据个数 2 3 9 12 7 4 2 1
工人比重(%) 10 25 40 18 7 100
试根据频数和频率资料,分别计算工人平均日产量。
解:
计算表
日产量 (件)x
25 30 35 40 45 合计
工人数 (人)f
20 50 80 36 14 200
s n
拒绝域中,因此拒绝原假设,认为该城市空气中悬浮颗粒的平均值显著低于过去的平均值。
(或利用 Excel 的“NORMSDIST(-2.3949)”函数得到检验 P=0.0083<0.01,则拒绝
原假设)
3.解:由题目可以得到: n 20 ,计算样本数据得到 s 2.1933, x 25.51;
2
则 的 95%置信区间为:
x Z
2
s 8900 1.96 84.5154 (8734 .3498 ,9065 .6502 ) n
x
3.解:整理数据可以得到 n 36 , x 3.3167 , s
(x x)2 1.6093 ,由于
n
n 1
n 36 属于大样本,所以使用正态分布来构建置信区间。
(2)
2 p
(1 ) n
0.00048 ,
p
2 p
0.0219 ;
(3)根据中心极限定理,p 近似服从均值为 0.4,标准差为 0.0219 的正态分布。
第五章
1.解:(1)已知 15,n 49 ,故: x
n
15 7
2.1429
;
(2)由题目可知: 0.05 ,故查表可知: Z Z0.025 1.96
的自信心测试分数如下:
人员编号
1
2
3
4
5
6
7
8
9
10
方法 1
78
63
72
89
91
49
68
76
85
55
方法 2
71
44
61
84
74
51
55
60
77
39
构建两种方法平均自信心得分之差 d 1 - 2 的 95%的置信区间。
解:由样本数据计算得到:
d
110 10
11, sd
n
(di d )2
i1
1.96
,
得到:
Z
2
p(1 p) 0.1 n
1.96 0.8(1- 0.8) 0.1 n
61.5385 n
即样本个数至少为 62 户。
或直接将 d 0.1带入 n 确定的公式,即,
n
(z / 2 )2 (1 d2
)
1.96 2
0.8 0.12
(1
0.8)
61.54
62
7.一家人才测评机构对随机抽取的 10 名小企业的经理人用两种方法进行自信心测试,得到
当 Z Z0.025 2.58 ,该校大学生平均上网时间的 95%置信区间为: