统计学课后作业答案
19 15 29 25 24
23 21 38 22 18
30 20 19 19 16
23 27 22 34 24
41 20 31 17 23
要求;(1)计算众数、中位数:
1、排序形成单变量分值的频数分布和累计频数分布:
(2) 根据定义公式计算四分位数。
Q1位置=25/4=6.25,因此Q仁19 , Q3位置=3X 25/4=18.75,因此Q3=27,或者,由于25
和27都只有一个,因此Q3也可等于25+0.75 X 2=26.5。
(3) 计算平均数和标准差;Mean=24.00 ; Std. Deviation=6.652
(4) 计算偏态系数和峰态系数:Skewness=1.080; Kurtosis=0.773
(5) 对网民年龄的分布特征进行综合分析:分布,均值=24、标准差=6.652、呈右偏分布。
如需看清楚分布形态,需要进行分组。
为分组情况下的直方图:
Mean 23.3000 Std. Deviation 7.02377 Variance
49.333 Skewness
1.163
15
16
17
18
19
20
21
22
23
24
25
27
29
30
31
34
38
41
网络用户的年龄
t
n u a c
为分组情况下的概率密度曲线:
分组:
1、确定组数:K ig(n) 1 ig 25
ig(2) ig 2
0.30103
5.64,取 k=6
Frequency
Percent Cumulative Frequency
Cumulative Percent
Valid
<=15 1 4.0 1 4.0 16 - 20 8 32.0 9 36.C 21 - 25
9 36.0 18 72.C 26 - 30 3 12.0 21 84.0 31 - 35 2 8.0 23 92.0 36 - 40 1 4.0 24 96.0 41 + 1
4.0
25
100.C
Total
25 100.0
2、 确定组距:组距=
3、 分组频数表
网络用户的年龄 (Binned)
分组后的均值与方差:
(最大值-最小值)* 组数=(41-15)- 6=4.3,取5
. 对名成年人和名幼儿的身高进行抽样调查,结果如下:
成年组166 169 172 177 180 170 172 174 168 173
幼儿组68 69 68 70 7l 73 72 73 74 75
要求:1)如果比较成年组和幼儿组的身高差异,你会采用什么样的统计量为什么
均值不相等,用离散系数衡量身高差异。
(2)比较分析哪一组的身高差异大?
成年组幼儿组
平均172.1 平均71.3
标准差 4.201851 标准差 2.496664
离散系数0.024415 离散系数0.035016
幼儿组的身高差异大1.302
分组后的直方图:
Mean =23.30
Std. Dev. =7.024
N =25
7.6利用下面的信息,构建总体均值 卩的置信区间:
1) 总体服从正态分布,且已知 (r=x 500, n = 15, =8900,置信水平为95%
二置信区间为:8900± 1.96 X 500-V 15= (86460536 9153.2
)
101.44,109.28
2) 总体不服从正态分布,且已知 卢X 00,n = 35,
=8900,置信水平为95%
解:为大样本总体非正态分布,但。
已知。
则1-
= 95%,
105.36 3.92 101.44,109.28
解:N=15,为小样本正态分布,但
(T 已知。
贝S 1- = 95%,
"二加=1%。
其置信区间公式为
105.36 1.96
10 25
其置信区间公式为
105.36 1.96 10 25
二置信区间为:8900士 1.96 X 500-V 35=( 8733.9 9066.1 )
7.9某居民小区为研究职工上班从家里到单位的距离,抽取了由16
个人组成的一个随机样本,他们到单位的距离分别是:10, 3, 14, 8,
6, 9,12,11,乙5,10,15, 9,16,13, 2。
假设总体服从正态分布,求职工上班从家里到单位平均距离的95%的置信区间。
解:小样本正态分布,。
未知。
已知,n二16,•鼻-:,则:-,a /2=0.025,查自由度为n-1 = 15 的上分布表得临界值
■■- 2.14
疋二一
样本均值•:=150/16=9.375
£ % —冇g二I
旦 _______________
再求样本标准差:" “ 1 = V253.75/15〜4.11
于是,尸的置信水平为「二的置信区间是
9.375 士2.14X 4.11 -V16 即(7.18,11.57 )
8.5某种大量生产的袋装食品,按规定不得少于250克。
今从一批该食品中任意抽取50袋,发现有6袋低于250克。
若规定不符合标准的比例超过5%就不得出厂,问该批食品能否出厂( =0.05 ) ?
解:已知N=50, P=6/50=0.12,为大样本,右侧检验,用Z统计量计
算。
=0.05,即Z =1.645
H。
:丌W 5%
〜N(0,1)
=(0.12-0.05)/ V (0.05 X 0.95 - 50)〜2.26
(因为没有找到丌表示的公式,这里用 P 0表示丌0) 结论:因为Z 值落入拒绝域,所以在 =0.05的显著性水平上, 拒绝H 。
,而接受H i
决策:有证据表明该批食品合格率不符合标准,不能出厂。
8.6某厂家在广告中声称,该厂生产的汽车轮胎在正常行驶条件下超 过目前的平均水平25000公里。
对一个由15个轮胎组成的随机样本 做了试验,得到样本均值和标准差分别为 27000公里和5000公里。
假定轮胎寿命服从正态分布,问该厂家的广告是否真实(=0.05)? 解:N=15, - =27000 , s=5000,小样本正态分布,。
未知,用t 统 计量计算。
这里是右侧检验,
=0.05,自由度N-仁14,即t =1.77
H :卩 0< 25000 Hi :卩 > 25000
(27000-25000) / (5000-V 15)〜1.55
结论:因为t 值落入接受域,所以接受 H ,拒绝H
决策:有证据表明,该厂家生产的轮胎在正常行驶条件下使用寿 命与目前平均水平25000公里无显著性差异,该厂家广告不真实
9.1欲研究不同收入群体对某种特定商品是否有相同的购买习惯, 市 场研究人员调查了四个不同收入组的消费者共 527人,购买习惯分
H 仁丌> 5%
P P 0
a 0
为:经常购买,不购买,有时购买。
调查结果如下表所示
要求:
⑴提出假设
⑵计算X2值
⑶以a=0.1的显著性水平进行检验
解:
⑴假设H o: u 1 = U2=U3 = U4 (有相同的购物习惯)
H 1 : u 1、U2、U3、U3不全相等(无相同的购物习惯)
⑵
项目低收入组偏低收入组■■扁高收咼1•攵入命十占全部的比率经常购买25404715330%
不经常购买6951研25147.60%
有时购买3626153711322.40% 13031714C140沏
根据公式算出对应的期望值f e,结果如下表:
fe(九也(ffl-fe) 2/f e
2539-141% 5.025641026
40355250.714285714
4742525O.E95238095
46424160. 380952381
69C27490.790322581
5155-41&0.290909091
74677490.731343284
57解-10100 1.492537313
3629749 1.689655172
262710.037037037
1931-121444-64516129
373163& 1.161290323
17.55437331
利用excel 算出x2 = 17.5544
⑶自由度二(R - 1 ) (r - 1 ) = (3 - 1 ) (4 - 1 ) = 6
a=0.1, 由附录表查得:
x 20.1 (6)=10.6446
拒绝域为:(10.6446 , +x)
由于x2> x2a,故拒绝原假设H0,即认为不同收入群体对某种特定商品,没有相同的购买习惯。