统计学课后作业答案
4.2 随机抽取25个网络用户,得到他们的年龄数据如下:
19 15 29 25 24
23 21 38 22 18
30 20 19 19 16
23 27 22 34 24
41 20 31 17 23
要求;(1)计算众数、中位数:
1、排序形成单变量分值的频数分布和累计频数分布:
网络用户的年龄
从频数看出,众数Mo有两个:19、23;从累计频数看,中位数Me=23。
(2)根据定义公式计算四分位数。
Q1位置=25/4=6.25,因此Q1=19,Q3位置=3×25/4=18.75,因此Q3=27,或者,由于25
和27都只有一个,因此Q3也可等于25+0.75×2=26.5。
(3)计算平均数和标准差;Mean=24.00;Std. Deviation=6.652
(4)计算偏态系数和峰态系数:Skewness=1.080;Kurtosis=0.773
(5)对网民年龄的分布特征进行综合分析:分布,均值=24、标准差=6.652、呈右偏分布。
如需看清楚分布形态,需要进行分组。
为分组情况下的直方图:
为分组情况下的概率密度曲线:分组:
1、确定组数:
()
lg25
lg() 1.398
111 5.64
lg(2)lg20.30103
n
K=+=+=+=,取k=6
2、确定组距:组距=( 最大值- 最小值)÷组数=(41-15)÷6=4.3,取5
3、分组频数表
网络用户的年龄(Binned)
分组后的均值与方差:
Kurtosis
1.302
分组后的直方图:
组中值
F r e q u e n c y
4.11 对10名成年人和10名幼儿的身高进行抽样调查,结果如下: 成年组 166 169 l72 177 180 170 172 174 168 173 幼儿组
68 69 68 70 7l 73 72 73 74 75
要求:(1)如果比较成年组和幼儿组的身高差异,你会采用什么样的统计量?为什么? 均值不相等,用离散系数衡量身高差异。
(2)比较分析哪一组的身高差异大?
成年组
幼儿组
平均 172.1 平均 71.3 标准差 4.201851 标准差 2.496664 离散系数
0.024415 离散系数
0.035016
幼儿组的身高差异大。
7.6利用下面的信息,构建总体均值µ的置信区间:
1)
总体服从正态分布,且已知σ =
500,n = 15, =8900,置信水平为95%。
解: N=15,为小样本正态分布,但σ已知。
则1-α=95%,。
其置信区间公式为 ∴置信区间为:8900±1.96×500÷√15=(8646.7 , 9153.2)
2)
总体不服从正态分布,且已知σ = 500,n = 35,
=8900,置信水平为95%。
解:为大样本总体非正态分布,但σ已知。
则1-α=95%,。
其置信区间公式为 2
α()
28.109,44.10192.336.10525
10
96.136.1052=±=⨯±=±n
z x σ
αx x 2
α()
28.109,44.10192.336.10525
1096.136.1052=±=⨯±=±n
z x σ
α
∴置信区间为:8900±1.96×500÷√35=(8733.9 9066.1)7.9某居民小区为研究职工上班从家里到单位的距离,抽取了由16个人组成的一个随机样本,他们到单位的距离分别是:10,3,14,8,6,9,12,11,7,5,10,15,9,16,13,2。
假设总体服从正态分布,求职工上班从家里到单位平均距离的95%的置信区间。
解:小样本正态分布,σ未知。
已知,n = 16,,则, α/2=0.025,查自由度为n-1 = 15的分布表得临界值
2.14
样本均值=150/16=9.375
再求样本标准差:= √253.75/15 ≈4.11
于是 , 的置信水平为的置信区间是
,
9.375±2.14×4.11÷√16 即(7.18,11.57)
8.5某种大量生产的袋装食品,按规定不得少于250克。
今从一批该食品中任意抽取50袋,发现有6袋低于250克。
若规定不符合标准的比例超过5%就不得出厂,问该批食品能否出厂(α=0.05)?
解:已知N=50,P=6/50=0.12,为大样本,右侧检验,用Z统计量计算。
α=0.05,即Zα=1.645
H0:丌≤5%
H 1:丌>5%
= (0.12-0.05)/√(0.05×0.95÷50)≈2.26
(因为没有找到丌表示的公式,这里用P 0表示丌0)
结论:因为Z 值落入拒绝域,所以在α=0.05的显著性水平上,拒绝H 0,而接受H 1。
决策:有证据表明该批食品合格率不符合标准,不能出厂。
8.6某厂家在广告中声称,该厂生产的汽车轮胎在正常行驶条件下超过目前的平均水平25000公里。
对一个由15个轮胎组成的随机样本做了试验,得到样本均值和标准差分别为27000公里和5000公里。
假定轮胎寿命服从正态分布,问该厂家的广告是否真实(α=0.05)? 解:N=15, =27000,s=5000,小样本正态分布,σ未知,用t 统计量计算。
这里是右侧检验,α=0.05,自由度N-1=14,即t α=1.77
H 0:μ0 ≤25000 H 1:μ >25000
= (27000-25000)/(5000÷√15)≈1.55
结论:因为t 值落入接受域,所以接受H 0 ,拒绝H 1。
决策:有证据表明,该厂家生产的轮胎在正常行驶条件下使用寿
命与目前平均水平25000公里无显著性差异,该厂家广告不真实。
9.1欲研究不同收入群体对某种特定商品是否有相同的购买习惯,市场研究人员调查了四个不同收入组的消费者共527人,购买习惯分
0)
1,0(~)1(000
N n P P P p z --=
- = n
s x t μ0
为:经常购买,不购买,有时购买。
调查结果如下表所示。
项目低收入组偏低收入组偏高收入组高收入组
经常购买不经常购买有时购买25
69
36
40
51
26
47
74
19
46
57
37
要求:
⑴提出假设
⑵计算x2值
⑶以a=0.1的显著性水平进行检验
解:
⑴假设 H0 : u1=u2=u3=u4 (有相同的购物习惯) H1 : u1、u2、u3、u3不全相等(无相同的购物习惯)⑵
根据公式算出对应的期望值f e,结果如下表:
利用excel算出 x2 = 17.5544
⑶自由度 = (R - 1)(r - 1)=(3 - 1)(4 - 1)= 6
a=0.1, 由附录表查得:
x20.1(6)=10.6446
拒绝域为:(10.6446,+∞)
由于x2>x2a,故拒绝原假设H0,即认为不同收入群体对某种特定商品,没有相同的购买习惯。