当前位置:文档之家› 统计学课后习题答案 (第四版) 贾俊平

统计学课后习题答案 (第四版) 贾俊平

《统计学》第四版 第四章练习题答案4.1 (1)众数:M 0=10; 中位数:中位数位置=n+1/2=5.5,M e =10;平均数:6.91096===∑nxx i(2)Q L 位置=n/4=2.5, Q L =4+7/2=5.5;Q U 位置=3n/4=7.5,Q U =12 (3) 2.494.1561)(2==-=∑-n i s x x (4)由于平均数小于中位数和众数,所以汽车销售量为左偏分布。

4.2 (1)从表中数据可以看出,年龄出现频数最多的是19和23,故有个众数,即M 0=19和M 0=23。

将原始数据排序后,计算中位数的位置为:中位数位置= n+1/2=13,第13个位置上的数值为23,所以中位数为M e =23(2)Q L 位置=n/4=6.25, Q L ==19;Q U 位置=3n/4=18.75,Q U =26.5(3)平均数600/25=24,标准差==∑nx x i65.612510621)(2=-=-=∑-n i s x x (4)偏态系数SK=1.08,峰态系数K=0.77(5)分析:从众数、中位数和平均数来看,网民年龄在23-24岁的人数占多数。

由于标准差较大,说明网民年龄之间有较大差异。

从偏态系数来看,年龄分布为右偏,由于偏态系数大于1,所以,偏斜程度很大。

由于峰态系数为正值,所以为尖峰分布。

4.3 (1)茎叶图如下:茎 叶 频数 5 6 75 6 7 8 1 3 4 8 81 3 5(2)63/9=7, ==∑nx x i714.0808.41)(2==-=∑-n i s x x (3)由于两种排队方式的平均数不同,所以用离散系数进行比较。

第一种排队方式:v 1=1.97/7.2=0.274;v 2=0.714/7=0.102.由于v 1>v 2,表明第一种排队方式的离散程度大于第二种排队方式。

(4)选方法二,因为第二种排队方式的平均等待时间较短,且离散程度小于第一种排队方式。

4.4 (1)8223/30=274.1==∑nx x i中位数位置=n+1/2=15.5,M e =272+273/2=272.5(2)Q L 位置=n/4=7.5, Q L ==(258+261)/2=259.5;Q U 位置=3n/4=22.5,Q U =(284+291)/2=287.5(3)17.211307.130021)(2=-=-=∑-n i s x x 4.5 (1)甲企业的平均成本=总成本/总产量=41.193406600301500203000152100150030002100==++++乙企业的平均成本=总成本/总产量=29.183426255301500201500153255150015003255==++++原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。

4.6 (1)(计算过程中的表略),51200/120=426.67==∑nM x f ii48.11611207.16146661)(2=-=-=∑-n f i s ix M SK=0.203 K=-0.6884.7 (1)两位调查人员所得到的平均身高应该差不多相同,因为均值的大小基本上不受样本大小的影响。

(2)两位调查人员所得到身高的标准差应该差不多相同,因为标准差的大小基本上不受样本大小的影响。

(3)具有较大样本的调查人员有更大的机会取得最高或最低者,因为样本越大,变化的范围就可能越大。

4.8 (1)要比较男女学生体重的离散程度应该采用离散系数。

女生体重的离散系数为v 女=5/50=0.1,男生体重的离散系数为v 男=5/60=0.08,所以女生的体重差异大。

(2)男生:60×2.2=132(磅),s=5×2.2=11(磅)=x 女生:50×2.2=110(磅),s=5×2.2=11(磅)=x (3)假定体重为对称分布,根据经验法则,在平均数加减1个标准差范围内的数据个数大约为68%。

因此,男生中大约有68%的人体重在55kg-65kg 之间。

(4)假定体重为对称分布,根据经验法则,在平均数加减2个标准差范围内的数据个数大约为95%。

因此,男生中大约有95%的人体重在40kg-60kg 之间。

4.9 通过计算标准分数来判断:;115100115=-=-=A A A A s x x z ;150400425=-=-=B B B Bs x x z该测试者在A 项测试中比平均分数高出1个标准差,而在B 项测试中只高出平均分数0.5个标准差,由于A 项测试的标准分数高于B 项测试,所以,A 项测试比较理想。

4.9 通过标准分数来判断,各天的标准分数如下表:日期 周一 周二 周三 周四 周五 周六 周日 标准分数Z 3 -0.6 -0.2 0.4 -1.8 -2.2 0周一和周六两天失去了控制。

4.11(1)应该采用离散系数,因为它消除了不同组数据水平高低的影响。

(2)成年组身高的离散系数: 024.01.1722.4==s v 幼儿组身高的离散系数: 035.03.715.2==s v 由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离散程度相对较大。

4.12(1)应该从平均数和标准差两个方面进行评价。

在对各种方法的离散程度进行比较时,应该采用离散系数。

(2从三种方法的集中趋势来看,方法A 的平均产量最高,中位数和众数也都高于其他两种方法。

从离散程度来看,三种方法的离散系数分别为:,013.0.61653.12A ==v ,。

方法A 的离散程度最小,因此,应选择方014.0.731285.71B ==v 022.0.53125.772C ==v 法A 。

4.13(1)用方差或标准差来评价投资的风险。

(2)从直方图可以看出,商业类股票收益率的离散程度较小,说明投资风险也就较小。

(3)从投资风险角度看,应该选择风险较小的商业类股票。

当然,选择哪类股票还与投资者的主观判断有很大关系。

第五章练习题答案5.1 (1)平均分数是范围在0-100之间的连续变量,Ω=[0,100] (2)已经遇到的绿灯次数是从0开始的任意自然数,Ω=N(3)之前生产的产品中可能无次品也可能有任意多个次品,Ω=[10,11,12,13…….]5.2 设订日报的集合为A ,订晚报的集合为B ,至少订一种报的集合为A ∪B ,同时订两种报的集合为A ∩B 。

P(A ∩B)=P(A)+ P(B)-P(A ∪B)=0.5+0.65-0.85=0.35.3 P(A ∪B)=1/3,P(A ∩)=1/9, P(B)= P(A ∪B)- P(A ∩)=2/9 B B 5.4 P(AB)= P(B)P(A ∣B)=1/3*1/6=1/18 P(∪)=P()=1- P(AB)=17/18A B B AP()=1- P(B)=2/3B P()=P()+ P()- P(∪)=7/18 A B A B A B P(∣)= P()/P()=7/12A B B A B 5.5 设甲发芽为事件A ,乙发芽为事件B 。

(1)由于是两批种子,所以两个事件相互独立,所以有:P(AB)= P(B)P(B)=0.56 (2)P(A ∪B)=P(A)+P(B)-P(A ∩B)=0.94(3)P(A )+ P(B )= P(A)P()+P(B)P()=0.38B A B A 5.6 设合格为事件A ,合格品中一级品为事件B P(AB)= P(A)P(B ∣A)=0.96*0.75=0.725.7 设前5000小时未坏为事件A ,后5000小时未坏为事件B 。

P(A)=1/3,P(AB)=1/2, P(B ∣A)= P(AB)/ P(A)=2/35.8 设职工文化程度小学为事件A ,职工文化程度初中为事件B ,职工文化程度高中为事件C ,职工年龄25岁以下为事件D 。

P(A)=0.1 P(B)=0.5, P(C)=0.4P(D ∣A)=0.2, P(D ∣B)=0.5, P(D ∣C)=0.7 P(A ∣D)=2/55)C P(C)P(D )B P(B)P(D )A P(A)P(D )A P(A)P(D =++同理P(B ∣D)=5/11, P(C ∣D)=28/55 5.9 设次品为D ,由贝叶斯公式有: P(A ∣D)==0.249)C P(C)P(D )B P(B)P(D )A P(A)P(D )A P(A)P(D ++同理P(B ∣D)=0.1125.10 由二项式分布可得:P (x=0)=0.25, P (x=1)=0.5, P (x=2)=0.25 5.11 (1) P (x=100)=0.001, P (x=10)=0.01, P (x=1)=0.2, P (x=0)=0.789 (2)E(X)=100*0.001+10*0.01+1*0.2=0.45.13 答对至少四道题包含两种情况,对四道错一道,对五道。

C 54C 65=1/64 +()(43414)(4155.14 由泊松分布的性质有: P (X=1)=,P (X=2)=,可得=2λλ-e!22λλ-e λP (X=4)=2/3e5.1511)!()!1(k)P(X 1)k P(X 1=+=∙+==+=+k k k k k λλλ所以,当k=-1和k=时P (x=k )最大。

λλ5.16 (1)P(>2)= P(x >2)+ P(x <-2)=(0.5)+1-(2.5)=0.6977 x φφ由于N (3,4)关于均值3对称,所以P (x >3)=0.55.17 P(120<x <200)=P (8.00140240160-x ≥-=〈(σφσσ,9.040≥(σφ27.398≤σ5.18 (1) 9332.0)5.1()203020200()230(==≤-=≤φx P x P (2) 383.01)5.0(2201020200()210190(=-=≤-=≤≤φx P x P 第七章 练习题参考答案7.1 (1)已知=5,n=40,=25,=0.05,=1.96σx αz205.0 样本均值的抽样标准差==σxnσ79.0405= (2)估计误差(也称为边际误差)E==1.96*0.79=1.55z 2αnσ7.2(1)已知=15,n=49,=120,=0.05,=1.96σx αz205.0(2)样本均值的抽样标准差==2.14σxnσ=4915估计误差E==1.96*4.2z αnσ=4915(3)由于总体标准差已知,所以总体均值的95%的置信区间为: μ =120 1.96*2.14=120 4.2,即(115.8,124.2)nx z σα2±±±7.3(1)已知=85414,n=100,=104560,=0.05,=1.96σx αz205.0由于总体标准差已知,所以总体均值的95%的置信区间为: μ =104560 1.96*10456016741.144即(87818.856,121301.144)nx z σα2±±=10085414±7.4(1)已知n=100,=81,s=12,=0.1,=1.645x αz 1.0由于n=100为大样本,所以总体均值的90%的置信区间为:μ=81 1.645*81 1.974,即(79.026,82.974)ns x z 2α±±=10012±(2)已知=0.05,=1.96αz205.0由于n=100为大样本,所以总体均值的95%的置信区间为:μ=81 1.96*81 2.352,即(78.648,83.352)ns x z 2α±±=10012±(3)已知=0.01,=2.58αz01.0由于n=100为大样本,所以总体均值的99%的置信区间为:μ=81 2.58*81 3.096,即(77.94,84.096)ns x z 2α±±=10012±7.5(1)已知=3.5,n=60,=25,=0.05,=1.96σx αz205.0由于总体标准差已知,所以总体均值的95%的置信区间为: μ =25 1.96*250.89,即(24.11,25.89)nx z σα2±±=60.53±(2)已知n=75,=119.6,s=23.89,=0.02,=2.33x αz 202.0由于n=75为大样本,所以总体均值的98%的置信区间为:μ=119.6 2.33*119.6 6.43,即(113.17,126.03)ns x z 2α±±=759.823±(3)已知=3.419,s=0.974,n=32,=0.1,=1.645x αz1.0由于n=32为大样本,所以总体均值的90%的置信区间为:μ=3.419 1.645*3.4190.283,即(3.136,3.702)ns x z 2α±±=3274.90±7.6(1)已知:总体服从正态分布,=500,n=15,=8900,=0.05,=1.96σx αz05.0由于总体服从正态分布,所以总体均值的95%的置信区间为:μ=8900 1.96*8900253.03,即(8646.97,9153.03)nx z σα±±=15500±(2)已知:总体不服从正态分布,=500,n=35,=8900,=0.05,=1.96σx αz05.0虽然总体不服从正态分布,但由于n=35为大样本,所以总体均值的95%的置信区间为:μ=8900 1.96*8900165.65,即(8734.35,9065.65)nx z σα±±=35500±(3)已知:总体不服从正态分布,未知, n=35,=8900,s=500, =0.1,σx αz 21.0=1.645虽然总体不服从正态分布,但由于n=35为大样本,所以总体均值的90%的置信区间为:μ=8900 1.645*8900139.03,即(8760.97,9039.03)ns x z 2α±±=35500±(4)已知:总体不服从正态分布,未知, n=35,=8900,s=500, =0.01,σx αz 201.0=2.58虽然总体不服从正态分布,但由于n=35为大样本,所以总体均值的99%的置信区间为:μ=8900 2.58*8900218.05,即(8681.95,9118.05)ns x z 2α±±=35500±7.7 已知:n=36,当=0.1,0.05,0.01时,相应的=1.645,=1.96,=2.58αz1.0z205.0z201.0根据样本数据计算得:=3.32,s=1.61x 由于n=36为大样本,所以平均上网时间的90%置信区间为:=3.32 1.645*3.320.44,即(2.88,3.76)ns x z 2α±±=361.61±平均上网时间的95%置信区间为:=3.32 1.96*3.320.53,即(2.79,3.85)ns x z 2α±±=361.61±平均上网时间的99%置信区间为:=3.32 2.58*3.320.69,即(2.63,4.01)ns x z 2α±±=361.61±7.8 已知:总体服从正态分布,但未知,n=8为小样本,=0.05,=2.365σα)(18t205.0-根据样本数据计算得:=10,s=3.46x总体均值的95%的置信区间为:μ=10 2.365*10 2.89,即(7.11,12.89)ns x t 2α±±=83.46±7.9 已知:总体服从正态分布,但未知,n=16为小样本,=0.05,=2.131σα)(116t205.0-根据样本数据计算得:=9.375,s=4.113x 从家里到单位平均距离的95%的置信区间为:=9.375 2.131*9.375 2.191,即(7.18,11.57)ns x t 2α±±=144.113±7.10 (1)已知:n=36,=149.5,=0.05,=1.96x αz205.0由于n=36为大样本,所以零件平均长度的95%的置信区间为:=149.5 1.96*149.50.63,即(148.87,150.13)ns x z α±±=361.93±(2)在上面的估计中,使用了统计中的中心极限定理。

相关主题