当前位置：文档之家› 统计学课后习题答案 (第四版) 贾俊平

统计学课后习题答案 (第四版) 贾俊平

《统计学》第四版第四章练习题答案4.1 （1）众数：M 0=10; 中位数：中位数位置=n+1/2=5.5，M e =10；平均数：6.91096===∑nxx i(2)Q L 位置=n/4=2.5, Q L =4+7/2=5.5；Q U 位置=3n/4=7.5，Q U =12 （3） 2.494.1561)(2==-=∑-n i s x x （4）由于平均数小于中位数和众数，所以汽车销售量为左偏分布。

4.2 （1）从表中数据可以看出，年龄出现频数最多的是19和23，故有个众数，即M 0=19和M 0=23。

将原始数据排序后，计算中位数的位置为：中位数位置= n+1/2=13，第13个位置上的数值为23，所以中位数为M e =23（2）Q L 位置=n/4=6.25, Q L ==19；Q U 位置=3n/4=18.75，Q U =26.5(3)平均数600/25=24,标准差==∑nx x i65.612510621)(2=-=-=∑-n i s x x （4）偏态系数SK=1.08，峰态系数K=0.77（5）分析：从众数、中位数和平均数来看，网民年龄在23-24岁的人数占多数。

由于标准差较大，说明网民年龄之间有较大差异。

从偏态系数来看，年龄分布为右偏，由于偏态系数大于1，所以，偏斜程度很大。

由于峰态系数为正值，所以为尖峰分布。

4.3 （1）茎叶图如下：茎叶频数 5 6 75 6 7 8 1 3 4 8 81 3 5（2）63/9=7, ==∑nx x i714.0808.41)(2==-=∑-n i s x x （3）由于两种排队方式的平均数不同，所以用离散系数进行比较。

第一种排队方式：v 1=1.97/7.2=0.274;v 2=0.714/7=0.102.由于v 1＞v 2，表明第一种排队方式的离散程度大于第二种排队方式。

（4）选方法二，因为第二种排队方式的平均等待时间较短，且离散程度小于第一种排队方式。

4.4 （1）8223/30=274.1==∑nx x i中位数位置=n+1/2=15.5，M e =272+273/2=272.5（2）Q L 位置=n/4=7.5, Q L ==(258+261)/2=259.5；Q U 位置=3n/4=22.5，Q U =(284+291)/2=287.5(3)17.211307.130021)(2=-=-=∑-n i s x x 4.5 （1）甲企业的平均成本=总成本/总产量=41.193406600301500203000152100150030002100==++++乙企业的平均成本=总成本/总产量=29.183426255301500201500153255150015003255==++++原因：尽管两个企业的单位成本相同，但单位成本较低的产品在乙企业的产量中所占比重较大，因此拉低了总平均成本。

4.6 （1）(计算过程中的表略)，51200/120=426.67==∑nM x f ii48.11611207.16146661)(2=-=-=∑-n f i s ix M SK=0.203 K=-0.6884.7 (1)两位调查人员所得到的平均身高应该差不多相同，因为均值的大小基本上不受样本大小的影响。

（2）两位调查人员所得到身高的标准差应该差不多相同，因为标准差的大小基本上不受样本大小的影响。

（3）具有较大样本的调查人员有更大的机会取得最高或最低者，因为样本越大，变化的范围就可能越大。

4.8 （1）要比较男女学生体重的离散程度应该采用离散系数。

女生体重的离散系数为v 女=5/50=0.1，男生体重的离散系数为v 男=5/60=0.08,所以女生的体重差异大。

（2）男生：60×2.2=132（磅），s=5×2.2=11（磅）=x 女生：50×2.2=110（磅），s=5×2.2=11（磅）=x （3）假定体重为对称分布，根据经验法则，在平均数加减1个标准差范围内的数据个数大约为68%。

因此，男生中大约有68%的人体重在55kg-65kg 之间。

（4）假定体重为对称分布，根据经验法则，在平均数加减2个标准差范围内的数据个数大约为95%。

因此，男生中大约有95%的人体重在40kg-60kg 之间。

4.9 通过计算标准分数来判断：;115100115=-=-=A A A A s x x z ;150400425=-=-=B B B Bs x x z该测试者在A 项测试中比平均分数高出1个标准差，而在B 项测试中只高出平均分数0.5个标准差，由于A 项测试的标准分数高于B 项测试，所以，A 项测试比较理想。

4.9 通过标准分数来判断，各天的标准分数如下表：日期周一周二周三周四周五周六周日标准分数Z 3 -0.6 -0.2 0.4 -1.8 -2.2 0周一和周六两天失去了控制。

4.11（1）应该采用离散系数，因为它消除了不同组数据水平高低的影响。

（2）成年组身高的离散系数： 024.01.1722.4==s v 幼儿组身高的离散系数： 035.03.715.2==s v 由于幼儿组身高的离散系数大于成年组身高的离散系数，说明幼儿组身高的离散程度相对较大。

4.12（1）应该从平均数和标准差两个方面进行评价。

在对各种方法的离散程度进行比较时，应该采用离散系数。

（2从三种方法的集中趋势来看，方法A 的平均产量最高，中位数和众数也都高于其他两种方法。

从离散程度来看，三种方法的离散系数分别为：，013.0.61653.12A ==v ，。

方法A 的离散程度最小，因此，应选择方014.0.731285.71B ==v 022.0.53125.772C ==v 法A 。

4.13（1）用方差或标准差来评价投资的风险。

（2）从直方图可以看出，商业类股票收益率的离散程度较小，说明投资风险也就较小。

（3）从投资风险角度看，应该选择风险较小的商业类股票。

当然，选择哪类股票还与投资者的主观判断有很大关系。

第五章练习题答案5.1 （1）平均分数是范围在0-100之间的连续变量，Ω=[0,100] (2)已经遇到的绿灯次数是从0开始的任意自然数，Ω=N（3）之前生产的产品中可能无次品也可能有任意多个次品，Ω=[10,11,12,13…….]5.2 设订日报的集合为A ，订晚报的集合为B ，至少订一种报的集合为A ∪B ，同时订两种报的集合为A ∩B 。

P(A ∩B)=P(A)+ P(B)-P(A ∪B)=0.5+0.65-0.85=0.35.3 P(A ∪B)=1/3，P(A ∩)=1/9, P(B)= P(A ∪B)- P(A ∩)=2/9 B B 5.4 P(AB)= P(B)P(A ∣B)=1/3*1/6=1/18 P(∪)=P()=1- P(AB)=17/18A B B AP()=1- P(B)=2/3B P()=P()+ P()- P(∪)=7/18 A B A B A B P(∣)= P()/P()=7/12A B B A B 5.5 设甲发芽为事件A ，乙发芽为事件B 。

（1）由于是两批种子，所以两个事件相互独立，所以有：P(AB)= P(B)P(B)=0.56 （2）P(A ∪B)=P(A)+P(B)-P(A ∩B)=0.94（3）P(A )+ P(B )= P(A)P()+P(B)P()=0.38B A B A 5.6 设合格为事件A ，合格品中一级品为事件B P(AB)= P(A)P(B ∣A)=0.96*0.75=0.725.7 设前5000小时未坏为事件A ，后5000小时未坏为事件B 。

P(A)=1/3，P(AB)=1/2, P(B ∣A)= P(AB)/ P(A)=2/35.8 设职工文化程度小学为事件A ，职工文化程度初中为事件B ，职工文化程度高中为事件C ，职工年龄25岁以下为事件D 。

P(A)=0.1 P(B)=0.5, P(C)=0.4P(D ∣A)=0.2, P(D ∣B)=0.5, P(D ∣C)=0.7 P(A ∣D)=2/55)C P(C)P(D )B P(B)P(D )A P(A)P(D )A P(A)P(D =++同理P(B ∣D)=5/11, P(C ∣D)=28/55 5.9 设次品为D ，由贝叶斯公式有： P(A ∣D)==0.249)C P(C)P(D )B P(B)P(D )A P(A)P(D )A P(A)P(D ++同理P(B ∣D)=0.1125.10 由二项式分布可得：P （x=0）=0.25, P （x=1）=0.5, P （x=2）=0.25 5.11 (1) P （x=100）=0.001, P （x=10）=0.01, P （x=1）=0.2, P （x=0）=0.789 （2）E(X)=100*0.001+10*0.01+1*0.2=0.45.13 答对至少四道题包含两种情况，对四道错一道，对五道。

C 54C 65=1/64 +（）（43414）（4155.14 由泊松分布的性质有： P （X=1）=，P （X=2）=，可得=2λλ-e!22λλ-e λP （X=4）=2/3e5.1511)!()!1(k)P(X 1)k P(X 1=+=∙+==+=+k k k k k λλλ所以，当k=-1和k=时P （x=k ）最大。

λλ5.16 （1）P(＞2)= P(x ＞2)+ P(x ＜-2)=(0.5)+1-(2.5)=0.6977 x φφ由于N （3,4）关于均值3对称，所以P （x ＞3）=0.55.17 P(120＜x ＜200)=P （8.00140240160-x ≥-=〈（σφσσ，9.040≥（σφ27.398≤σ5.18 （1） 9332.0)5.1()203020200()230(==≤-=≤φx P x P （2） 383.01)5.0(2201020200()210190(=-=≤-=≤≤φx P x P 第七章练习题参考答案7.1 （1）已知=5，n=40，=25，=0.05，=1.96σx αz205.0 样本均值的抽样标准差==σxnσ79.0405= （2）估计误差（也称为边际误差）E==1.96*0.79=1.55z 2αnσ7.2（1）已知=15，n=49，=120，=0.05，=1.96σx αz205.0（2）样本均值的抽样标准差==2.14σxnσ=4915估计误差E==1.96*4.2z αnσ=4915（3）由于总体标准差已知，所以总体均值的95%的置信区间为： μ =120 1.96*2.14=120 4.2，即（115.8,124.2）nx z σα2±±±7.3（1）已知=85414，n=100，=104560，=0.05，=1.96σx αz205.0由于总体标准差已知，所以总体均值的95%的置信区间为： μ =104560 1.96*10456016741.144即（87818.856,121301.144）nx z σα2±±=10085414±7.4（1）已知n=100，=81，s=12，=0.1，=1.645x αz 1.0由于n=100为大样本，所以总体均值的90%的置信区间为：μ=81 1.645*81 1.974，即（79.026,82.974）ns x z 2α±±=10012±（2）已知=0.05，=1.96αz205.0由于n=100为大样本，所以总体均值的95%的置信区间为：μ=81 1.96*81 2.352，即（78.648,83.352）ns x z 2α±±=10012±（3）已知=0.01，=2.58αz01.0由于n=100为大样本，所以总体均值的99%的置信区间为：μ=81 2.58*81 3.096，即（77.94,84.096）ns x z 2α±±=10012±7.5（1）已知=3.5，n=60，=25，=0.05，=1.96σx αz205.0由于总体标准差已知，所以总体均值的95%的置信区间为： μ =25 1.96*250.89,即（24.11,25.89）nx z σα2±±=60.53±（2）已知n=75，=119.6，s=23.89，=0.02，=2.33x αz 202.0由于n=75为大样本，所以总体均值的98%的置信区间为：μ=119.6 2.33*119.6 6.43，即（113.17,126.03）ns x z 2α±±=759.823±（3）已知=3.419，s=0.974，n=32，=0.1，=1.645x αz1.0由于n=32为大样本，所以总体均值的90%的置信区间为：μ=3.419 1.645*3.4190.283，即（3.136,3.702）ns x z 2α±±=3274.90±7.6（1）已知：总体服从正态分布，=500，n=15，=8900，=0.05，=1.96σx αz05.0由于总体服从正态分布，所以总体均值的95%的置信区间为：μ=8900 1.96*8900253.03,即（8646.97,9153.03）nx z σα±±=15500±(2)已知：总体不服从正态分布，=500，n=35，=8900，=0.05，=1.96σx αz05.0虽然总体不服从正态分布，但由于n=35为大样本，所以总体均值的95%的置信区间为：μ=8900 1.96*8900165.65,即（8734.35,9065.65）nx z σα±±=35500±（3）已知：总体不服从正态分布，未知， n=35，=8900，s=500， =0.1，σx αz 21.0=1.645虽然总体不服从正态分布，但由于n=35为大样本，所以总体均值的90%的置信区间为：μ=8900 1.645*8900139.03，即（8760.97,9039.03）ns x z 2α±±=35500±（4）已知：总体不服从正态分布，未知， n=35，=8900，s=500， =0.01，σx αz 201.0=2.58虽然总体不服从正态分布，但由于n=35为大样本，所以总体均值的99%的置信区间为：μ=8900 2.58*8900218.05，即（8681.95,9118.05）ns x z 2α±±=35500±7.7 已知：n=36，当=0.1，0.05,0.01时，相应的=1.645，=1.96，=2.58αz1.0z205.0z201.0根据样本数据计算得：=3.32，s=1.61x 由于n=36为大样本，所以平均上网时间的90%置信区间为：=3.32 1.645*3.320.44，即（2.88,3.76）ns x z 2α±±=361.61±平均上网时间的95%置信区间为：=3.32 1.96*3.320.53，即（2.79,3.85）ns x z 2α±±=361.61±平均上网时间的99%置信区间为：=3.32 2.58*3.320.69，即（2.63,4.01）ns x z 2α±±=361.61±7.8 已知：总体服从正态分布，但未知，n=8为小样本，=0.05，=2.365σα）（18t205.0-根据样本数据计算得：=10，s=3.46x总体均值的95%的置信区间为：μ=10 2.365*10 2.89，即（7.11,12.89）ns x t 2α±±=83.46±7.9 已知：总体服从正态分布，但未知，n=16为小样本，=0.05，=2.131σα）（116t205.0-根据样本数据计算得：=9.375，s=4.113x 从家里到单位平均距离的95%的置信区间为：=9.375 2.131*9.375 2.191,即（7.18,11.57）ns x t 2α±±=144.113±7.10 （1）已知：n=36，=149.5，=0.05，=1.96x αz205.0由于n=36为大样本，所以零件平均长度的95%的置信区间为：=149.5 1.96*149.50.63,即（148.87,150.13）ns x z α±±=361.93±（2）在上面的估计中，使用了统计中的中心极限定理。

e商务文档

统计学课后习题答案 (第四版) 贾俊平

相关文档推荐：