附录:教材各章习题答案第1章统计与统计数据1.1(1)数值型数据;(2)分类数据;(3)数值型数据;(4)顺序数据;(5)分类数据。
1.2(1)总体是“该城市所有的职工家庭”,样本是“抽取的2000个职工家庭”;(2)城市所有职工家庭的年人均收入,抽取的“2000个家庭计算出的年人均收入。
1.3(1)所有IT从业者;(2)数值型变量;(3)分类变量;(4)观察数据。
1.4(1)总体是“所有的网上购物者”;(2)分类变量;(3)所有的网上购物者的月平均花费;(4)统计量;(5)推断统计方法。
1.5(略)。
1.6(略)。
第2章数据的图表展示2.1(1)属于顺序数据。
(2)频数分布表如下(4)帕累托图(略)。
2.2(1)频数分布表如下2.5(1)排序略。
(2)频数分布表如下(4)茎叶图如下2.6(3)食品重量的分布基本上是对称的。
2.72.8(1)属于数值型数据。
2.9 (1)直方图(略)。
(2)自学考试人员年龄的分布为右偏。
比A 班分散,且平均成绩较A 班低。
2.11 (略)。
2.12 (略)。
2.13 (略)。
2.14 (略)。
2.15 箱线图如下:(特征请读者自己分析)第3章 数据的概括性度量 3.1(1)100=M ;10=e M ;6.9=x 。
(2)5.5=L Q ;12=U Q 。
(3)2.4=s 。
(4)左偏分布。
3.2(1)190=M ;23=e M 。
(2)5.5=L Q ;12=U Q 。
(3)24=x ;65.6=s 。
(4)08.1=SK ;77.0=K 。
(5)略。
3.3 (1)略。
(2)7=x ;71.0=s 。
(3)102.01=v ;274.02=v 。
(4)选方法一,因为离散程度小。
3.4 (1)x =274.1(万元);M e=272.5 。
(2)Q L =260.25;Q U =291.25。
(3)17.21=s (万元)。
3.5 甲企业平均成本=19.41(元),乙企业平均成本=18.29(元);原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。
3.6(1)x =426.67(万元);48.116=s (万元)。
(2)203.0=SK ;688.0-=K 。
3.7 (1)(2)两位调查人员所得到的平均身高和标准差应该差不多相同,因为均值和标准差的大小基本上不受样本大小的影响。
(3)具有较大样本的调查人员有更大的机会取到最高或最低者,因为样本越大,变化的围就可能越大。
3.8 (1)女生的体重差异大,因为女生其中的离散系数为0.1大于男生体重的离散系数0.08。
(2) 男生:x =27.27(磅),27.2=s (磅); 女生:x =22.73(磅),27.2=s (磅); (3)68%;(4)95%。
3.9通过计算标准化值来判断,1=A z ,5.0=B z ,说明在A项测试中该应试者比平均分数高 出1个标准差,而在B 项测试中只高出平均分数0.5个标准差,由于A 项测试的标准化值高于B 项测试,所以A 项测试比较理想。
3.10 通过标准化值来判断,各天的标准化值如下表日期 周一 周二 周三 周四 周五 周六 周日 标准化值Z 3 -0.6 -0.2 0.4 -1.8 -2.2 0 周一和周六两天失去了控制。
3.11(1)离散系数,因为它消除了不同组数据水平高地的影响。
(2)成年组身高的离散系数:024.01.1722.4==s v ;幼儿组身高的离散系数:032.03.713.2==s v ;由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离散程度相对较大。
3.123.13 第4章 抽样与参数估计4.1 (1)200。
(2)5。
(3)正态分布。
(4))1100(2-χ。
4.2 (1)32。
(2)0.91。
4.3 0.79。
4.4 (1))2,17(~225N x 。
(2))1,17(~100N x 。
4.5 (1)1.41。
(2)1.41,1.41,1.34。
4.6 (1)0.4。
(2)0.024 。
(3)正态分布。
4.7 (1)0.050,0.035,0.022,016。
(2)当样本量增大时,样本比例的标准差越来越小。
4.8 (1)14.2=x σ;(2)E =4.2;(3)(115.8,124.2)。
4.9 (87819,121301)。
4.10 (1)81±1.97;(2)81±2.35;(3)81±3.10。
4.11 (1)(24.11,25.89);(2)(113.17,126.03);(3)(3.136,3.702) 4.12 (1)(8687,9113);(2)(8734,9066);(3)(8761,9039);(4)(8682,9118)。
4.13 (2.88,3.76);(2.80,3.84);(2.63,4.01)。
4.14 (7.1,12.9)。
4.15 (7.18,11.57)。
4.16 (1)(148.9,150.1);(2)中心极限定理。
4.17 (1)(100.9,123.7);(2)(0.017,0.183)。
4.18 (15.63,16.55)。
4.19 (10.36,16.76)。
4.20 (1)(0.316,0.704);(2)(0.777,0.863);(3)(0.456,0.504)。
4.21 (18.11%,27.89%);(17.17%,22.835)。
4.22 167。
4.23 (1)2522;(2)601;(3)268。
4.24 (1)(51.37%,76.63%);(2)36。
4.25 (1)(2.13,2.97);(2)(0.015,0.029);(3)(25.3,42.5)。
4.26 (1)(0.33,0.87);(2)(1.25,3.33);(3)第一种排队方式更好。
4.27 48。
4.28 139。
第5章 假设检验5.1 研究者想要寻找证据予以支持的假设是“新型弦线的平均抗拉强度相对于以前提高了”,所以原假设与备择假设应为:1035:0≤μH ,1035:1>μH 。
5.2 π=“某一品种的小鸡因为同类相残而导致的死亡率”,04.0:0≥πH ,04.0:1<πH 。
5.3 65:0=μH ,65:1≠μH 。
5.4 (1)第一类错误是该供应商提供的这批炸土豆片的平均重量的确大于等于60克,但检验结果却提供证据支持店方倾向于认为其重量少于60克; (2)第二类错误是该供应商提供的这批炸土豆片的平均重量其实少于60克,但检验结果却没有提供足够的证据支持店方发现这一点,从而拒收这批产品;(3)连锁店的顾客们自然看重第二类错误,而供应商更看重第一类错误。
5.5 (1)检验统计量ns x z /μ-=,在大样本情形下近似服从标准正态分布;(2)如果05.0z z >,就拒绝0H ;(3)检验统计量z =2.94>1.645,所以应该拒绝0H 。
5.6 z =3.11,拒绝0H 。
5.7 66.1=t ,不拒绝0H 。
5.8 39.2-=z ,拒绝0H 。
5.9 04.1=t ,不拒绝0H 5.1044.2=z ,拒绝0H 。
5.11 z =1.93,不拒绝0H 。
5.12 z =7.48,拒绝0H 。
5.13 2χ=206.22,拒绝0H 。
5.1442.2=F ,拒绝0H 。
第6章 方差分析6.1 0215.86574.401.0=<=F F (或01.00409.0=>=-αvalue P ),不能拒绝原假设。
6.2 579.48234.1501.0=>=F F (或01.000001.0=<=-αvalue P ),拒绝原假设。
6.3 4170.50984.1001.0=>=F F (或01.0000685.0=<=-αvalue P ),拒绝原假设。
6.4 6823.37557.1105.0=>=F F (或05.0000849.0=<=-αvalue P ),拒绝原假设。
6.5 8853.30684.1705.0=>=F F (或05.00003.0=<=-αvalue P ),拒绝原假设。
85.54.14304.44=>=-=-LSD x x B A ,拒绝原假设; 85.58.16.424.44=<=-=-LSD x x C A ,不能拒绝原假设; 85.56.126.4230=>=-=-LSD x x C B ,拒绝原假设。
6.6554131.3478.105.0=<=F F (或05.0245946.0=>=-αvalue P ),不能拒绝原假设。
第7章 相关与回归分析7.1 (1)散点图(略),产量与生产费用之间正的线性相关关系。
(2)920232.0=r 。
(3)检验统计量2281.24222.142=>=αt t ,拒绝原假设,相关系数显著。
7.2 (1)散点图(略)。
(2)8621.0=r 。
7.3 (1)0ˆβ表示当0=x 时y 的期望值。
(2)1ˆβ表示x 每变动一个单位y 平均下降0.5个单位。
(3)7)(=y E 。
7.4 (1)%902=R 。
(2)1=e s 。
7.5 (1)散点图(略)。
(2)9489.0=r 。
(3)x y 00358.01181.0ˆ+=。
回归系数00358.0ˆ1=β表示运送距离每增加1公里,运送时间平均增加0.00358天。
7.6 (1) 散点图(略)。
二者之间为高度的正线性相关关系。
(2)998128.0=r ,二者之间为高度的正线性相关关系。
(3)估计的回归方程为:x y 308683.06928.734ˆ+=。
回归系数308683.0ˆ1=β表示人均GDP 每增加1元,人均消费水平平均增加0.308683元。
(4)判定系数996259.02=R 。
表明在人均消费水平的变差中,有99.6259%是由人均GDP 决定的。
(5)检验统计量61.6692.1331=>=αF F ,拒绝原假设,线性关系显著。
(6)1078.22785000308683.06928.734ˆ5000=⨯+=y (元)。
(7)置信区间:[1990.749,2565.464];预测区间:[1580.463,2975.750]。
7.7 (1) 散点图(略),二者之间为负的线性相关关系。
(2)估计的回归方程为:x y 7.41892.430ˆ-=。
回归系数7.4ˆ1-=β表示航班正点率每增加1%,顾客投诉次数平均下降4.7次。