当前位置:文档之家› 应用数理统计课后习题参考答案

应用数理统计课后习题参考答案

习题五1 某钢厂检查一月上旬内的五天中生产的钢锭重量,结果如下:(单位:k g)日期重旦量1 5500 5800 5740 57102 5440 5680 5240 56004 5400 5410 5430 54009 5640 5700 5660 570010 5610 5700 5610 5400试检验不同日期生产的钢锭的平均重量有无显著差异? ( =0.05)解根据问题,因素A表示日期,试验指标为钢锭重量,水平为 5.2假设样本观测值y j(j 123,4)来源于正态总体Y~N(i, ),i 1,2,...,5检验的问题:H。

:i 2 L 5, H i : i不全相等.计算结果:注释当=0.001表示非常显著,标记为*** '类似地,=0.01,0.05,分别标记为查表F0.95(4,15) 3.06,因为F 3.9496 F0.95(4,15),或p = 0.02199<0.05 ,所以拒绝H。

,认为不同日期生产的钢锭的平均重量有显著差异2 考察四种不同催化剂对某一化工产品的得率的影响,在四种不同催化剂下分别做试验解根据问题,设因素A表示催化剂,试验指标为化工产品的得率,水平为 4 .2假设样本观测值y j(j 1,2,..., nJ来源于正态总体Y~N(i, ), i 1,2,...,5 .其中样本容量不等,n分别取值为6,5,3,4 .日产量操作工查表 F O .95(3,14) 3.34,因为 F 2.4264 F °.95(3,14),或 p = 0.1089 > 0.05, 所以接受H 。

,认为在四种不同催化剂下平均得率无显著差异3试验某种钢的冲击值(kg Xm/cm2 ),影响该指标的因素有两个,一是含铜量 A ,另一个是温度试检验含铜量和试验温度是否会对钢的冲击值产生显著差异? ( =0.05 )解 根据问题,这是一个双因素无重复试验的问题,不考虑交互作用设因素A,B 分别表示为含铜量和温度,试验指标为钢的冲击力,水平为 12.2假设样本观测值y j (i 1,2,3, j 1,2,3,4)来源于正态总体 Y j ~N (j ,),i 1,2,3,j 1,2,3,4 .记i 为对应于A 的主效应;记 j 为对应于B j 的主效应;检验的问题:(1) H i 。

: i 全部等于零,H i — i 不全等于零;(2) H 20 : j 全部等于零,H 21: j 不全等于零;计算结果:查表F 0.95(2,6) 5.143 ,局.95(3,6) 4.757 ,显然计算值F A , F B 分别大于查表值, 或p = 0.0005 , 0.0009均显著小于0.05,所以拒绝H i°,H 20,认为含铜量和试验温度 都会对钢的冲击值产生显著影响作用.4 下面记录了三位操作工分别在四台不同的机器上操作三天的日产量:检验的问题:H 0: 1计算结果:H i : i 不全相等设每个工人在每台机器上的日产量都服从正态分布且方差相同•试检验:(=0.05 )1) 操作工之间的差异是否显著?2) 机器之间的差异是否显著?3) 它们的交互作用是否显著?解根据问题,这是一个双因素等重复(3次)试验的问题,要考虑交互作用.设因素A,B分别表示为机器和操作,试验指标为日产量,水平为12.假设样本观测值y jk (i 1,2,3, j 1,2,3, 4)来源于正态总体2Y j ~N( ij, ),i 1,2,3, j 1,2,3,4,k 1,2,3 .记i 为对应于A 的主效应;记j为对应于B j的主效应;记j为对应于交互作用A B的主效应;检验的冋题:(1) H10 :i全部等于零,H11 : i 不全等于零;(2) H 20 :j全部等于零,H21: j不全等于零;(3) H 30 :j全部等于零,H 31 : ij j不全等于零;计算结果:表5.4双因素无重复试验的方差分析表方差来源自由度平方和均方F值P值因素A 3 2.750 0.917 0.5323 0.6645 因素B 2 27.167 13.583 7.8871 0.00233** 相互效应AXB 6 73.5 12.250 7.1129 0.00192** 误差24 41.333 1.722总和35 144.75查表F O.95(3,24) 3.01,F O.95(2,24) 3.4,F0.95(6,24) 2.51,计算值F A 3.01,F B 3.4, F A B 2.51,或p A 0.05,而p B, p A B均显著小于0.05,所以拒绝H20,H30,接受He,认为操作工之间的差异显著,机器之间的差异不显著,它们之间的交互作用显著.5试填好正交试验结果分析表并对试验结果进行直观分析和方差分析解根据题意,这是一个3因素2水平的试验问题.试验指标为硬度的合格率•应选择正交表L4(24 )来安排试验,随机生成正交试验表如下:由此可见第三号试验条件为:上升温度800 C、保温时间6h、出炉温度500 C .直观分析需要计算K值,计算结果如下:直观分析由计算的K值知,因素A、B、C的极差分别为70,40,40,因此主次关系为A B C,B,C相当.由于试验指标为硬度的合格率,应该是越大越好,所以各确定因素的水平分别是A,B2,C I,即最佳的水平组合是AB2C1,即最佳搭配为:上升温度800 C、保温时间8h、出炉温度400 C .采用方差分析法,计算得下表:表5.7 方差分析表方差来源平方和自由度均方差F值A 1225 1 1225 1B400 1 400 0.33C 400 1 400 0.33误差1225 1 1225总和3250 4如果显著性检验水平取0.1 ,则查表得F°.9(1,1) 39.9 ,显然计算的F值F A 1,F B F C0.33均小于查表值,所以认为三个因素对结果影响都显著问应选用哪张正交表安排试验,并写出第8号试验的条件;如果9组试验结果为(单位:kg/100m ): 62.925,57.075, 51.6,55.05,58.05,56.55,63.225,50.7,54.45,试对该正交试验结果进行直观分析和方差分析.解该问题属于3因素3水平的试验问题,试验指标为水稻产量.根据题意应选择正交表L g(34)来安排试验,随机生成正交表如下:由表可知,第8号试验的条件:品种(A3)珍珠矮11号,插值密度(B2)3.75棵/100m2施肥量(C1)0.75kg/100m 纯氨;直观分析需要计算K值,计算结果如下:同上题进行直观分析,得出K值的大小关系为:Ku K13 K 12,K21 K22 K23,K33 K31 K32由直观分析看出:本例较好的水平搭配是:AB1C3采用方差分析法,计算得下表:表5.10 方差分析表方差来源平方和自由度均方差F值A 1.759 2 0.879 0.0223B 65.861 2 32.931 0.8361C 6.660 2 3.330 0.0845误差78.776 2 39.388 39.388 F O.9(2, 2)9,所以认为三个因素对结果影响都不显著7在阿魏酸的合成工艺考察中,为了提高产量,选取了原料配比A,吡啶量B和反应时间C三个因素,它们各取了7个水平如下:原料配比A:1.0,,1.8, 2.2, 2.6, 3.0,3.4吡啶量B::10,13,16,19,22,25,28反应时间C:0.5,,1.5, 2.0, 2.5, 3.0,3.5试选用合适的均匀设计表安排试验,并写出第7号试验的条件;如果7组试验的结果(收率)为:0.33,0.336,0.294, 0.476, 0.209,0.451,0.482,试对该均匀试验结果进行直观分析并通过回归分析发现可能更好的工艺条件解根据题意选择均匀设计表U7(74)来安排试验,有3个因素,根据使用表,实验安排如:66 5 4 0.4517 7 7 7 0.482通过直观分析,最好的实验条件是:原配料比 3.4,吡啶量28ml,反应时间3.5h.通过回归分析,最合适的实验条件是:原配料比 2.6,吡啶量16ml,反应时间0.5h.习题六1从某中学高二女生中随机选取8名,测得其升高、体重如下:1 8 23 4 567身高160 159 160 157 169 162 165(cm)154体重(kg)49 46 53 41 49 50 4843在绝对距离下,试用最短距离法和离差平方和法对其进行聚类分析解由R软件,用最短距离(左)和差离平方和法(右)对题目进行聚类分析如下图 6.1, 表6.1和表6.2 :图6.1聚类树形图表聚类附表最短距离法步骤聚类合并系数首次岀现的阶段类别下一步组1 组2 组1 组21 1 6 5.000 0 0 22 1 2 10.000 1 0 43 4 8 13.000 0 0 74 1 7 13.000 2 0 55 1 3 13.000 4 0 66 1 5 17.000 5 0 7最短距离法离差平方和法2已知五个变量的距离矩阵为0 3 6 7 4 0 1 2 3 4 0 4 4 4 40 1 5 90 23 43 3 31). 0 36;2) 0 3 4 ;3) 0 2 20 2 0 4 0 10 0 0试用最短距离法和最长距离法对这些变量进行聚类,并画出聚类图和二分树解针对距离矩阵1),采用两种方法计算如下①最短距离法的聚类步骤如下:W i w W3 W4 W50 3 6 7 40 15 90 3 60 2a )将W2, W3合并为一类,f h6 1,H1W-!,W4, W5, h s ,距离矩阵如下0 7 4 30 2 30 6b) W4,W5 合并为一类,h7 W4,W5 ,f h7 2H2W-I, h s ,h7,距离矩阵如下:c) w i,hs合并为一类,h s w,h s ,f h s 3,最后f h9 3,聚类图和树状图如图 6.2:h8 h9h71 2 3 4 5X2 [ 31h64图6.2聚类图(左)与树状图1②最长距离法与最短距离法类似,步骤如下:a) W2, W3合并为一类,f h6 1H i W i,W4,W5,h6 ,距离矩阵如下b) H2 W4,W5合并为一类,h7W4, W5 , f h7 W i,h3,h y , 距离矩阵如下:c) W i,h6合并为一类, h8 最后f h g 9,聚类图和树状图如图6.3:9 —6_ 2 —1h9h8h64 5 11232图6.3聚类图(左)与树状图(右)h7/\50 1 23 40 23 40 3 40 4①最短距离法的聚类步骤如下a ) W 2,w 合并为一类,f h 6 1(2)针对距离矩阵2),距离矩阵如下H iW 3,W 4,W 5,% 0 3 40 40 2 3 4 0b) w 3, h 6合并为一类,g W 3,h 6 ,f h 7H 2w t ,W 5,h 6,h 7 ,聚类矩阵如下:c) w 4, hz合并为一类, h 8 W 4,hz , f h g3,最后h g W 3,hz , f hg 4聚类图和树状图如图6.4: h9Z\43 — 2 — 11 1111 2 1 ____ 1 __345图6.4聚类图(左)与树状图(右)②由于本题数据的特殊性,最长距离法与最短距离法结果相同(略)120 4 4 4 40 3 3 30 2 20 1最短距离法的聚类步骤如下a) ww合并为一类,f h6 1H i W|,w2 , w3, h e ,距离矩阵如下0 4 4 40 3 30 2b) W3,h6合并为一类,h? W3, h6 , f h? 2H2 w4,w5,h6,h7 ,距离矩阵如下:0 4 40 3c) w t,h7合并为一类,h8 w4,h7, f h s 3,最后h9 w8, h? , f h9 4,聚类图和树状图如图6.5:4n I3卜---------------- -----2- , |--------- L-1」 1 ___ [ r1 2 3 4图6.5聚类图(左)与树状图(右)由于本题数据的特殊性,最长距离法与最短距离法结果相同(略).3在一项关于作物对土壤营养的反应的研究中,要测定土壤的总磷量和总氮量(占干物质重的百分比),今对10份土样测得数据如下:总氮量(%)0.120.63 1.19 2.30 1.29 0.73 0.52 0.33 0.61 0.470.66在绝对距离下,试用重心法对其进行聚类分析解由R软件得到重心法聚类分析的结果如图 6.6与表6.3:图6.6聚类树形图4 1975年Dagnelie收集了11年的气象数据资料如下表1 87.9 19.6 1.0 16612 89.9 15.2 90.1 9683 153.0 19.7 56.6 13534 132.1 17.0 91.0 12935 88.8 18.3 93.7 11536 220.9 17.8 106.9 12867 117.7 17.8 65.5 11048 109.0 18.3 41.8 15749 156.1 17.8 57.4 122210 181.5 16.8 140.6 902181.4 17.0 74.3 115011其中:X1 —前一年11月12日的降水量;X2—7月均温;X3—7月降雨量;X4—月日辐射,试对这四个气象因子进行主成分分析•解由R软件分析得到如下表6.4,6.5:表6.4各主成分的重要性主成分1 主成分2 主成分3 主成分4 标准差 1.6103349 0.9890848 0.53407741 0.37854199方差贡献率0.6482947 0.2445722 0.07130967 0.03582351累积贡献率0.6482947 0.8928668 0.96417649 1.00000000表6.5 因子荷载:主成分1 主成分2 主成分3 主成分4 X1 0.291 0.871 0.332 -0.214X2 -0.506 0.425 -0.742 -0.111X3 0.577 0.136 -0.418 0.688X4 -0.571 0.205 0.404 0.685由于前两个主成分对应的累积贡献率已经达到89.287,因此选取主成分的数目为 2.5对某初中12岁的女生进行体检,测量其身高x i、体重X2、胸围X3和坐高X4,共测得58个样本,并算得x (x-i,x2, X3,x4)的样本协方差为19.9410.50 23.56S6.59 19.71 20.958.63 7.97 3.93 7.55试进行样本主成分分析解首先计算样本的相关系数矩阵:10.4844 10.3224 0.8872 10.7033 0.5976 0.3125 1设相关系数矩阵的特征值和特征向量分别为d和v阵,计算得到0.0546 0 0 00 0.3126 0 0d =0 0 0.9647 00 0 0 2.6681即四个特征值依次为: 2.6681,0.9647,0.3126,0.0546,前两个主成分的累计贡献率为:90.8471%,因此提取主成分为2•四个特征根相应的特征向量为0.0600 0.7060 0.5333 0.46200.7317 0.1743 0.3404 0.5642v 一0.6057 0.1932 0.6040 0.48060.3069 0.6587 0.4846 0.4870因此,两个主成分的表达式为:z-i 0.06x10.7317X2 0.6057 x3 0.3069 x4Z2 0.706x1 0.1743x2 0.1932x3 0.6587x46比较因子分析和主成分分析模型的异同,阐明两者的关系解(1)提取公因子的方法主要有主成分法和公因子法•若采取主成分法,则主成分分析和因子分析基本等价,该法从解释变量的变异的角度出发,尽量使变量的方差能被主成分解释;而公因子法主要从解释变量的相关性角度,尽量使变量的相关程度能被公因子解释,当因子分析目的重在确定结构时则用到该法.(2)主成分分析和因子分析都是在多个原始变量中通过他们之间的内部相关性来获得新的变量,达到既减少分析指标个数,又能概括原始指标主要信息的目的.但他们各有其特点:主成分分析是将n个原始变量提取m个支配原始变量的公因子,和1个特殊因子,各因子之间可以相关或不相关•(3)统用降维的方法,但差异也很明显:主成分分析把方差划分为不同的正交成分,而因子分析则把方差化分为不同的起因因子;因子分析中的特征值的计算只能从相关系数矩阵出发,且必须把主成分划分为因子.(4)因子分析提取的公因子比主成分分析提取的主成分更具有可解释性(5)两者分析的实质及重点不同•主成分的数学模型为Y AX,因子分析的数学模型为X AF •因而可知主成分分析是实际上是线性变换,无假设检验,而因子分析是统计模型,某些因子模型是可以得到假设检验的;主成分分析主要综合原始数据的信息,而因子分析重在解释原始变量之间的关系•(6) SPSS 数据的实现:两者都通过 analyze ― ata reduction ―► Factor ••过程实现, 但主成分分析主要使用"descriptires ” extraction ” stores "对话框,而因子分析处使用这些外, 还可使用"rotaction "对话框进行因子旋转.7试对第4题的变量作因子分析,并将结果和上面的结果进行比较 解 用SPSS 分析,计算结果如下表 6.6-6.8 :提取方法:主成分法计算的相关系数矩阵的特征值和方差贡献率:提取方法主成分法表8为研究某一树种的叶片形态, 选取50片叶测量其长度X 1 (mm )和宽度X 2 (mm ),按样本数据求得其平均值和协方差矩阵为:90 48 X 134, X ?92, S48 45求出相关系数阵 R ,并由R 出发作因子分析;190 48 1 0.7303 S,R48 900.730312)用只软件求R 的特征根及其相应的特征向量,软件输出结果如下:$values [1] 2.99393809 0.07273809$vectors[,1] [,2][1,] 0.7071068 -0.7071068 [2,] 0.70710680.707106812.9939, 2 0.0727,3)求载荷矩阵A :1.2235 0.1907 A1.2235 0.19079 1981年,生物学家 Grogan 和Wirth 对两种蠓虫 Af 和Apf 根据其触角长度 X 1和翼长X 2解(1)建立Fisher 判别模型 1)求相关系数矩阵:(0.7071,0.7071 ),(-0.7071,0.7071 )hj 1.5333,h 21 2 1.53 33, A*0.9881 0.98810.154 0.154Ui 1,U 21,V 10.3043M 0.30432AU i 2, B 0i 12V i i 120,C 。

相关主题