当前位置：文档之家› 典型例题分析

典型例题分析

典型例题-G-方差分析-2某企业准备用三种方法组装一种新的产品，为确定哪种方法每小时生产的产品数量最多，随机抽取了30名工人，并指定每个人使用其中的一种方法。

通过对每个工人生产的产品数进行方差分析，得到如下表所示的结果。

每个工人生产产品数量的方差分析表(2)若显著性水平为α=0.05，检验三种方法组装的产品数量之间是否有显著差异。

解：(1)完成方差分析表，以表格中所标的①、②、③、④、⑤、⑥为顺序，来完成表格，具体步骤如下： ①求k -1根据题目中“该企业准备用三种方法组装一种新的产品”可知，因素水平(总体)的个数k =3，所以第一自由度df 1=k -1=3-1=2，即SSA 的自由度。

②求n -k由“随机抽取了30名工人”可知，全部观测值的个数n =30，因此可以推出第二自由度df 2=n -k =30-3=27，即SSE 的自由度。

③求组间平方和SSA已知第一自由度df 1=k -1=3-1=2，MSA =210 根据公式1-==k SSAMSA 自由度组间平方和所以，SSA =MSA ×(k -1)=210×2=420④求总误差平方和SST由上面③中可以知道SSA =420；此外从表格中可以知道：组内平方和SSE =3836，根据公式SST =SSA +SSE 可以得出SST =420+3836=4256，即总误差平方和SST=4256 ⑤求SSE 的均方MSE已知组内平方和SSE =3836，SSE 的自由度n -k =30-3=27 根据公式0741.142273836==-==k n SSE MSE 自由度组内平方和所以组内均方MSE =142.0741⑥求检验统计量F已知MSA =210，MSE =142.0741 根据4781.10741.142210===MSE MSA F所以F=1.4781(2)题目中假设α=0.05，根据第一自由度df 1=k -1=3-1=2和第二自由度df 2=n -k =30-3=27，查F 分布表得到临界值F 0.05(2,27)=3.354131，所以F =1.4781<F α=3.354131，所以接受原假设，即μ1=μ2=μ3成立，表明μ1、μ2、μ3之间没有显著差异，也就是说，用三种方法组装的产品数量之间没有显著差异。

典型例题-G-方差分析-3五个地区每天发生交通事故的次数如表1所示。

由于是随机抽样，有一些地区的样本容量较多，(如南部和西部)而有些地区样本容量较少(如东部)。

试以α=0.01的显著性水平检验各地区平均每天交通事故的次数是否相等。

解：计算原数据的和：以及原数据的平方和：()()∑∑===++++-++++=-=rj nji ij x n x SST 112226538.2006755646657261771539834898831()0167.1186676555645664577715398348988312222221112=⎪⎪⎭⎫⎝⎛++++-++++=-=∑∑∑===jrj nji rj j ijx n x SSE6371.820167.1186538.200=-=-=SSE SST SSA6593.2046371.821,4151==-=∴=-=-r SSA MSA r6198.5210167.118,21526==-=∴=-=-r n SSE MSE r n6762.36198.56593.20===∴MSE MSA F单因素方差分析表假设检验：H 0:μ1=μ2=μ3=μ4=μ5，五个地区平均每天交通事故的次数相等。

H 1:μ1，μ2，μ3，μ4，μ5不全相等，五个地区平均每天交通事故的次数不相等。

查表得：F 0.01(4,21)=4.37>F =3.6762所以接受H 0，即五个地区平均每天交通事故的次数相等。

典型例题-H-相关与回归分析-2设有统计资料如下表所示。

用EXCEL 的回归分析(置信度90%)，得到如下结果： SUMMARY OUTPUT 回归统计Multiple R 0.987760119R Square 0.975670053Adjusted R Square 0.972628809标准误差3.545815055观测值10方差分析dfSS MSF Significance F 回归分析14033.5175654033.517565320.81287799.67595E-08残差8100.582435312.57280441总计94134.1Coefficients 标准误差t Stat P-value Lower 95%Upper 95%下限 90.0%上限 90.0%Intercept -0.208871752.879726332-0.0725318060.943959317-6.849532574 6.431789074-5.563861187 5.146117686X Variable 10.7176566730.04006736917.911250049.67595E-080.6252611530.8100521930.6431494750.792163871试通过用公式计算，比较对照，理解所得结果。

解：x -bar =66.2，y -bar =47.3 相关系数为()()()()987760119.01.41346.78314.562022=⨯=----=∑∑∑Y Y X X Y Y X X r iii iXY()1.413412=-=∑=ni i y y SST717656673.066251656104736623693310ˆ212121111=-⨯⨯-⨯=⎪⎭⎫ ⎝⎛-⎪⎭⎫⎝⎛⎪⎭⎫ ⎝⎛-=∑∑∑∑∑=====n i n i i i n i i ni i ni i i x x n y x y x n β20887175.02.66717656673.03.47ˆˆ0-=⨯-=-=x y ββi i x y 717656673.020887175.0ˆ+-=()517565.4033ˆ12=-=∑=ni i y y SSR()5824353.100ˆ12=-=∑=n i i i yy SSESSR +SSE =4033.517565+100.5824353=4134.1=SST222)(987760119.0975670053.01.4134517565.4033XY r SST SSR r =====对于第一部分：SUMMARY OUTPUT回归统计Multiple R 0.987760119R Square 0.975670053Adjusted R Square 0.972628809标准误差3.545815055观测值10通过以上计算分析，可知：Multiple R 0.987760119 是相关系数； R Square 0.975670053 是判定系数；Adjusted R Square 0.972628809 是根据以下公式来计算的：972628809.01110110)975670053.01(111)1(122=---⨯--=---⨯--=p n n R R标准误差 3.545815055 是根据以下公式来计算的：()545815055.32105824353.10022ˆ12=-=-=--=∑=n SSE n yy s ni iie观测值 10 是原始数据的个数，即n 。

对于第二部分：方差分析df SSMS FSignificance F 回归分析14033.5175654033.517565320.81287799.67595E-08残差8100.582435312.57280441总计94134.1第一列df 是自由度，第1行的1表示是一元线性回归；第二行是残差的自由度n -2=8，第三行是总的自由度1+8=9；第二列SS 是误差平方，第一行是SSR =4033.517565，第二行是SSE =100.5824353，第三行是SST =4134.1，这里有SSR +SSE =SST ；第三列MS 是平均误差平方，第一行是MSR =4033.517565/1=4033.517565，第二行是MSE =100.5824353/8=12.57280441；第四列F 是F =MSR /MSE =4033.517565/12.57280441=320.6128779；最后一列Significance F 是用EXCEL 函数FDIST(320.8128779,1,8)计算出来的。

9.67595E-08是科学计数法，表示9.67595×10-8 对于第三部分：Coefficients 标准误差t Stat P-value Lower 95%Upper 95%下限 90.0%上限 90.0%Intercept -0.208871752.879726332-0.0725318060.943959317-6.8495325746.431789074-5.5638611875.146117686X Variable 10.7176566730.04006736917.911250049.67595E-080.6252611530.8100521930.6431494750.792163871第一列Coefficients 是回归系数，第一行是截距的回归系数，即β0^=-0.20887175，第二行是斜率的回归系数，即β1^=0.717656673；第二列标准误差，第一行是截距的标准误差，是根据以下公式来计算的：()879726332.26.78312.66101545815055.3)(12122ˆ0=+⨯=-+=∑=ni iiex x x ns s β第二行是斜率的标准误差，是根据以下公式来计算的：()040067369.06.7831545815055.312ˆ1==-=∑=ni iiex x s s β第三列t Stat ，即t 统计量，由对应的回归系数除以标准误差：-0.20887175/2.879726332=-0.072531806 0.717656673/0.040067369=17.91125004第四列P value ，是用EXCEL 函数TDIST(|t Stat|,n -2,2)计算出来的，第一个参数是t 统计量，第二个参数是自由度，第三个参数2表示双尾。

TDIST(|-0.072531806|,8,2)=TDIST(0.072531806,8,2)=0.943959317 TDIST(|17.91125004|,8,2)=TDIST(17.91125004,8,2)=9.67595E-089.67595E-08是科学计数法，表示9.67595×10-8第五、六列的Lower 95%，Upper 95%是EXCEL 默认的95%置信度下，截距和斜率的置信区间，是根据以下公式来计算的：879726332.230600413.220887175.0)2(ˆ0ˆ0⨯±-=-±βαβs n t即：849532574.6)2(ˆ0ˆ0-=--βαβs n t 431789074.6)2(ˆ0ˆ0=-+βαβs n t040067369.030600413.2717656673.0)2(ˆ1ˆ1⨯±=-±βαβs n t即：625261153.0)2(ˆ1ˆ1=--βαβs n t810052193.0)2(ˆ1ˆ1=-+βαβs n t第七、八列的下限90%，上限90%是根据输入的90%置信度下，截距和斜率的置信区间，是根据以下公式来计算的：879726332.285954803.120887175.0)2(ˆ0ˆ0⨯±-=-±βαβs n t即：563861187.5)2(ˆ0ˆ0-=--βαβs n t 146117686.5)2(ˆ0ˆ0=--βαβs n t040067369.085954803.1717656673.0)2(ˆ1ˆ1⨯±=-±βαβs n t即：643149475.0)2(ˆ1ˆ1=--βαβs n t 792163871.0)2(ˆ1ˆ1=-+βαβs n t典型例题-I-时间序列分析-1某企业某种产品的有关资料如表1所示。

e商务文档

典型例题分析

相关文档推荐：