当前位置:文档之家› 典型例题分析

典型例题分析

典型例题-G-方差分析-2某企业准备用三种方法组装一种新的产品,为确定哪种方法每小时生产的产品数量最多,随机抽取了30名工人,并指定每个人使用其中的一种方法。

通过对每个工人生产的产品数进行方差分析,得到如下表所示的结果。

每个工人生产产品数量的方差分析表(2)若显著性水平为α=0.05,检验三种方法组装的产品数量之间是否有显著差异。

解:(1)完成方差分析表,以表格中所标的①、②、③、④、⑤、⑥为顺序,来完成表格,具体步骤如下: ①求k -1根据题目中“该企业准备用三种方法组装一种新的产品”可知,因素水平(总体)的个数k =3,所以第一自由度df 1=k -1=3-1=2,即SSA 的自由度。

②求n -k由“随机抽取了30名工人”可知,全部观测值的个数n =30,因此可以推出第二自由度df 2=n -k =30-3=27,即SSE 的自由度。

③求组间平方和SSA已知第一自由度df 1=k -1=3-1=2,MSA =210 根据公式1-==k SSAMSA 自由度组间平方和所以,SSA =MSA ×(k -1)=210×2=420④求总误差平方和SST由上面③中可以知道SSA =420;此外从表格中可以知道:组内平方和SSE =3836,根据公式SST =SSA +SSE 可以得出SST =420+3836=4256,即总误差平方和SST=4256 ⑤求SSE 的均方MSE已知组内平方和SSE =3836,SSE 的自由度n -k =30-3=27 根据公式0741.142273836==-==k n SSE MSE 自由度组内平方和所以组内均方MSE =142.0741⑥求检验统计量F已知MSA =210,MSE =142.0741 根据4781.10741.142210===MSE MSA F所以F=1.4781(2)题目中假设α=0.05,根据第一自由度df 1=k -1=3-1=2和第二自由度df 2=n -k =30-3=27,查F 分布表得到临界值F 0.05(2,27)=3.354131,所以F =1.4781<F α=3.354131,所以接受原假设,即μ1=μ2=μ3成立,表明μ1、μ2、μ3之间没有显著差异,也就是说,用三种方法组装的产品数量之间没有显著差异。

典型例题-G-方差分析-3五个地区每天发生交通事故的次数如表1所示。

由于是随机抽样,有一些地区的样本容量较多,(如南部和西部)而有些地区样本容量较少(如东部)。

试以α=0.01的显著性水平检验各地区平均每天交通事故的次数是否相等。

解:计算原数据的和:以及原数据的平方和:()()∑∑===++++-++++=-=rj nji ij x n x SST 112226538.2006755646657261771539834898831()0167.1186676555645664577715398348988312222221112=⎪⎪⎭⎫⎝⎛++++-++++=-=∑∑∑===jrj nji rj j ijx n x SSE6371.820167.1186538.200=-=-=SSE SST SSA6593.2046371.821,4151==-=∴=-=-r SSA MSA r6198.5210167.118,21526==-=∴=-=-r n SSE MSE r n6762.36198.56593.20===∴MSE MSA F单因素方差分析表假设检验:H 0:μ1=μ2=μ3=μ4=μ5,五个地区平均每天交通事故的次数相等。

H 1:μ1,μ2,μ3,μ4,μ5不全相等,五个地区平均每天交通事故的次数不相等。

查表得:F 0.01(4,21)=4.37>F =3.6762所以接受H 0,即五个地区平均每天交通事故的次数相等。

典型例题-H-相关与回归分析-2设有统计资料如下表所示。

用EXCEL 的回归分析(置信度90%),得到如下结果: SUMMARY OUTPUT 回归统计Multiple R 0.987760119R Square 0.975670053Adjusted R Square 0.972628809标准误差3.545815055观测值10方差分析dfSS MSF Significance F 回归分析14033.5175654033.517565320.81287799.67595E-08残差8100.582435312.57280441总计94134.1Coefficients 标准误差t Stat P-value Lower 95%Upper 95%下限 90.0%上限 90.0%Intercept -0.208871752.879726332-0.0725318060.943959317-6.849532574 6.431789074-5.563861187 5.146117686X Variable 10.7176566730.04006736917.911250049.67595E-080.6252611530.8100521930.6431494750.792163871试通过用公式计算,比较对照,理解所得结果。

解:x -bar =66.2,y -bar =47.3 相关系数为()()()()987760119.01.41346.78314.562022=⨯=----=∑∑∑Y Y X X Y Y X X r iii iXY()1.413412=-=∑=ni i y y SST717656673.066251656104736623693310ˆ212121111=-⨯⨯-⨯=⎪⎭⎫ ⎝⎛-⎪⎭⎫⎝⎛⎪⎭⎫ ⎝⎛-=∑∑∑∑∑=====n i n i i i n i i ni i ni i i x x n y x y x n β20887175.02.66717656673.03.47ˆˆ0-=⨯-=-=x y ββi i x y 717656673.020887175.0ˆ+-=()517565.4033ˆ12=-=∑=ni i y y SSR()5824353.100ˆ12=-=∑=n i i i yy SSESSR +SSE =4033.517565+100.5824353=4134.1=SST222)(987760119.0975670053.01.4134517565.4033XY r SST SSR r =====对于第一部分:SUMMARY OUTPUT回归统计Multiple R 0.987760119R Square 0.975670053Adjusted R Square 0.972628809标准误差3.545815055观测值10通过以上计算分析,可知:Multiple R 0.987760119 是相关系数; R Square 0.975670053 是判定系数;Adjusted R Square 0.972628809 是根据以下公式来计算的:972628809.01110110)975670053.01(111)1(122=---⨯--=---⨯--=p n n R R标准误差 3.545815055 是根据以下公式来计算的:()545815055.32105824353.10022ˆ12=-=-=--=∑=n SSE n yy s ni iie观测值 10 是原始数据的个数,即n 。

对于第二部分:方差分析df SSMS FSignificance F 回归分析14033.5175654033.517565320.81287799.67595E-08残差8100.582435312.57280441总计94134.1第一列df 是自由度,第1行的1表示是一元线性回归;第二行是残差的自由度n -2=8,第三行是总的自由度1+8=9;第二列SS 是误差平方,第一行是SSR =4033.517565,第二行是SSE =100.5824353,第三行是SST =4134.1,这里有SSR +SSE =SST ;第三列MS 是平均误差平方,第一行是MSR =4033.517565/1=4033.517565,第二行是MSE =100.5824353/8=12.57280441;第四列F 是F =MSR /MSE =4033.517565/12.57280441=320.6128779;最后一列Significance F 是用EXCEL 函数FDIST(320.8128779,1,8)计算出来的。

9.67595E-08是科学计数法,表示9.67595×10-8 对于第三部分:Coefficients 标准误差t Stat P-value Lower 95%Upper 95%下限 90.0%上限 90.0%Intercept -0.208871752.879726332-0.0725318060.943959317-6.8495325746.431789074-5.5638611875.146117686X Variable 10.7176566730.04006736917.911250049.67595E-080.6252611530.8100521930.6431494750.792163871第一列Coefficients 是回归系数,第一行是截距的回归系数,即β0^=-0.20887175,第二行是斜率的回归系数,即β1^=0.717656673;第二列标准误差,第一行是截距的标准误差,是根据以下公式来计算的:()879726332.26.78312.66101545815055.3)(12122ˆ0=+⨯=-+=∑=ni iiex x x ns s β第二行是斜率的标准误差,是根据以下公式来计算的:()040067369.06.7831545815055.312ˆ1==-=∑=ni iiex x s s β第三列t Stat ,即t 统计量,由对应的回归系数除以标准误差:-0.20887175/2.879726332=-0.072531806 0.717656673/0.040067369=17.91125004第四列P value ,是用EXCEL 函数TDIST(|t Stat|,n -2,2)计算出来的,第一个参数是t 统计量,第二个参数是自由度,第三个参数2表示双尾。

TDIST(|-0.072531806|,8,2)=TDIST(0.072531806,8,2)=0.943959317 TDIST(|17.91125004|,8,2)=TDIST(17.91125004,8,2)=9.67595E-089.67595E-08是科学计数法,表示9.67595×10-8第五、六列的Lower 95%,Upper 95%是EXCEL 默认的95%置信度下,截距和斜率的置信区间,是根据以下公式来计算的:879726332.230600413.220887175.0)2(ˆ0ˆ0⨯±-=-±βαβs n t即:849532574.6)2(ˆ0ˆ0-=--βαβs n t 431789074.6)2(ˆ0ˆ0=-+βαβs n t040067369.030600413.2717656673.0)2(ˆ1ˆ1⨯±=-±βαβs n t即:625261153.0)2(ˆ1ˆ1=--βαβs n t810052193.0)2(ˆ1ˆ1=-+βαβs n t第七、八列的下限90%,上限90%是根据输入的90%置信度下,截距和斜率的置信区间,是根据以下公式来计算的:879726332.285954803.120887175.0)2(ˆ0ˆ0⨯±-=-±βαβs n t即:563861187.5)2(ˆ0ˆ0-=--βαβs n t 146117686.5)2(ˆ0ˆ0=--βαβs n t040067369.085954803.1717656673.0)2(ˆ1ˆ1⨯±=-±βαβs n t即:643149475.0)2(ˆ1ˆ1=--βαβs n t 792163871.0)2(ˆ1ˆ1=-+βαβs n t典型例题-I-时间序列分析-1某企业某种产品的有关资料如表1所示。

相关主题