多元统计分析实验报告
1、实验内容
根据课本习题3-12做相关分析。
2、实验目的 (1)检验H0:;H1:协方差阵不全相等。
(2)检验H0: U1=U2 ; H1:U1≠U2;
(3)检验H0: U1=U2 =U3 ; H1:U1,U2,U3不全等; (4)检验三种化学成分相互独立。
3、实验方案分析
(1)这是关于判断三个3元正态总体的协方差阵是否相等的问题; (2)均值是否相等,在两个协方差阵相等的情况下均值是否相等的问题;
(3)比较三组的3项指标是否有差异的问题,就是多总体均值向量是否相等的检验问题;
(4)检验 是否独立相当于检验任意2个子向量的协方差阵是否为零矩阵;
4、实验原理及操作过程,结果如下: (1)SAS 代码实现过程如下:
data d3121;
input y1-y3 group @@; cards;
47.22 5.06 0.10 1
1
23
==∑∑∑
47.45 4.35 0.15 1
47.52 6.85 0.12 1
47.86 4.19 0.17 1
47.31 7.57 0.18 1
54.33 6.22 0.12 2
56.17 3.31 0.15 2
54.40 2.43 0.22 2
52.62 5.92 0.12 2
43.12 10.33 0.05 3
42.05 9.67 0.08 3
42.50 9.62 0.02 3
40.77 9.68 0.04 3
;
proc iml;
n1=5;n2=4;n3=4;
n=n1+n2+n3;k=3; p=3;
use d3121(obs=5);
xa={y1 y2 y3 };
read all var xa into x1; print x1; use d3121(firstobs=6 obs=9);
read all var xa into x2; print x2; use d3121(firstobs=10 obs=13);
read all var xa into x3; print x3; xx=x1//x2//x3;
ln={[5] 1} ;
x10=(ln*x1)/n1; print x10;
mm1=i(n1)-j(n1,n1,1)/n1;
mm=i(n)-j(n,n,1)/n;
a1=x1`*mm1*x1; print a1;
ln={[4] 1} ;
x10=(ln*x2)/n2; print x20;
mm2=i(n2)-j(n2,n2,1)/n2;
a2=x2`*mm2*x2; print a2;
ln={[4] 1} ;
x10=(ln*x3)/n3; print x30;
mm3=i(n3)-j(n3,n3,1)/n3;
a3=x3`*mm3*x3; print a3;
tt=xx`*mm*xx; print tt;
a=a1+a2+a3;
print a;
da=det(a/(n-k));
da1=det(a1/(n1-1));
da2=det(a2/(n2-1));
da3=det(a3/(n3-1));
m=(n-k)*log(da)-(4*log(da1)+3*log(da2)+3*log(da3)); dd=(2*p*p+3*p-1)*(k+1)/(6*(p+1)*(n-k));
df=p*(p+1)*(k-1)/2;
kc=(1-dd)*m;
print da da1 da2 da3;
print m dd df ;
p0=1-probchi(kc,df);
print kc p0;
quit;
(2)代码实现(数据省略(1)相同)
proc iml;
n=5;m=4; p=3;
use d3122(obs=5);
xx={x1 x2 x3};
read all var xx into x; print x;
ln={[5] 1} ;
x0=(ln*x)/n; print x0;
mx=i(n)-j(n,n,1)/n;
a1=x`*mx*x; print a1;
use d3122(firstobs=6);
read all var xx into y; print y;
lm={[4] 1} ;
y0=(lm*y)/m; print y0;
my=i(m)-j(m,m,1)/m;
a2=y`*my*y; print a2;
a=a1+a2; xy=x0-y0;
ai=inv(a); print a ai;
dd=xy*ai*xy`; d2=(m+n-2)*dd;
t2=n*m*d2/(n+m) ;
f=(n+m-1-p)*t2/((n+m-2)*p);
print d2 t2 f;
pp=1-probf(f,p,m+n-p-1);
print pp; 7
quit;
(3)代码实现如下:
title ' "应用多元统计分析" p104 312(3)'; proc iml;
n1=5;n2=4; n3=4;
p=3; k=3;
n=n1+n2+n3;
xa={ 47.22 5.060.10 ,
47.45 4.350.15 ,
47.52 6.850.12 ,
47.86 4.190.17 ,
47.317.570.18 };
xb={ 54.33 6.220.12 ,
56.17 3.310.15 ,
54.40 2.430.22 ,
52.62 5.920.12 };
xc={ 43.1210.330.05 ,
42.059.670.08 ,
42.509.620.02 ,
40.779.680.04 };
xx=xa//xb//xc;
ln1={[5] 1} ; ln2={[4] 1};
lnn= {[13] 1};
xa0=(ln1*xa)/n1; print xa0;
xb0=(ln2*xb)/n2; print xb0;
xc0=(ln2*xc)/n3; print xc0;
xx0=(lnn*xx)/n; print xx0;
mm1=i(n1)-j(n1,n1,1)/n1;
mm2=i(n2)-j(n2,n2,1)/n2;
mm=i(n)-j(n,n,1)/n;
a1=xa`*mm1*xa; print a1;
a2=xb`*mm2*xb; print a2;
a3=xc`*mm2*xc; print a3;
tt=xx`*mm*xx; print tt;
a=a1+a2+a3; print a;
da=det(a);
dt=det(tt); a0=da/dt;
print da dt a0;
b=sqrt(a0);
f3=(n-k-p+1)*(1-b)/(b*p);
df1=2*p; df2=2*(n-k-p+1);
print df1 df2;
p3=1-probf(f3,df1,df2);
print f3 p3;
(4)的代码实现如下:
title ' "应用多元统计分析" p104 312(4)';
proc iml;
n=13; p=3;
x={47.22 5.060.10, 47.45 4.350.15, 47.52 6.850.12, 47.86 4.190.17,
47.317.570.18, 54.33 6.220.12, 56.17 3.310.15, 54.40 2.430.22,
52.62 5.920.12, 43.1210.330.05, 42.059.670.08, 42.509.620.02,
40.779.680.04 };
ln={[13] 1} ;
x0=(ln*x)/n; print x0;
mm=i(13)-j(13,13,1)/n;
a=x`*mm*x; print a;
a0=det(a); print a0;
a1=a[1,1]*a[2,2]*a[3,3];
v=a0/a1; print v;
b=n-1.5-(p*p*p-3)/(3*p*p-3*3);
df=0.5*(p*(p+1)-2*3);
kc=-b*log(v);
print b df kc;
p0=1-probchi(kc,df);
print p0;
quit;
5、实验结果
(1)
M=24.52397,d=0.4333,X2=13.8969,p=0.30793>0.05,
故H0相容,
(2)因为P=0,001083<0.05,故否定H0,即A和B地区地区岩石的化学成分有显著差异。
(3)因为p=0.00002345<0.5,故否定H0,即A和B,C三个地区地区
岩石的化学成分有显著差异。