实验报告课程名称多元统计分析实验项目名称五、对应分析班级与班级代码实验室名称(或课室)专业任课教师学号:姓名:实验日期:姓名实验报告成绩评语:1.对对应分析问题的思路、理论和方法认识正确;2.SAS软件相应计算结果确认与应用正确;3.SAS软件相应过程命令正确。
注:“不正确”为有不正确之处,具体见后面批注。
指导教师(签名)说明:指导教师评分后,实验报告交院(系)办公室保存。
实验项目五对应分析实验目的:通过对应分析的实验,熟悉对应分析问题的提出、解决问题的思路、方法和技能,会调用SAS软件对应分析等有关过程命令,根据计算机计算的结果,分析和解决对应分析问题。
实验原理:解决对应分析问题的思路、理论和方法。
实验设备:计算机与SAS、SPSS软件。
实验数据:教科书p240例1数据。
实验步骤:1.指标的正向化和排序表1(单独计算,可在SPSS软件中计算);2. 调用因子分析过程命令输入正向化数据求得:前k个初始因子方差贡献解释,达到简单结构的初始因子载荷阵L0k(Factor Pattern)见表2,初始因子样品值矩阵F 0n×k,对L0k、L0k+1、…、L0p都进行方差最大化的正交旋转(穷举法),从中选出达到简单结构的旋转后因子载荷阵LГl(Rotated Factor Pattern)见表2, 前l个旋转后因子方差贡献i v(i v在SAS软件中Rotated Factor Pattern),旋转后因子样品值矩阵F Гn×l;3.设确定的正向化后因子载荷阵记为L*,正向化后因子记为 F *= (F1*,…,F m*)′,正向化后因子样品值矩阵为F *n×m,调用散点图过程命令输入变量点坐标L*、样品点坐标F *n×m的行数据给出因子坐标系F1*,…, F m*中的因子分析图1。
实验结果、实验分析、结论(有关表图要有序号、表的序号在左上方、图的序号在图的正下方、表的中英文名、表的上下线为粗线、表的内线为细线、表的左右边不封口,表图不能跨页、表图旁不能留空块, 引用结论要注明参考文献):因子双重信息图对应分析应用步骤如下:(1)给出原始数据阵正向化和排序表1,对该数据进行标准化;表1 数据阵正向化表XI X2 X3 X4 X5 X6 X7山西 1.712592694 0.11148 0.092473 0.050073 0.038193 0.018803 0.079946 内蒙古 1.720524829 0.081315 0.11238 0.042396 0.04328 0.040004 0.083339 辽宁 1.769798738 0.100121 0.12397 0.041121 0.043429 0.031328 0.078919 吉林 1.883530037 0.10536 0.116952 0.045064 0.043735 0.038508 0.095256 黑龙江 1.801149494 0.0965 0.143498 0.037566 0.052111 0.026267 0.072829 海南 1.526829447 0.047852 0.095238 0.047945 0.022134 0.018519 0.096844 四川 1.562470704 0.06168 0.116677 0.048471 0.033529 0.017439 0.072043 贵州 1.378855798 0.056362 0.073262 0.044388 0.016366 0.01572 0.057261 甘肃 1.473557019 0.058043 0.088316 0.0381 0.039794 0.015167 0.067999 青海 1.501697669 0.088508 0.096899 0.038191 0.039275 0.019243 0.033801其中X1进行正向化,100/X1为值,得到新的X1列,名为全部支出市食品支出的数倍。
其余变量不变。
输入进sas系统,并进行标准化。
(1)选取简单结构的初始、旋转后因子载荷阵:主成分法下,设L0k(k列)是达到简单结构的初始因子载荷阵见表2,对L0k、L0k+1、…、L0p都进行方差最大化的正交旋转(穷举法),从中选出达到简单结构的旋转后因子载荷阵(用后面的因子载荷阵每行元素最大绝对值靠近1频数表3确定),记为LГl(l列)见表2;在L02、的时候初始因子载荷阵达到简单结构(3)确定因子是否旋转:L 0k 、L 0l Г比较,若L 0l Г达到更好的简单结构,则用旋转后因子;若L 0k 达到更好的简单结构或L 0l Г、L 0k 都是差异不大的简单结构,则用初始因子;根据表3的情况分析,选择初始因子。
(4)记达到更好简单结构的s 列因子载荷阵是L s ,相应的因子方差贡献率表4;根据临界值表中r (8)=0.631,在(L 02Г2,2/13λu 3,…,2/16λu 6)前2列有载荷绝对值大于显著相关的临界值,2列后没有载荷绝对值大于显著相关的临界值,故因子个数m = 2。
方差贡献率为 0.8028。
(4)确定因子轴F 1*,F 2*(因子个数2):若(L s ,2/11+s λe s +1,…,2/1p λe p ) [(2/11+s λe s +1,…,2/1p λe p )是p 列初始因子载荷阵后面的p -s 列]前2列有元素绝对值大于显著相关的临界值,2列后没有元素绝对值大于显著相关的临界值,则因子个数为2,相应的因子载荷阵记为L *见表2,L *回归的因子记为F 2*=( F 1*,F 2*)′,因子F 2*的样品值矩阵记为F *10×2见表5,F j *为F *n ×m 的第j 行;(5)因子载荷阵、因子及其样品值的正向化和因子命名:在L *的第j 列l j *的元素中,选出绝对值大于显著相关临界值的对应变量,归为因子F j *一组,正向化是:如果归为因子f j 一组变量及其l j *中的对应的相关系数符号的综合影响是越大越好,l j *、F j *取正号,否则,取负号成为-l j *、-F j *。
命名:由归为因子F j *一组变量及其l j *中的对应的相关系数符号的内在关系对因子F j *进行命名;设正向化后因子载荷阵记为L *,正向化后因子记为F *= (F 1*,…, F m *)′,正向化后因子F *的样品值矩阵仍记为F *n ×m ;(6)作因子分析图:在m 维直角坐标系中,用第i 个坐标轴表示因子轴F i *,用L *的第i 行作为指标x i 的坐标值、F *n ×m 的第j 行F j *作为第j 个样品X j 的坐标值,该散点图即为因子分析图1;(7)分析与评价:根据因子分析图1,给出指标之间(结合L *)的相关性分析,按样品点所属象限(结合 F *n ×m )得出分类结果,从指标与坐标轴F 1*、…、F m *的方向上,样品所处的位置,给出指标对样品的影响及其影响方向,对样品进行优势、劣势、潜力状况和原因等的综合评价,直至给出较客观、较可靠的决策相关性建议。
实验程序:附:正向化公式:反向指标(如资产负债率) x j 正向化公式:a -x j ;强度逆向指标(如居民消费价格指数,商品零售价格指数,食品支出比重) x j 正向化公式:⎪⎩⎪⎨⎧++>或有负数时。
中有当)(时,当0,1max /10,/ij j ij i ij j x x x x x b 适度指标(如产品销售率, 速动比率) x j 正向化公式:),1/(1+-E x j E 为理想值。
这里ij x 为第i 个样品第j 个指标的观测值。
data socecon;input x1-x7;cards;1.712592694 0.11148 0.092473 0.050073 0.038193 0.018803 0.0799461.720524829 0.081315 0.11238 0.042396 0.04328 0.040004 0.0833391.769798738 0.100121 0.12397 0.041121 0.043429 0.031328 0.0789191.883530037 0.10536 0.116952 0.045064 0.043735 0.038508 0.0952561.801149494 0.0965 0.143498 0.037566 0.052111 0.026267 0.0728291.526829447 0.047852 0.095238 0.047945 0.022134 0.018519 0.0968441.562470704 0.06168 0.116677 0.048471 0.033529 0.017439 0.0720431.378855798 0.056362 0.073262 0.044388 0.016366 0.01572 0.0572611.473557019 0.058043 0.088316 0.0381 0.039794 0.015167 0.0679991.501697669 0.088508 0.096899 0.038191 0.039275 0.019243 0.033801 ; proc factor data=socecon M=prin priors=one p=0.8 simple corr; var x1-x7; run; proc factor data=socecon R=n n=2 score out=O951; var x1-x7; run; proc print data=O951; var factor1-factor2; run;DATA CCC; INPUT _name_ $ factor1 factor2; CARDS;1 0.10130 0.869742 0.74964 0.229543 0.90845 -0.165114 1.26153 0.873195 1.20450 -0.985376 -0.92059 1.417667 -0.45532 0.505978 -1.66099 -0.007969 -0.73608 -0.9122610 -0.45244 -1.82541 x1 0.96888 0.21503 x2 0.78905 -0.09590 x3 0.84300 -0.09502 x4 -0.21642 0.88243 x5 0.87170 -0.38437 x6 0.82301 0.16667 x7 0.40839 0.82347 ;run; proc prinqual data=socecon out=rec mdpref rep; transform identity(x1-x7); run; proc sort data=ccc; by _name_; run; proc sort data=rec; by _name_; run; data d; merge rec ccc; by _name_;run; data e; set d; prin1=factor1; prin2=factor2; run; %plotit(data=e,datatype=mdpref2 1,href=0,vref=0)DATA CCC; INPUT _name_ $ factor1 factor2;CARDS;1 0.10130 0.869742 0.74964 0.229543 0.90845 -0.165114 1.26153 0.873195 1.20450 -0.985376 -0.92059 1.417667 -0.45532 0.505978 -1.66099 -0.007969 -0.73608 -0.9122610 -0.45244 -1.82541 x1 0.96888 0.21503 x2 0.78905 -0.09590 x3 0.84300 -0.09502 x4 -0.21642 0.88243 x5 0.87170 -0.38437 x6 0.82301 0.16667 x7 0.40839 0.82347 ;run; proc prinqual data=s out=rec mdpref rep; transform identity(x1-x7); id no; run; proc sort data=ccc; by _name_; run; proc sort data=rec; by _name_; run; data d; merge rec ccc; by _name_; run; data e; set d; prin1=factor1; prin2=factor2; run; %plotit(data=e,datatype=mdpref2 1,href=0,vref=0)(1)变量的正向化。