《多元统计分析分析》实验报告
2012 年月日学院经贸学院姓名学号
实验
实验成绩名称
一、实验目的
(一)利用SPSS对主成分回归进行计算机实现.
(二)要求熟练软件操作步骤,重点掌握对软件处理结果的解释.
二、实验内容
以教材例题为实验对象,应用软件对例题进行操作练习,以掌握多元统计分析方法的应用
三、实验步骤(以文字列出软件操作过程并附上操作截图)
1、数据文件的输入或建立:(文件名以学号或姓名命名)
将表数据输入spss:点击“文件”下“新建”——“数据”见图1:
图1
点击左下角“变量视图”首先定义变量名称及类型:见图2:
图2:
然后点击“数据视图”进行数据输入(图3):
图3
完成数据输入
2、具体操作分析过程:
(1)首先做因变量Y与自变量X1-X3的普通线性回归:
在变量视图下点击“分析”菜单,选择“回归”-“线性”(图4):
图4
将因变量Y调入“因变量”栏,将x1-x3调入“自变量”栏(图5):
然后选择相关要输出的结果:①点击右上角“统计量(s)”:“回归系数”下选择“估计”;“残差”下选择“”;在右上角选择输出“模型拟合度”、“部分相关和偏相关”“共线性诊断”(后两项是做多重共线性检验)。
选完后点击“继续”(见图6)②如果需要对因变量与残差进行图形分析则需要在“绘制”下选择相关项目(图7),一般不需要则继续③如果需要将相关结果如因变量预测值、残差等保存则点击“保存”(图8),选择要保存的项目④如果是逐步回归法或者设置不带常数项的回归模型则点击“选项”(图9)
其他选项按软件默认。
最后点击“确定”,运行线性回归,输出相关结果(见表1-3)
图5图6
图7
图8
图9
回归分析输出结果:
表1
模型汇总b
1表示提取的因子或主成分至少代表1个单位标准差的变量信息,因为标准化后的变量方差为1,因子或者主成分作为提取的综合变量应该至少代表1个变量的信息),也可以自选提取的因子个数(即第二项),本例中做主成分回归,选择提取全部可能的3个主成分,所以自选个数填3。
选完后点击“继续”进行下一步;③点击“旋转”(图14),按默认的“方法”下不旋转(注意,主成分分析不能旋转!)其他不用选,点击“继续”进行下一步;④点击“得分”,计算不旋转的初始因子得分(图15),选中“保存为变量”,“方法”下按默认,其他不修改,点击“继续”进行下一步。
⑤“选项”下可以不选按默认(选项里主要针对缺失值和系数显示格式,不影响分析结果)
最后点击“确定”,运行因子分析。
图10
图11
图12
图13
图14
图15
由运行结果计算主成分:
表4、描述统计量
均值标准差分析N
x111
x211
x311
表5、相关矩阵
x1x2x3
相关x1.026.997
x2.026.036
x3.997.036
Sig.(单侧)x1.470.000
x2.470.459
x3.000.459
表6、KMO 和Bartlett 的检验
取样足够度的Kaiser-Meyer-Olkin 度量。
.492
Bartlett 的球形度检验近似卡方
df3
Sig..000
表7、解释的总方差
成份初始特征值提取平方和载入
合计方差的%累积%合计方差的%累积% 1
2.998.998
3.003.090.003.090
提取方法:主成份分析。
表8、成份矩阵a
成份
123
x1.999.037
x2.062.998.000
x3.999
提取方法:主成份。
a. 已提取了3 个成份。
由表5、6可知适合做主成分或因子分析(KMO检验通过),表7知前两个主成分(初始因子)贡献率已达%,提取前两个主成分用于分析。
由表8(初始因子载荷阵)和表7可计算前两个特征向量,用表8前两列分别除以前两个特征值的平方根得前两个主成分表达式:
F1=*+*+*(式1)
F2=*+**(式2)
其中X1*-X3*表示为标准化变量(这是因为在进行主成分分析时是以标准化变量进行分析的,是从相关阵出发分析的,见图13的选项)。
由于主成分互不相关,可以用提取的主成分代替自变量进行回归分析,因此需要计算主成分得分来代替自变量X1-X3。
主成分的计算:依据式1和2中两个主成分的表达式,对各自变量标准化后带入就可以计算出每个样品的主成分得分。
但是在spss中,由因子分析提取时是用主成分法提取的,根据初始因子与主成分的关系,未旋转的初始因子等于主成分除以特征根的平方根,因此主成分得分等于因子得分乘以特征根的平方根,因此可以由因子得分计算主成分得分。
前面在因子分析选项中保存了因子得分(见图15),因此计算两个主成分得分:点击“转换”—“计算变量”(图16):在弹出的窗口分别定义主成分F1=第一因子得分*第一特征根的平方根(图17)和F2=第二因子得分*第二特征根的平方根。
(3)主成分回归过程:
要做主成分回归,需要用标准化的因变量(因为自变量经过标准化处理做主成分分析,因变量需要对应做标准化)与主成分做回归,对因变量Y做标准化处理,点击“分析”—“描述统计”—“描述”(见图18),在弹出窗口中将Y调入变量,并选中“将标准化得分另存为变量”(图19)后确定完成Y的标准化。
点击“分析”---“回归”---“线性”(图20)在弹出窗口(图21)中将Zscore(y)调入因变量,F1和F2调入自变量,其他选项同前面图6-9,然后点击“确定”运行主成分回归,相关输出结果见表9
图16
图17
图18图19
图20
图21
主成分回归结果:
表9、模型汇总
模型R R 方调整R 方标准估计的误
差
1.994a.988.985.
a. 预测变量: (常量), F1, F2。
表10、Anova b。