当前位置:
文档之家› 第八讲SPSS主成分分析和因子分析
第八讲SPSS主成分分析和因子分析
F2
F1
沿长、短轴方向设 定新坐标系,长轴
变量承载大部分变
异信息,短轴变量
承载少量变异信
息.
一就个 可长以轴代新表变原量来两F1 个变量的主要信息, 从而起到降维作用
在主成分分析中, 提取出的每个新变
F1与F2不相关 量(主成分)都是原 来多个变量的线性 组合
➢如由两个原始变量X1和X2,可提取两个主成分:
➢方差贡献率:数值越大,表明该因子对原来变 量信息的综合能力越强。
➢累计贡献率
➢变量Xi的变量共同度:也称公因子方差比,是 提取公因子后,各变量中信息被提取出的比例, 或者说原变量的信息量(方差)由公因子决定的比 例
➢旋转前/后因子载荷:反映因子和各个变量间的 密切程度的指标,实质是两者间的相关系数
F1 =a11X1 +a21X2
F2 =a12X 1 +a22X2 依次类推:由N个原始变量可提取N个主成分, 但如果将它们全部提取出来就失去了该方法简 化数据的实际意义.
➢一般情况下按贡献率由大到小,取累计贡献率 达到85%的前2~3个主成分,其他的忽略不计。
➢在进行主成分回归时,提取出的主成分能包含 主要信息即可,不一定要有准确的实际含义。
➢在SPSS中的实现:
分析(Analyze)---数据降维(Data Reduction)---因子 分析(Factor Analyze) 在因子分析对话框中,将原变量选入“变量”列表
框中 在“描述”按钮对话框,在“相关矩阵”部分选择
“系数”和“KMO和Bartlett球形度检验”
在“抽取”按钮对话框,“方法”设定 为“主成分”
第八讲 主成分分析和因子分析
一、概述
意义和作用: ➢ 解决变量间多重共线性。在社会经济研究
工作中经常会遇到多指标的问题,这些指 标间往往存在一定的相关,直接纳入分析 不仅复杂,变量间难以取舍,而且由于分 析前提不满足,得出错误结论。
➢ 变量压缩。主成分分析通过线性变换,在尽可 能保留原始变量的信息的基础,降低维度,将 原来的多个变量组合成相互独立的少数的、新 的综合变量。
行检验,若变量间相互独立(Sig.大于 0.05),因子分析无效
3、步骤
➢判断数据是否符合要求,是否有必要进行主
成分/因子分析
➢对原有变量标准化,以消除计量单位和数据
基数的影响(SPSS会自动对原始变量标准化)
➢根据标准化数据计算相关矩阵或协方差矩阵,
及其特征根和特征向量
➢进行分析,按一定标准确定提取的主成分/因
子数
➢如果进行的是主成分分析,步骤到此结束 ➢如果进行的是因子分析,则考察因子的可解
释性,并在必要时进行因子旋转,使因子载 荷向0、1分化,以寻求最佳解释
➢如有必要,计算因子得分等中间指标供进一
步分析使用
4、输出统计量
➢特征根(Eigenvalue ):是因子影响力度的指标, 其数值代表因子相当于原始变量平均解释力的 多少。特征根大于1,表示引入的因子解释力度 大于一个原始变量平均解释力度。因此往往将 特征根大于1作为抽取因子的标准。
➢ 变量解释。利用新变量进一步探讨变量内在联 系和结构,利于简化和解释问题。
因子分析和主成分分析方法,往往是更复杂的 统计分析方法的基础。
Factor1.sav 、 Factor2.sav
二、主成分分析
1、基本原理
统计信息实际上是 指数据变异信息
右图中,在椭圆的 长轴方向数据变异 明显大于短轴方向
维技术。
➢在主成分分析时,要求提取出的主成分能包含
主要信息即可,不一定要有准确的实际含义。 但在因子分析中,目的是分解原始变量,从中 归纳出潜在的“类别”,相关性较强的指标归 为一类,每一类变量代表了一个“共同因子”, 即一种内在结构。因子分析就是要寻找该结构。
➢在实际应用中,有时两者不加区分
2、适用条件
➢因子得分函数系数
5、公因子数的确定
公因子数量的确定
➢主成分的累积贡献率:85%以上 ➢ 特征根:大于1 ➢ 综合判断。 因子分析时更重要的是因子的
可解释性,必要时保留特征根小于1的因子
➢利用碎石图帮助确定因子数量
6、在SPSS中的实现
例:在Factor2.sav中,有重庆市40个区县的GDP、工业总 产值等九个指标数据,试根据这些指标对各区县经济发 展状况进行综合评价。
回归估计方法求出因子得分数学模型(在因 子分析中,不能直接由载荷矩阵按列得到因 子的表达式)
上机习题
某市15个大中型企业经济效益数据见 “某市工业企业效益指标.sav”,利用因 子分析方法对企业经济效益进行综合评 价及分析。
为了找出变量间内在结构,要求因子分析满足 以下条件:
➢样本量 样本量与变量数的比例应在5: 1以上 总样本量最好大于100,而且原则上越大越
好
➢各变量间必须有相关性 KMO统计量:在(0,1)之间,大于0.9最佳,
0.9-0.7尚可, 0.7-0.6很差,0.5以下放弃
Bartlett’s球形检验:对变量间的独立性进
在“旋转”按钮对话框,“方法”设定 为“最大方差法”
在“得分”按钮对话框,选择“保存为 变量”、“方法”设定为“回归”,选 择“显示因子得分系数矩阵”
输出结果阅读
➢说明的总方差表:包括特征根,旋转前/后的
方差贡献率、累计贡献率
➢变量共同度 ➢旋转前/后因子载荷矩阵 ➢因子得分模型系数:求出公因子后,可以用
2、应用
➢利用主成分进行综合评价:当进行多指标的 综合评价时,应用主成分方法将多指标中的 信息集中为若干个主成分,然后加权求和, 得到综合评价指数。
➢利用主成分进行回归分析:通过对存在共线 性的自变量进行主成分分析,从而在提取多 数信息的同时解决共线性问题。
三、因子分析
1、概述 ➢与主成分分析相同,也是一种多变量化简、降