当前位置:文档之家› SPSS主成分分析教程)

SPSS主成分分析教程)


• 这里的 Initial Eigenvalues 就是这里的六个 主轴长度,又称特征值(数据相关阵的特 征值)。头两个成分特征值累积占了总方 差的81.142%。后面的特征值的贡献越来越 少。
因子分析
主成分分析从原理上是寻找椭球的所有主轴。因此, 原先有几个变量,就有几个主成分。 而因子分析是事先确定要找几个成分,这里叫因子型上,因子分析和主成分分析有不少 区别。而且因子分析的计算也复杂得多。根据因子分 析模型的特点,它还多一道工序:因子旋转( factor rotation);这个步骤可以使结果更好。 当然,对于计算机来说,因子分析并不比主成分分析 多费多少时间。 从输出的结果来看,因子分析也有因子载荷( factor loading)的概念,代表了因子和原先变量的相关系数。 但是在输出中的因子和原来变量相关系数的公式中的 系数不是因子载荷,也给出了二维图;该图虽然不是 载荷图,但解释和主成分分析的载荷图类似。
主成分分析
选择越少的主成分,降维就越好。什么是 标准呢?那就是这些被选的主成分所代表 的主轴的长度之和占了主轴长度总和的大 部分。有些文献建议,所选的主轴总长度 占所有主轴长度之和的大约 85% 即可, 其实,这只是一个大体的说法;具体选几 个,要看实际情况而定。
• 对于我们的数据,SPSS输出为
主成分分析与因子分析是将多个实测变 量转换为少数几个不相关的综合指标的 多元统计分析方法 直线综合指标往往是不能直接观测到的, 但它更能反映事物的本质。因此在医学、 心理学、经济学等科学领域以及社会化 生产中得到广泛的应用。
主成分分析与因子分析的概念(续)
由于实测的变量间存在一定的相关关系, 因此有可能用较少数的综合指标分别综 合存在于各变量中的各类信息,而综合 指标之间彼此不相关,即各指标代表的 信息不重叠。综合指标称为因子或主成 分(提取几个因子),即成为主因子
计算因子得分
可以根据前面的因子得分公式(因子得分系数 和原始变量的标准化值的乘积之和),算出每 个学生的第一个因子和第二个因子的大小,即 算出每个学生的因子得分f1和f2。 人们可以根据这两套因子得分对学生分别按照 文科和理科排序。当然得到因子得分只是SPSS 软件的一个选项(可将因子得分存为新变量、 显示因子得分系数矩阵)
第三节:因子分析与主成分分析
介绍: 1、回顾上节因子分析方法操作 2.主成分分析与因子分析的概念与区别 3.主成分分析过程
因子分析 主要步骤:
1.将原始数据进行标准化处理 2.进行相关检验,是否能进行因子分析 3.因子提取 4.因子旋转 5.因子 命名 6.因子得分
主成分分析与因子分析的概念
需要与可能:在各个领域的科学研究中,往往需要对反映 事物的多个变量进行大量的观测,收集大量数据以便进行分 析寻找规律。多变量大样本无疑会为科学研究提供丰富的信 息,但也在一定程度上增加了数据采集的工作量,更重要的 是在大多数情况下,许多变量之间可能存在相关性而增加了 问题分析的复杂性,同时对分析带来不便。 如果分别分析每个指标,分析又可能是孤立的,而不是综合 的。盲目减少指标会损失很多信息,容易产生错误的结论。 因此需要找到一个合理的方法,减少分析指标的同时,尽量 减少原指标包含信息的损失,对所收集的资料作全面的分析。 由于各变量间存在一定的相关关系,因此有可能用较少的综 合指标分别综合存在于各变量中的各类信息。主成分分析与 因子分析就是这样一种降维的方法。
Tot al Va rianc e Exp laine d Initial Eigenvalues Component Total % of Variance Cumulative % 1 3.735 62.254 62.254 2 1.133 18.887 81.142 3 .457 7.619 88.761 4 .323 5.376 94.137 5 .199 3.320 97.457 6 .153 2.543 100.000 Extraction Method: Principal Component Analysis. Extraction Sums of Squared Loadings Total % of Variance Cumulative % 3.735 62.254 62.254 1.133 18.887 81.142
因子分析和主成分分析的一些注意事项
可以看出,因子分析和主成分分析都依赖于原始 变量,也只能反映原始变量的信息。所以原始变 量的选择很重要。 另外,如果原始变量都本质上独立,那么降维就 可能失败,这是因为很难把很多独立变量用少数 综合的变量概括。数据越相关,降维效果就越好。 在得到分析的结果时,并不一定会都得到如我们 例子那样清楚的结果。这与问题的性质,选取的 原始变量以及数据的质量等都有关系 在用因子得分进行排序时要特别小心,特别是对 于敏感问题。由于原始变量不同,因子的选取不 同,排序可以很不一样。
主成分分析
每个人都会遇到有很多变量的数据。 比如全国或各个地区的带有许多经济和社会变 量的数据;各个学校的研究、教学等各种变量 的数据等等。 这些数据的共同特点是变量很多,在如此多的 变量之中,有很多是相关的。人们希望能够找 出它们的少数“代表”来对它们进行描述。 本章就介绍两种把变量维数降低以便于描述、 理解和分析的方法:主成分分析( principal component analysis ) 和 因 子 分 析 ( factor analysis )。实际上主成分分析可以说是因子 分析的一个特例。
相关主题