当前位置:文档之家› spass课件,教程,第七章 主成分分析

spass课件,教程,第七章 主成分分析


上机操作流程
计算主成分特征根及贡献率和累积贡献率
确定主成分
本操作是选择以特征根大于1为标准提取主成分,提取了2个主成分。按照累积方差的 观点,应该提取>80%或>85%的值,本例题提取2个主成分,其累积方差贡献率为 94.99%,应该提取2个应该提取前两个主成分。
Hale Waihona Puke 写出主成分模型前面的表给出的因子载荷矩阵,主成分系数应该 为特征向量,其换算方法为:用主成分载荷矩阵 中的数据除以主成分相对应的特征值开平方根便 得到两个主成分中每个指标所对应的系数。
i ei i
第一主成分的特征值
第二主成分的特征值
主成分模型为:
F1=0.337X1+0.34X2+0.347X3+0.22X4+0.1 02X5+0.084X6+0.156X7+0.322X8+0.344X 9+0.34X10+0.328X11+0.337X12
基本思想
最经典的方法就是用方差来表达,即var(F1)越大, 表示F1包含的信息越多。因此在所有的线性组合中所 选取的F1应该是方差最大的,故称之为第一主成分 (principal component I)。 如果第一主成分不足以代表原来p个变量的信息, 再考虑选取F2即第二个线性组合。F2称为第二主成 分(principal component II)。F1和F2的关 系?
基本思想
为了有效地反映原来信息,F1已有的信息就不再 出现在F2中,即cov(F1,F2)=0。依此类推,可 以获得p个主成分。因此,这些主成分之间是互不相 关的,而且方差依次递减。在实际中,挑选前几个最 大主成分来表征。标准? 各主成分的累积方差贡献率>80%或85%(根据 实验结果和要求可以自己调整)或特征根>1。
主成分分析
什么是主成分分析
主成分分析(Principal Components Analysis ,PCA)也称为主分量分析,是一种通过 降维来简化数据结构的方法,即如何把多个变量(变 量)转化为少数几个综合变量(综合变量),而这几 个综合变量可以反映原来多个变量的大部分信息。
基本思想
主成分分析就是设法将原来众多具有一定相关性的 变量(如p个变量),重新组合成一组新的相互无关的 综合变量来代替原来变量。怎么处理? 通常数学上的处理就是将原来p个变量作线性组合 作为新的综合变量。如何选择? 如果将选取的第一个线性组合即第一个综合变量记 为F1,自然希望F1尽可能多的反映原来变量的信息。 怎样反映?
F1主要表示X1、X2、X3、X8、X9、X10、X11、 X12的信息(冬半年的信息) F2=-0.134X1 - 0.114X2+0.016X3+0.384X4+ 0.507X5+0.519X6+0.457X7+0.034X8-0.064X90.136X10-0.195X11-0.157X12 F1主要表示X4、X5、X6、X7的信息(夏半年的信息)
第七章 主成分分析
1、主成分分析
2、SPSS上机实现过程
主成分分析
每个人都会遇到有很多变量的数据。 这些数据的共同特点是变量很多,在如此多的变量 之中,有很多是相关的。人们希望能够找出它们的 少数“代表”来对它们进行描述。 本章就介绍两种把变量维数降低以便于描述、理解 和 分 析 的 方 法 : 主 成 分 分 析 ( principal component analysis ) 和 因 子 分 析 ( factor analysis)。实际上主成分分析可以说是因子分析 的一个特例。
相关主题