当前位置:文档之家› 主成分分析操作步骤

主成分分析操作步骤

主成分分析操作步骤
1)先在spss中录入原始数据
袁幌0 KMCi 删曲唇亶馳卜DG(W S^njRtJJ 11口辿J KU删
吕叫• r茗命窗・n靂二?1 a
15柞mjj 和啊r fJl I 111
1芋砂1a Q X X目
2險£g 2壬无8
3>SB壬9
4申料皺咱 B Z X a
t8 2±@
&一:jfi fulfil9 2£X9
?寓咽8 ?E9
2)菜单栏上执行【分析】一一【降维】一一【因子分析】,打开因素分析对话框,将要分析的变量都放入【变量】窗口中
3)设计分析的统计量
点击【描述】:选中“ Statistics ”中的“原始分析结果”和“相关性矩阵”中的“系数”。

(选中原始分析结果,SPSS自动把原始数据标准差标准化,但不显示出来;选中系数,会显示相关系数矩阵)然后点击“继续”。

点击【抽取】:“方法”里选取“主成分”;“分析”、“输出”、“抽取”均选中各自的第一个选项即可。

点击【得分】:选中“保存为变量”,方法中选“回归”;再选中 V 尿存为穽昼腔}
「方法 -------------- ◎目甘砂 < Bartlett
C Ardorson-F?ubin
点击【选项】:选择“按列表排除个案”。

点击【旋转】:选取第一个选项“无”。

(当因子分析的抽取方法选择主成分法时,且不进
“显示因子得分系数矩阵”
行因子旋转,则其结果即为主成分分析)
4)结果解读
5) A.相关系数矩阵:是6个变量两两之间的相关系数大小的方阵。

通过相关系数可以看到各个变量之间的相关,进而了解各个变量之间的关系。

B.共同度:给出了这次主成分分析从原始变量中提取的信息,可以看出交通和通讯最多,而娱乐教育文化损失率最大。

C.总方差的解释:系统默认方差大于1的为主成分。

如果小于1,说明这个主因素的影响力度还不如一个基本的变量。

所以只取前两个,且第一主成分的方差为3.568,第二主成分的方差为1.288,前两个主成分累加占到总方差的80.939%<
D.主成分载荷矩阵:
a.擷取2個元件。

特别注意:
该主成分载荷矩阵并不是主成分的特征向量,即不是主成分1和主成分2的系数。

主成分系数的求法:各自主成分载荷向量除以各自主成分特征值得算数平方根。

则第1主成分的各个系数是向量(0.925,0.902,0.880 , 0.878,0.588,0.093)除
以.3.568 后才得到的,即(0.490, 0.478,0.466,0.465,0.311,0.049)
才是主成分1的特征向量,满足条件是系数的平方和等于1,分别乘以6个原始
变量标准化之后的变量即为第1主成分的函数表达式(作业中不用写公式):
Y1=0.490*Z 交+0.478*Z 食+0.466*Z 衣+0.465*Z 住+0.311*Z 娱+0.049*Z 燃同理可求出第2主成分的函数表达式。

E.主成分得分系数矩阵
元件評分。

该矩阵是主成分载荷矩阵除以各自的方差得来的,实际上是因子分析中各个因子的系数,在主成分分析中可以不考虑它。

元件評分
6)因子得分在之前的“得分”对话框中,由于选中了“保存为变量”,方法中的“回归”;又选中了“显示因子得分系数
结果和原始数据一起显示在数据窗口里:
矩阵”,因此S P S S的输出
特别提醒: 后两列的数据是北京等16个地区的因子1和因子2的得分,不是主成分1和主成
分2的得分。

主成分的得分是相应的因子得分乘以相应的方差的算数平方根。

即:主成分1得分=因子1得分乘以3.568的算数平方根
主成分2得分=因子2得分乘以1.288的算数平方根得出各地区主成分1和主成分2的得分如下表:
些•未礙2閏指棄L]-加时St
t 熬薛疑耳
a
后两列就是16个地区主成分1和主成分2的得分。

(有兴趣的同学可以验证一下:上面推
导出来的主成分的函数关系式计算出来的主成分得分是否与该数据栏的的得分一致)
8)综合得分及排序:
每个地区的综合得分是按照下列公式计算的:
2 斥右乂1
化简得: Y =——二-------------- 赚丄成分1得分+ ---------------- - --------- 水丄成分2得分,
3,56^5 + 1 3 .56«+ 丨加只
Y=0.73476*主成分1得分+0.26524*主成分2得分
按照此公式计算出各地区的综合得分Y为:
丈艸曰转換任骨祈引言融也图莊险实用存展m 盲f—r 二瓦
地区nr因亍10?2主成肝-■: 1北熙2 MS10*228723押农-.25967 2 77609 _2_夫津417TO-T 03630丁的00-T K66726763 3同:t. 1 Q3S56 1 O1S53-1 36175-1 156W-1 7^305 A山四-1 06G13-1.31706■2 05172-1.455W-1 UC423£-.72783-f.10272-1.37481-1.2S14A-13^121:
B ET456D1517226175351730
吉林Q95G& 1.362741B069 1 546575x1293 1
e-3927B.47057-.74193S340S-.40349 g上海 2 3 ££83-4333S4屈096-.4918"313S21
江苏-Qt79&”.[0948■ 17?66-1276c 1 10
ii5355?(M590 1 2DOU-05643
1£-.43792 1.23176-.$2713 1.466(12-210&4 1337767 1 SD€5871339 1 8时W065 U江西-.677661^90«S■127985 1.S9197-.49161 15山东-1169356$5C-22087-54633-33372 16-91423-7544S 1 72690-96761-149Q9S 按照综合得分丫的大小进行16个地区的排序:
点击【数据】一一【排序个案】
瞄排序冷腕誰刃-JBM SPSS Statistics 琳^辕£
之悴旧轴做目视展电)数腿回?m(T)琳凶直鸭廻)ufi?(c)丈用程岸世)誉
地区1因亍1[阂子2
主成分1王成分2¥
1上海 2.35583-.43335 4.44996-.49181 3 13921 2北京
2.04910-22B/2
3.8705825957277609
3淅江.63552-.04990 1.20044二- 0666386702 4吉林095fiS 1 362741S069 1.5465754298 5辽宁273&2.45601.51722.5175351730 &夭津.41770-1.036807S9O0-1.176 5726763 . f福建-.37767 1 60658-7133J 1.S2331「
040 8江苏-.05796-.15654-.10948
F -.17766-12T55
3安徴-.437^2 1 29176-82719P 1.46602-.21894 10山忘.1169366950-220ST
F -.64633*33372
11黑龙-.3927847057-.7+153.53405-40349
12江西.67756 1.49085 d.27965P 1 69197-.49161
| 13 J
內蒙-72783-1 10272-1.3T4B1-1 25148-1 34210 14河两-91423■76445■1.72690P-86761■149898洵尢-1.03856-1.01863-1.96175-1.15604-1 74805 16山西■1.08619-1 31786■2 05172-1.49564-1 90423
特别提醒:
1•若主成分分析中有n个变量,则特征值(或方差)之和就等于n;
2•特征向量(或主成分的系数)中各个数值的平方和等于1,否则就不是特征向量,也不是主成分系数;
3•主成分载荷向量各系数的平方和等于其对应的主成分的方差;
2 2 2 2 2 2
本例中0.925 + 0.902 + 0.880 + 0.878 + 0.588 + 0.093 = 3.568
4.SPSS没有专门的主成分分析模块,是在因子分析模块进行的。

它只输出主成分载荷矩阵和
因子得分值,而我们最想得到的主成分的系数(特征向量)和主成分则需要另外计算。

5.若计算没有错误,因子1、因子2、主成分1、主成分2和综合得分Y它们各自的数值之
和都等于0;
6.主成分分析应该计算出综合得分并排序。

相关主题