5因子分析解析
二、因子分析的数据要求和基本步骤 1、数据要求: 1)进行因子分析的各基础变量应是定距变 量,虚拟变量可以同时引入,但结果可 能不好(Why?数量级的影响); 2)各基础变量间应存在较强的相关关系。 可以计算各变量的相关矩阵(两两变量之间的 相关系数),最好相关矩阵中的所有相关系 数大于0.3;SPSS提供巴雷特球体检验和 KMO值,要求检验通过且KMO值大于 0.5,否则不能进行因子分析,KMO值大 于0.9时效果最好 。
2、基本步骤: 1)选择基础变量,并对基础变量的适合状况 进行分析(相关关系测量); 2)从基础变量中提取因子(公共因子法与主 成分法),涉及因子个数判别,因子个数应 少于基础变量; 3)进行因子旋转,即通过坐标变换使因子两 两独立,以得到更合理的因子解。不旋转, 因子负荷有时可能过分偏低。可注意对比转 轴前后的因子负荷矩阵; 4)计算每个样本在各个因子上的因子得分, 该得分即是每个样本在各因子变量上的取值。
5)在路径分析模型(缺乏总的解释力)向 结构方程模型Lisrel(可以有总解释力) 转化中,潜在变量的影响作用常需作因子 处理(因为太多了),结构分析因此由回归 和因子分析组成。 如经典的研究子女收入的路径分析中,子 女教育程度被单向认为是决定子女收入的, 但实际上子女收入也会反过来影响子女教 育程度,且在子女收入上除教育程度外, 个人各种能力也会影响收入,这时只能使 用结构分析模型,个人能力影响部分就需 先作因子分析。
Extract:控制提取过程和提取结果。 Eigenvalues over中默认值为1,即提取特 征值(根)大于1的因子(小于1,说明该 因子解释力度还不如直接引入一个原变量 的平均解释力度大);利用number of factors可指定提取因子的数目。 Display:结果显示。Unrotated factor sol种方法:主成分法与公共因子法(数学原 理完全不同,具体的差异可见郭P101102)。早期人们使用主成分法,它对变 量的分布没有要求。后期发展出因子法, 更灵活有效。 Extraction因子提取对话框 Method中的principal components即为主成 分法,为系统默认; 如果数据良好,则各个方法提取因子的结果 相同;若样本数超过1500,极大似然法会 更精确;若数据不好,后两种方法更适用; 如果条件不明,仍用主成分法。
• 重要概念: 因子负荷是一个矩阵,表示公因子与基 础变量间的相关系数。负荷大,表示 该公因子与某基础变量间存在较大关 系。观察负荷矩阵,可以看出公因子 在哪些变量上有较大负荷,可以据此 说明公因子的实际含义。若矩阵缺乏 规律,不能看出某个含义,还需要进 行因子旋转,(增加因子变量)以求得更好 的解释。
命令执行后输出: Communalities变量共同度表(公因子方差 比):表示各变量中所含信息被K个公因子 所表示的程度,取值0-1,值越大说明该变量 被因子说明的程度越高; Total variance explained总方差解释表:表示 提取因子在总方差中的贡献率,注意特征值 在1以上的各因子的累积贡献率。特征值大 于1的因子被默认为提取的公因子,但同时 还可以观察累积贡献率,一般最好高于80% 时为止。特征值与累积贡献率常综合考虑; Component Matrix因子负荷矩阵:即各因子 对各变量的影响度,根据此矩阵可初步判断 各基础变量与公因子的关系,并以此说明公 因子的性质,是公因子命名的根据。
3)数据样本量应达到一定水平 一般要求样本量至少是变量数的5倍以上, 最好达到10倍以上; 理论上要求样本量不应该少于100。样本量 越大越好。 4)社会学中多见李克特量表(五级)用于 因子分析,使用时应注意该量表应具有一 定的鉴别力(鉴别力不强的要删掉,即某一问题的回答基 本一致),否则因子分析效果不佳。
独立用,做单变量;做双变量)
因子分析独立使用时通过少量的因子可以更 清楚地把握诸多变量的本质,另外它常是 一种数据整理或准备。
具体作用: 1)有些变量实际观察不到,但又确实发挥影响, 如价值观、能力、爱好等,只能使用抽象的 因子来测量; 2)变量太多,需要简化; 3)多元回归(毛病:自变量的相关性不能太强)中常出现多 重共线性,需要去掉一些变量,但无法有充 分理由选择去除某个变量,故可将这些变量 合并成因子,使用因子代替原有变量进行回 归分析,即无多重共线性。如将收入和受教 育程度合并为社会经济地位(SES)一个变量; 4)评价问卷的结构效度;
三、SPSS因子分析操作与结果解释 analyze——data reduction——factor 1、选择并描述基础变量,并对基础变量进 行检验判断: Descriptives 对话框 Univariate descriptives:单变量描述统计 量,输出各基础变量的均值和标准差; coefficients:输出基础变量间的相关系数 矩阵,注意各值是否大于0.3; KMO and Bartlett’s test of sphericity:输 出检验显著度及KMO值。
例,结构效度 情绪及情绪应对量表: 1=完全没有 2=很少有 3=有时有 4=经常有 5=每 天都有 1 我感到愉快 2 我感到郁闷 3 我情绪不好时会想办法让自己高兴起来 4 我感到自己不知怎么做才好 5 我感到有压力 6 我想哭就哭,我哭出来感觉好多了 7 我感到没人能帮助我
8 我感到精力旺盛 9 我感到轻松 10 我会把烦心的事情放在心里 11 我遇到不高兴的事总是难以忘掉 12 我把烦心事说给别人听,之后感觉好多了 13 我感到紧张 14 我感到疲乏 积极情绪:1、8、9 消极情绪:2、4、5、7、13、14 外向应对:3、6、12 内向应对:10、11
第五章 因子分析
Factor Analysis
一、因子分析的作用 最重要的作用:减少变量,缩减数据。 通过研究多个变量间的内部关系,探寻变量 中的基本结构,并用少数几个假想变量来 表示基本的数据结构。 这些假想变量即是因子factors,它们能够反 映原来多个基础变量所表示的主要信息。 因子出现后,即可代表原来的多个基础变 量使用,以达到减少变量数的目的。(意义: