当前位置:文档之家› 5因子分析

5因子分析


2、因子特征值及百分比
Initial Eigenvalues Compon er Craction Sums of Squared Loadings Rotation Sums of Squared Loadings
Total
% of Varia nce 31.900 15.933 13.402 10.139 8.536 8.024 6.856 5.209
2、基本步骤: 1)选择基础变量,并对基础变量的适合状况 进行分析(相关关系测量); 2)从基础变量中提取因子(公共因子法与主 成分法),涉及因子个数判别,因子个数应 少于基础变量; 3)进行因子旋转,即通过坐标变换使因子两 两独立,以得到更合理的因子解。不旋转, 因子负荷有时可能过分偏低。可注意对比转 轴前后的因子负荷矩阵; 4)计算每个样本在各个因子上的因子得分, 该得分即是每个样本在各因子变量上的取值。
• 重要概念: 因子负荷是一个矩阵,表示公因子与基 础变量间的相关系数。负荷大,表示 该公因子与某基础变量间存在较大关 系。观察负荷矩阵,可以看出公因子 在哪些变量上有较大负荷,可以据此 说明公因子的实际含义。若矩阵缺乏 规律,不能看出某个含义,还需要进 行因子旋转,(增加因子变量)以求得更好 的解释。
五、因子分析应用范例 1、问卷题目删留情况: 问卷的第三部分关于“群体身份认同”的调查采用里克特五 等级尺度总加量表,在问卷录入时,根据回答强态度的强 弱对回答结果进行赋值,具体赋值情况是:完全不同意为1, 有点不同意为2,说不清为3,基本同意为4,完全同意为5。 项目分析的目的是为了对项目进行筛选和修订,项目的选 择采用双重标准,首先计算项目鉴别系数,然后计算单项 与总分的相关系数。项目鉴别度的计算公式为:项目鉴别 指数=(RH-RL)/N 在此公式中,RH表示高分组在每个项目上的平均得分(高分 组之和除以N),RL表示低分组在每个项目上的平均得分 (低分组之和除以N),N表示抽出的项目数。从数据分析 结果看,有2项的鉴别指数达不到0.25(第21题和第26题), 首先删除;再进行单项与总分的相关系数计算(本量表采 用Pearson相关系数),结果显示有一项(第25题)相关系 数达不到显著性程度(P<0.05),最后保留8项。
三、SPSS因子分析操作与结果解释 analyze——data reduction——factor 1、选择并描述基础变量,并对基础变量进 行检验判断: Descriptives 对话框 Univariate descriptives:单变量描述统计 量,输出各基础变量的均值和标准差; coefficients:输出基础变量间的相关系数 矩阵,注意各值是否大于0.3; KMO and Bartlett’s test of sphericity:输 出检验显著度及KMO值。
对话框中选择display factor score coefficient matrix将输出: Component score coefficient matrix因子 得分函数系数矩阵,据此矩阵可写出各 公因子的线性表达式。
四、因子分析结果与其他分析方法的结合 主要依赖因子变量。注意因子变量是标准 化的变量。 因子变量成为因变量; 因子变量成为自变量; 因子变量成为分析变量,如根据因子变量 进行聚类。 (因子分析是下一步分析的起点,不是终点,而聚类是终点)
Extract:控制提取过程和提取结果。 Eigenvalues over中默认值为1,即提取特 征值(根)大于1的因子(小于1,说明该 因子解释力度还不如直接引入一个原变量 的平均解释力度大);利用number of factors可指定提取因子的数目。 Display:结果显示。Unrotated factor solution默认输出未经旋转的因子提取结果。
2、提取因子 两种方法:主成分法与公共因子法(数学原 理完全不同,具体的差异可见郭P101102)。早期人们使用主成分法,它对变 量的分布没有要求。后期发展出因子法, 更灵活有效。 Extraction因子提取对话框 Method中的principal components即为主成 分法,为系统默认; 如果数据良好,则各个方法提取因子的结果 相同;若样本数超过1500,极大似然法会 更精确;若数据不好,后两种方法更适用; 如果条件不明,仍用主成分法。
4、从因子分析结果出发形成的路径分析图
0.310 品牌考虑 0.860
u
身份区隔感
0.397 0.755
广告兴趣
0.279 =0.50ຫໍສະໝຸດ 0.433w=0.516
身份符合感
0.281
外观设计
身份紧张感
0.120 流行时尚 0.746
0.818
v
0.214
结果表明,身份区隔感对大多数消费符号存在影响,而且是直接 性的,它对品牌、广告以及时尚的作用强度分别达到0.310、 0.397和0.279,这说明大学生在进行电子产品消费时受到所在 群体的影响,他们消费的欲望更多的来源于符号价值的需求 而不是使用价值的需要。一件商品,越是能体现消费者的社 会品味和身份,越是能将消费者与他人区分开来,就越是受 到大学生们的喜爱。 身份符合感和身份区隔感存在相关,达到0.502,身份符合感与 广告兴趣和外观设计两者的相关系数分别为0.433和0.281,通 过广告的宣传渲染、外观设计的强化的推动,这种对于融入 群体的身份符合感也就越强,因此,在身份符合方面,大学 生们更多的把目光转向了外观设计和流行时尚。 在身份紧张感方面,由于身份紧张感在某种程度上可以看作是身 份区隔感和身份紧张感的缩影,因此相关系数仅为0.120和 0.214,比较合理的解释是大学生在电子产品消费中考虑更多 的是品牌和外观,通过这种外在的表现,能够帮助大学生在 心理上获得一种群体隶属来与他人“相称”或者使自己的身 份地位得到群体的承认,主要通过炫耀性消费来表现。上述 结果表明,大学生群体身份认同对电子产品消费的符号性的 影响更多属于是直接性的,而且是显著的。
例,结构效度 情绪及情绪应对量表: 1=完全没有 2=很少有 3=有时有 4=经常有 5=每 天都有 1 我感到愉快 2 我感到郁闷 3 我情绪不好时会想办法让自己高兴起来 4 我感到自己不知怎么做才好 5 我感到有压力 6 我想哭就哭,我哭出来感觉好多了 7 我感到没人能帮助我
8 我感到精力旺盛 9 我感到轻松 10 我会把烦心的事情放在心里 11 我遇到不高兴的事总是难以忘掉 12 我把烦心事说给别人听,之后感觉好多了 13 我感到紧张 14 我感到疲乏 积极情绪:1、8、9 消极情绪:2、4、5、7、13、14 外向应对:3、6、12 内向应对:10、11
4、计算每个样本在各个因子上的因子得分 Scores对话框 Save as variables (regression方法)。 即可在数据库中将因子存为单独的变量, 每个样本在该变量上的取值为因子得分, 是根据因子得分矩阵的线性方程计算得 出的。 这些因子变量及其取值存储在数据库中, 以便在其他分析中直接使用。
3)数据样本量应达到一定水平 一般要求样本量至少是变量数的5倍以上, 最好达到10倍以上; 理论上要求样本量不应该少于100。样本量 越大越好。 4)社会学中多见李克特量表(五级)用于 因子分析,使用时应注意该量表应具有一 定的鉴别力(鉴别力不强的要删掉,即某一问题的回答基 本一致),否则因子分析效果不佳。
Total
% of Varia nce 27.972 18.914 14.349 ------
Cumulative % 27.972 46.886 61.235 ------
1 2 3 4 5 6 7 8
2.552 1.275 1.072 0.811 0.683 0.642 0.548 0.417
2.552 1.275 1.072 ------
3、进行因子旋转,进一步明确因子组合。 旋转并不改变因子分析的整体结果,只是影 响各因子在各个变量上的载荷分布,并影 响各因子的贡献率。 Rotation对话框。SPSS提供5种旋转方法。 最常用的是Varimax方差最大正交旋转,其 次为Quartimax四次方最大正交旋转。 斜交旋转需要指明角度,一般不用。正交表 示各变量间两两独立,斜交则有一定相关 性。 确定旋转后将输出旋转后的因子负荷表。
独立用,做单变量;做双变量)
因子分析独立使用时通过少量的因子可以更 清楚地把握诸多变量的本质,另外它常是 一种数据整理或准备。
具体作用: 1)有些变量实际观察不到,但又确实发挥影响, 如价值观、能力、爱好等,只能使用抽象的 因子来测量; 2)变量太多,需要简化; 3)多元回归(毛病:自变量的相关性不能太强)中常出现多 重共线性,需要去掉一些变量,但无法有充 分理由选择去除某个变量,故可将这些变量 合并成因子,使用因子代替原有变量进行回 归分析,即无多重共线性。如将收入和受教 育程度合并为社会经济地位(SES)一个变量; 4)评价问卷的结构效度;
2.238 1.513 1.148 ------
3、旋转与解释 将因子负荷矩阵进行正交旋转(Component Matrix),通过改变 坐标轴位置,重新分配各因子所解释方差的比例,使因子结构 更简单,更易于解释。
题号及 因子 名 因子1 C5 C6 C7 因子2 C1 (身份区隔感): 若条件允许,我也想跟其他同学一样买昂贵的信息产品 我们青年人在购买产品时总是首先考虑它的时尚元素 题项
5)在路径分析模型(缺乏总的解释力)向 结构方程模型Lisrel(可以有总解释力) 转化中,潜在变量的影响作用常需作因子 处理(因为太多了),结构分析因此由回归 和因子分析组成。 如经典的研究子女收入的路径分析中,子 女教育程度被单向认为是决定子女收入的, 但实际上子女收入也会反过来影响子女教 育程度,且在子女收入上除教育程度外, 个人各种能力也会影响收入,这时只能使 用结构分析模型,个人能力影响部分就需 先作因子分析。
二、因子分析的数据要求和基本步骤 1、数据要求: 1)进行因子分析的各基础变量应是定距变 量,虚拟变量可以同时引入,但结果可 能不好(Why?数量级的影响); 2)各基础变量间应存在较强的相关关系。 可以计算各变量的相关矩阵(两两变量之间的 相关系数),最好相关矩阵中的所有相关系 数大于0.3;SPSS提供巴雷特球体检验和 KMO值,要求检验通过且KMO值大于 0.5,否则不能进行因子分析,KMO值大 于0.9时效果最好 。
相关主题