五因素分析
该方法是以变量的相关系数矩阵为出发点。它的零假设相关系数矩阵是一个单位 阵。如果巴特利特球形检验的统计量数值较大,且其对应的相伴概率值小于用 户给定的显著性水平,那么应该拒绝零假设。反之,则不能拒绝零假设,认为 相反系数矩阵可能是单位阵,不适于做因子分析。
• KMO(Kaiser— Meryer — Olkin)检验
五、因素分析
定义
• 因素分析(factor analysis) • 根据相关性大小把变量分组,使得同组内 变量之间的相关性较高,不同组之间的相 关性较低。
• 每组变量对应于一个所谓的因子(factor)。 在因素分析中,因子被认为是造成该组变 量变化的共同原因。
– 因子分析的特点
• 因子分析的数量远少于原有的指标变量的数量,对 因子变量的分析能够减少分析中的计算工作量。
•Coefficient Display Format:选择载荷系数的显示格式
①Sorted by size:载荷系数按照数值得大小排列,并构成矩阵,使得在同 一因子上具有较高载荷的变量排列在一起,便于得出结论;
②Suppress absolute values less than:不显示那些绝对值小于指定值的载荷 系数。可以突出载荷较大的变量。
第二步:构造因子变量
第三步:利用旋转使得因子变量更具 有可解释性
–原始变量都是有物理含义的,对其进行线性变换后得到的 新综合变量的物理含义是什么呢?对于因子变量的解释, 可以进一步说明影响远变量系统构成的主要因素和系统特 征。 –在实际工作中,主要是通过对载荷矩阵A的值进行分析, 得到因子变量和原变量的关系,从而对新的因子变量进行 命名。 –在实际分析中,可以通过因子矩阵的旋转来分析清楚新的 因子变量的含义。 –旋转的方法有:正交旋转、斜交旋转、方差极大法,其中 最常用的是方差极大法。
– 因子分子后,因子提取的结果。其中: – Initial Eigenvalues:初始特征值;Extraction Sums ofSquared Loadings(未转轴)因素分析多抽取的共同因素数及其得分;Rotation Sums of Squared Loadings:转轴后因素分析所抽取的共同因素及其得分。 – Total:因子变量的方差贡献(特征值),它是衡量因子重要程度的指标。 – % of variance:因子变量的方差贡献率,表示该因子描述的方差占原有变量 总方差的比例,它的值是特征值除于总方差的结果。 – Cumulative%:因子变量的累积方差贡献率,表示前M个因子描述的总方差 占原有变量总方差的比例。
ቤተ መጻሕፍቲ ባይዱ
•Display
①Rotated Solution:输出因子旋转后的因子载荷矩阵; ②Loading plots:输出载荷散点图。
•Maximum Iterations for Convergence:转轴时跌代次数。
–Scores
•Save as variable:将因子作为新变量保存在操作的文 件中。系统提供三种估计因子得分系数的方法:
• 七个变量分成三组: • 身高、体重为一组,反映学生身形; • 三科入学成绩为一组,反映学习的学习成 绩; • 家庭人均年收入、年景月均支出为一组, 反映学生的家庭经济状况。
例题:
• 下面是12个问卷题目,用于调查小学生的 欺负行为。让被试根据他(她)自己过去 一年欺负同学的情况无记名回答。采用6级 记分:1-从来没有;2-有时这样;3-一个月 有一两次;4-一周一次左右;5-一周几次; 6-几乎天天如此。
–Extraction(抽取因子)
•Method
①Principal components:主成分分析法; ②Unweighted least squares:未加权最小平方法; ③Generalized least square:一般化最小平方法; ④Maximum Likelihood:最大概似法; ⑤Principal axis factoring:主轴法; ⑥Alpha Factoring:α因素抽取法; ⑦Image facoring:映像因素抽取法。
• 因子变量不是对原有变量的取舍,而是根据原始变 量的信息进行重新组构,它能够反映变量大部分的 信息。
–因子分析的四个基本步骤:
(1)确定待分析的原有若干变量是否适合于因子分析; (2)构造因子变量; (3)利用旋转使得因子变量更具有可解释性; (4)计算因子变量的得分。
–因子分析的两个核心问题:
• 因子转换矩阵,标明:
– 因子提取的方法是主成分分析法; – 旋转的方法是方差极大法
• 因子得分矩阵:
– 根据回归法计算得到的 因子得分函数的系数; – 根据这个表格可以得到 因子的得分函数。
• Analyze/Data Reduction/Factor:
–Descriptives
•Statistics(统计量)
①Univariate descriptives(简单变量描述统计量):要求输出个变量的均数和标准差; ②Initial solution(初始分析):表示输出初始分析结果。
参数说明:
•Correlation Matrix(相关矩阵):提供了几种检验变量是否合适做因子分析 的检验方法。
①Coefficients(系数):显示题项的相关矩阵; ②Significance levels(显著水准):求出签署相关矩阵的显著水准; ③Determinant(行列式):求出前述相关矩阵的行列式值; ④Inverse(倒数模式):求出相关矩阵的反矩阵; ⑤Reproduced(重制的):显示重制相关矩阵; ⑥Anti image(反映像):求出反映像的共变量及相关矩阵。 ⑦KMO and Bartlett’s test of sphericity:KMO检验和Bartlett球形检验。
第四步:计算因子变量得分
–因子变量得分是因子分析的最后一步。 –因子变量的得分是确定每一个样本数据在 不同因子上的具体数据值。 –估计因子得分的方法有:
• 回归(Regression)法
• Bartlett法 • Anderson—Rubin法等。
例:
• 假设调查某校高中新生的情况,包括身高、 体重、语文入学成绩、数学入学成绩、英 语入学成绩、家庭人均年收入、家庭月均 支出。
• • • • • • • • • • • •
Q1说同学坏话; Q2有同学走过来时故意撞上去; Q3让人传播某个同学的谣言; Q4说点难听的取笑同学; Q5向同学扔东西; Q6让人不要理某个同学; Q7给同学取不好的绰号; Q8推撞同学; Q9给某个同学脸色看; Q10嘲弄同学的长相; Q11挑起事端和人打架; Q12有意不让某个同学参加活动。
•Analyze
①Correlation matrix:相关矩阵 ②Covariance matrix:共变异数矩阵。
•Display
①Unrotated factor solution:未旋转因子解,显示未旋转轴时因素负荷量、特征值和共同 性; ②Scree plot:陡坡图。
•Extract
①Eigenvalues over(特征值):因子抽取时,只抽取特征值大于该值得变量; ②Number of factors(因子个数):限定新综合因子的个数
KMO统计量用于比较变量间简单相关和偏相关系数。KMO取值范围在0和1之间。 Kaiser给出了一个KMO是否适合做因子分析的标准:
0.9<KMO,非常适合; 0.7<KMO<0.8,一般; KMO<0.5,不适合 0.8<KMO<0.9,适合; 0.6 <KMO<0.7,不太适合
– 因子分析中有多种确定变量的方法,如基于主成 分模型的主成分分析法、基于因子分析模型的主 轴因子法、极大似然法、最小二乘法等。 – 使用最多的是:主成分分析法。 – 主成分分析法:
①Regression:回归法 ②Bartlett法 ③Anderson Rubin法
•Display factor coefficient matrix:显示因子得分系数 矩阵。
–Options: 指定其他因子分析的结果,并选择缺失数据的处理方法。
•Missing Values:
①Exclude cases listwise:去除所有含缺失值得变量; ②Exclude cases pairwise:当分析计算涉及到含有缺失值得变量,则去掉 在该变量上市缺失值得个案; ③Replace with mean:当分析计算涉及到含有缺失值得变量时,用平均值 代替该缺失值。
(1)如何构造变量; (2)如何对因子变量进行命名解释。
第一步:确定待分析的原有若干变量是否适 合于因子分析
– 判断是否适合于因子分析的依据:原有变量之间是否具有较强的相 关性,如果有,则适合。 – SPSS提供的判断变量是否适于做因子分析的方法:
• 巴特利特球形检验(Bartlett Test of Sphericity)
–Rotation
•Method(因子转轴方法)
①None:不需要转轴; ②Varimax:方差极大法旋转,属于正交转轴之一; ③Quartimax:四分最大正交旋转,属于正交转轴之一; ④Equamax:平均正交旋转,属于正交转轴之一; ⑤Direct Oblimin:直接斜交转轴法,属于斜交转轴法之一; ⑥Promax:斜交转轴法之一。
– 因子载荷矩阵
• 最终的因子载荷矩阵A, 对应前面的因子分析的 数学模型部分。
– 旋转后的因子载荷矩阵 – 按照前面设定的“方差极 大法”对因子载荷举证旋 转后的结果。 – 注:未经旋转的载荷举证 中,因子变量在许多变量 上都有较高的载荷,含义 比较模糊不易命名。 – 经转轴后:
• 第一个因子变量含义略加清 楚,反映“权利距离”、 “职位升迁”、“领导风 格”、“发展机会”、“出 发点”。 • 第二个因子基本上反映“团 队合作”、“分配”两个变 量。 • 第三个因子基本上反映“社