因素分析的步骤
主成分载荷矩阵Component Matrix 主成分载荷矩阵 主成分载荷矩阵表达了用两个主成分所形成的方程, 用主成分载荷矩阵表达了用两个主成分所形成的方程,方 程形式应当是: 程形式应当是:
Componentl=0.713Xl-0.728X2+0.93X3+0.881X4+0.564X5+0.827X6 Component2=-0.5Xl+0.249X2+0.284X3+0.329X4-0.684X5+ 0.448X6
公共因素方差变化表Communalities: : 公共因素方差变化表 将各个变量在因素抽取前后所发生的方差变化列出来。 将各个变量在因素抽取前后所发生的方差变化列出来 。 为抽取之前各个变量的方差, , “Initial”为抽取之前各个变量的方差,如果一律认为是 为抽取之前各个变量的方差 如果一律认为是100%, 则抽取后各个变量的方差将变为“ 所列出的数值。 则抽取后各个变量的方差将变为 “ Extraction”所列出的数值。 所列出的数值 所列出的数值不应当小于0.5。 “Extraction”所列出的数值不应当小于 。 所列出的数值不应当小于 总方差解释表 Total Variance Explained 总方差解释表对各个变量作为主成分的特征值进行了计算。 总方差解释表对各个变量作为主成分的特征值进行了计算。 由于系统采用的方法为主成分分析法,因此, 由于系统采用的方法为主成分分析法,因此,抽取的因素就是 主成分。 主成分。 表中初始特征值“ 一项的“ 表中初始特征值“Initial Eigenvalues”一项的“Total”中可 一项的 中可 以看到,只有可能抽取两个因素作为主成分因素, 以看到,只有可能抽取两个因素作为主成分因素,因为其他初 始特征值都小于 小于1。从表中初始特征值“ 始特征值都小于 。从表中初始特征值“Initial Eigenvalues”的 的 另一项积累百分比“Cumulative %”中可以看到,当抽取两个 另一项积累百分比“ 中可以看到, 中可以看到 因素作为主成分时,它两个的积累百分比已经达到80.862%, 因素作为主成分时,它两个的积累百分比已经达到 , 这可以解释成为用两个主成分的贡献率已经达到80.862%了, 这可以解释成为用两个主成分的贡献率已经达到 了 故使用两个主成分的解释率已经非常高了。 故使用两个主成分的解释率已经非常高了。
因素分析的概念
现假定在某次研究过程中有观测变量: 现假定在某次研究过程中有观测变量: X1、 X2……Xm, 定义因素: 定义因素 : F1 、 F2……Fn 。 其关系可以用下述线性方程组表 示: X1= P11F1+ P12F2……P1nFn+E1 X2= P21 F1+ P21F2……P2nFn+E2 …… Xm= Pm1 F1+ Pm2F2……PmnFn+Em 方程中的系数P 称为因素的系数, 方程中的系数 ij (i=1…m,j=1…n)称为因素的系数, 表 , 称为因素的系数 示因素对某个变量的贡献, 因素载荷” 示因素对某个变量的贡献,即“因素载荷”。 Fi 之间彼此是 正交的,即彼此是不相关的。常数E 称为残差。 正交的,即彼此是不相关的。常数 I称为残差。 因素分析法还定义了一个表达每个因素对所有变量的总 贡献的量:特征值“ 因素载荷P 的平方和。 贡献的量: 特征值“ Eigenvaluej”。即: 因素载荷 ij的平方和。 。 2 m 通常认为,特征值“ 越大越好, 通常认为,特征值“Eigenvaluej”越大越好,当特征值低于 , 越大越好 当特征值低于1, Eigenvalue = ∑ p ij 则该因素就没有意义了。 则该因素就没有意义了。 i=1
⒉“Display”结果显示 结果显示 显示旋转结果。 “Rotated Solution”:显示旋转结果。在指定了旋转方法后, 显示旋转结果 在指定了旋转方法后, 对 正 交 旋 转 将 显 示 : 旋 转 成 分 矩 阵 “ Rotated Component Matrix” 和 成 分 转 换 矩 阵 “ Component Transformation Matrix”, 前者是正交旋转后产生的因素载荷矩阵,后者是正 , 前者是正交旋转后产生的因素载荷矩阵, 交旋转后因素相关矩阵。而对斜交旋转将显示:旋转后的因素 交旋转后因素相关矩阵。而对斜交旋转将显示: 模 式 矩 阵 “ Pattern Matrix” 和 因 素 结 构 矩 阵 “ Structure Matrix”,前者是在叠代到第 次时产生的因素载荷矩阵,后者 次时产生的因素载荷矩阵, ,前者是在叠代到第5次时产生的因素载荷矩阵 是在叠代完毕后产生的因素载荷矩阵。另外还将显示 成分因素相关矩阵。 “Component Correlation Matrix”成分因素相关矩阵。 成分因素相关矩阵 显示因素载荷散点图“ “Loading plot(s)”显示因素载荷散点图“Component Plot 显示因素载荷散点图 in Rotated Space”。该图形是一个双因素或三因素关于各个变 。 量的载荷散点图。每个变量在图形中为一个数据点,这些数据 量的载荷散点图。每个变量在图形中为一个数据点, 点最好能够分布在某一个坐标轴的远端,即载荷越接近1或 点最好能够分布在某一个坐标轴的远端 ,即载荷越接近 或 -1 越好,而对于另一个坐标轴则越接近0越好 即载荷越接近0越 越好, 越好,而对于另一个坐标轴则越接近 越好,即载荷越接近 越 好。 ⒊“Maximum Iteration for Convergence”最大叠代收敛次 最大叠代收敛次 数 系统默认叠代收敛次数为25次 系统默认叠代收敛次数为 次。
因素分析的过程就是求出该方程组的因素载荷及残差。 因素分析的过程就是求出该方程组的因素载荷及残差 。 如果在方程中残差E 的值很小,可以忽略,方程将变成齐次 齐次的 如果在方程中残差 I的值很小,可以忽略,方程将变成齐次的, 则能够产生变换方程: 则能够产生变换方程: F1= A11 X1+ A12 X 2……A1nXm F2= A21 X1+ A21 X 2……A2nXm …… Fn= Am1 X1+ Am2 X 2……AmnXm 式中的F 为主成分向量。 式中的 i 为主成分向量 。 而 Aij 所形成的矩阵称为主成分 变换矩阵。 变换矩阵。 按照各个变量对因素的方差分析情况将可以产生主成分 分析(Principal Components Analysis)的结果。 由各个变量描 的结果。 分析 的结果 述的因素将通过变量贡献的大小依次排列, 述的因素将通过变量贡献的大小依次排列,其中前几个因素就 集中了对大部分变量的载荷。因此, 集中了对大部分变量的载荷。因此,只需选用前几个因素就把 所有变量描述的主要性质包括了, 所有变量描述的主要性质包括了,剩下的因素将可以作为次要 因素而忽略。 因素而忽略。
为了使因素结构特征比较明确,往往采用一种叫作“旋转” 为了使因素结构特征比较明确,往往采用一种叫作“旋转” 的方法。经过旋转后,产生的因素对变量的载荷更为集中, 的方法。经过旋转后,产生的因素对变量的载荷更为集中,而 自身仍保持正交性,这称为“正交旋转” 自身仍保持正交性,这称为“正交旋转”。而在某些特殊要求 为了使因素结构更为明确,可以不考虑因素之间的正交性, 下,为了使因素结构更为明确,可以不考虑因素之间的正交性, 而使因素与变量之间的关系更容易从理论上加以解释, 而使因素与变量之间的关系更容易从理论上加以解释,这种方 法称为“斜交旋转” 法称为“斜交旋转”。
由主成分载荷矩阵可以了解到主成分 “Componentl”对每 主成分载荷矩阵可以了解到主成分1 可以了解到主成分 对每 一个变量的载荷都不小,而主成分2 一个变量的载荷都不小,而主成分 “Component2”对每一个 对每一个 变量的载荷都不大。这可以理解为,主成分1可以解释所有变 变量的载荷都不大。这可以理解为,主成分 可以解释所有变 量的绝大部分,而主成分2只能解释所有变量的剩下的一小部 量的绝大部分,而主成分 只能解释所有变量的剩下的一小部 这对于理论上的解释是很困难的。因为, 分。这对于理论上的解释是很困难的。因为,我们不能说出因 素一或主成分1 涵盖了哪些变量测量的结果, 素一或主成分 “Componentl”涵盖了哪些变量测量的结果,因 涵盖了哪些变量测量的结果 涵盖了另一些变量测量的结果。 素二或主成分2 素二或主成分 “Component2”涵盖了另一些变量测量的结果。 涵盖了另一些变量测量的结果 为了使因素能够更好的解释变量, 为了使因素能够更好的解释变量,应当将不同因素所解释 的变量尽量分开 这就需要采用后面所介绍的旋转方法了。 尽量分开, 的变量尽量分开,这就需要采用后面所介绍的旋转方法了。
二、旋转法因素分析 因素分析对话窗口下方的“ 旋转)按钮 因素分析对话窗口下方的“Rotation” (旋转 按钮,有两个 旋转 按钮, 选择模块和一个单项选择。 选择模块和一个单项选择。 ⒈“Method”旋转方法 旋转方法 不进行旋转,这是系绕默认选项。 “None”: 不进行旋转,这是系绕默认选项。 方差最大旋转, “Varimax”: 方差最大旋转,为正交矩阵旋转最常用的方 法。这种方法可以尽量减少每个因素上的具有最大载荷的变量 个数。 个数。 四次方最大正交旋转。 “Quartmax”: 四次方最大正交旋转。这种方法可以尽量减 少解释每个变量的因素个数。 少解释每个变量的因素个数。 平均正交旋转。 “Equamax”: 平均正交旋转。这种方法既可以尽量减少每 个因素上的具有最大载荷的变量个数,又可以减少解释每个变 个因素上的具有最大载荷的变量个数, 量的因素个数。 量的因素个数。 “ Direct Oblimin”: 直 接 斜 交 旋 转 。 选 择 该 项 还 须 在 提示后输入一个“ 之间, “ Delta”提示后输入一个“Delta”值,该值应该在 ~ -l之间, 提示后输入一个 值 该值应该在O~ 之间 是因素映象自相关的范围。 值产生最高相关因素 值产生最高相关因素, 是因素映象自相关的范围。 0值产生最高相关因素,大负数产 生的斜交旋转的结果与正交旋转的结果接近。 生的斜交旋转的结果与正交旋转的结果接近。 斜交旋转。这种方法可以允许因素之间相关, “Promax”: 斜交旋转。这种方法可以允许因素之间相关, 其处理速度比直接斜交旋转法快,适合样本数量较大的情况。 其处理速度比直接斜交旋转法快,适合样本数量较大的情况。