当前位置：文档之家› 因素分析

因素分析

5、对因子做出解释

以上的步骤，大部分可由软件都可替你做好。但最主要的步骤5，却是要使用者自行依照自己的专业判断来执行
五、SPSS软件中的因素分析
从菜单上选择<Analyze>的<Data Reduction>下的<Factor> 命令，即打开了因素分析的主对话框，在主对话框中，有指定参与因素分析的变量，还有五个子对话框可供选择。分别是<Descriptives>、<Extraction>、 <Rotation>、<Score>、<Options>
y
y’ x’
z’ x z

一般来说，转轴的方法有两大类：正交转轴法和斜交转轴法正交旋转是使因子轴之间仍然保持90度角，即因子之间是不相关的

斜交旋转中，因子之间的夹角可以是任意的，即因子之间不一定是正交的

正交旋转(orthogonal rotation)方法主要包括：方差最大法(varimax)、四次方最大法 (quartimax)、等量最大法(equimax)

②因子个数的确定

有两个方法：一个是特征值准则，即取特征值大于等于1的主成分或公因子作为初始因子，放弃特征值小于1的
二是碎石检验准则(scree test criterion) ，这种图的形状像一个山峰，从第一个因子开始，曲线迅速下降，然后下降变得平缓，最后变成近似一条直线，曲线变平开始的前一个点认为是提取的最大因子个数
附近，且各坐标轴附近积聚的变量数或者各因素的累计贡献应大致平均。二维坐标系中，正交旋转只需把坐标轴旋转到尽可能接近变量处即可。多维坐标系将因子空间分解成多个二维平面，分别进行简单结构的旋转，直到得出稳定、一致的结果。
对旋转的理解

降维的过程就通过旋转坐标，把方差最大方向做为坐标，而淘汰方差较小的纬度，这样就可以将N维空间的问题转化为一维空间的距离问题。
A =
三、基本概念

因素(factor)和因素负荷公因子方差或共同度特征值(eigenvalues)和因子的贡献（解释量）

1、因素(factor)和因素负荷

潜在变量、假想变量
在因素分析中，通过研究众多变量之间的内部依赖关系，然后用少数几个假想变量来表示基本的数据结构，这些假想变量能够反映原来众多的观测变量所代表的主要信息，并解释这些观测变量之间的相互依存关系，我们把这些假想变量称之为因素。
3、特征值和因子的贡献（解释量）
每个公因子对数据的解释能力，可以用该因子所解释的总方差来衡量，通常称为该因子的贡献(contributions) ，记为Vp 它等于和该因子有关的因子负荷的平方和，即Vp=∑a2ip

实际中更常用相对指标，即因子贡献率，用每个因子所解释的方差占所有变量总方差的比例来表示
3、因子旋转

因素分析的目的不仅是求出公因子，更主要的是要知道每个因子的意义。通过坐标变换使因子解的实际意义更容易解释
一般因素分析得到的结果往往是很难加以解释的，当某些变量同时在几个因子上都有相当程度的负荷量时，因子的解释工作就更加困难

因子旋转的目的是通过改变坐标轴的位置，重新分配各个因子所解释的方差的比例，使因子结构更简单，更易于解释

方差最大法（Varimax）：使各因子（列）上与该因子有关的负荷平方的方差最大，即拉开列上各变量的负荷差异，最常用

斜交旋转(oblique rotation)方法，比正交旋转更具有一般性，它没有因子之间是不相关的这个限制，主要是直接斜交旋转(Direct Oblimin)、快速斜交旋转法(Promax)
f1
a11 a12
x1
u1
f2
…
x2
…
u2
…
a1m
Fm
xk
uk
图1 因素分析模型

因素分析模型，是每个观测变量由一组因素的线性组合来表示，设有k个观测变量（此为标准化变量），分别为x1，x2，…，xk，其中xi 为具有零均值、单位方差的标准化变量
因素模型的一般表达形式为： xi=ai1f1+ai2f2+…+aimfm+ui (i=1，2，…，k) x1 =a11f1+a12f2+…+a1mfm+u1 x2=a21f1+a22f2+…+a2mfm+u2 … xk=ak1f1+ak2f2+…+akmfm+uk

这个模型，称为因子模型，在该模型中：

(1) f1，f2，…，fm叫做公因子(common factors)，它们是各个观测变量所共有的因子，解释了变量之间的相关。公共因子都是均值为0，方差为1的变量。
(2) ui称为特殊因子(unique factor)，它是每个观测变量所特有的因子，只和xi有关，相当于残差，表示该变量不能被公因子所解释的部分。代表公因子以外的影响因素，实际分析时忽略不计。特殊因子的均值为0。
心理测量学
第十四讲因素分析
一、概述

心理测验通常显示出从中度到高度的正相关
假设：设计的两个测验是测量阅读理解和词汇的，两者之间的相关是0.53 请问：为什么这些测验是相关的

也许：它们相关是因为它们都测量了非常多的相同东西——言语能力归纳推理：通过注意到两个测验似乎拥有共同的特征，鉴别出言语能力这个更一般的、抽象的、普通的变量进行因素分析是达到相同结果的一个统计方法

当因素分析被运用到表1所表示的相关时，结果与我们通过对这些相关进行日常分析的结果是非常相似的
表2 对表1中的相关进行一个因素分析的结果
变量阅读理解
因素负荷
因素1
0.88
因素2
0.09
词汇
图形旋转
0.76
0.04
0.15
0.72
分解图形
0.20
0.78

这个分析表明，这里有两个不同的因素因素负荷，或最初的四个测验和这两个因素之间的相关标示在表2中阅读理解和词汇与第一个因素显示出高相关，与第二个因素显示出低相关 FR和EF都与第二个因素显示出高相关，但是与第一个因素显示出低相关

(3) aij称为因子负荷(factor loadings)，它是第i个变量xi在第j个公因子fj上的负荷。因素负荷或因素载荷，实质就是公因子fj和变量 xi的相关系数。矩阵A=（aij）称为因子载荷矩阵。 a11 a21 … ak1 a12 a22 … ak2 … a1m … a2m … … … akm
公因子方差反映的是单个变量被所有公因子解释的部分比例，因子贡献反映的则是单个因子解释的数据总方差
四、因素分析的步骤

首先，计算所有变量的相关矩阵第二步是提取因子

第三步是进行因子旋转
第四步是计算因子值第五步是解释因子
1、计算相关矩阵

计算所有变量之间的相关系数，得到相关矩阵 R 根据计算出的相关矩阵还应该进一步判断应用因子分析方法是否合适

当公因子之间彼此正交时，公因子方差等于和该变量有关的因子负荷的平方和，用公式表示为：hi2=ai12+ai22+…+aim2

如何理解公因子方差呢？请回忆一下测定系数或决定系数负荷系数的平方就是变量xi与因子fj的共同变异

m个公因子对第i个变量方差的贡献称为第i个变量的共同度表示全部公因子对变量xi的总方差所做出的贡献

在实际应用中，由于斜交旋转的结果太容易受研究者主观意愿的左右，所以建议尽量采用默认的正交旋转
4、计算因子值

因子值是各个因子在每个案例上的得分值，有了因子值可以在其他的分析中使用这些因子求解因子值的方法主要有：回归法、Bartlett法和Anderson-Rubin法，一般使用回归法
二、因素分析数学模型

因素分析是通过研究多个变量间相关系数矩阵（协方差矩阵）的内部依赖关系，找出能综合所有变量的少数几个随机变量，这几个随机变量是不可测量的，通常称为因子，或因素，然后根据相关性的大小把变量分组，使得同组内的变量之间相关性较高，但不同组的变量相关性较低。

各个因子间互不相关，所有变量都可以表示成公因子的线性组合，因素分析的目的就是减少变量的数目，用少数因子代替所有变量去分析整个问题
特征值 a112+a212+a312 a122+a222+a322+
+a412+a512 a422+a522 解释量 (a112+a212+a312 (a122+a222+a322 +a412+a512) +a422+a522) ÷5 ÷5
因素模型： x1=a11f1+a12f2 +u1 x2=a21f1+a22f2 +u2 x3=a31f1+a32f2 +u3 x4=a41f1+a42f2 +u4 x5=a51f1+a52f2 +u5
在各因子上只有少数变量有较高的负荷，其它变量上的负荷（绝对值）很低任取两因子，每个变量只能在一个因子上有较高负荷

简言之，就是调整因素负荷矩阵式中的行、列值向0和1极化，使某些变量的负荷尽可能往某个因子上集中，而另一些变量的负荷尽可能往另一个因子上集中
• 旋转图解：良好的旋转应当使得变量向量尽可能落在坐标轴

e商务文档

因素分析

相关文档推荐：