当前位置：文档之家› 第14讲因素分析

第14讲因素分析

一般因素分析得到的结果往往是很难加以解释的，当某些变量同时在几个因子上都有相当程度的负荷量时，因子的解释工作就更加困难
因子旋转的目的是通过改变坐标轴的位置，重新分配各个因子所解释的方差的比例，使因子结构更简单，更易于解释
在各因子上只有少数变量有较高的负荷，其它变量上的负荷（绝对值）很低
特征值解释量
a112+a212+a312 +a412+a512
(a112+a212+a312 +a412+a512) ÷5
a122+a222+a322+ a422+a522
(a122+a222+a322 +a422+a522) ÷5
因素模型：
x1=a11f1+a12f2 +u1 x2=a21f1+a22f2 +u2 x3=a31f1+a32f2 +u3 x4=a41f1+a42f2 +u4 x5=a51f1+a52f2 +u5
因素分析可以：通过减少变量的数量使对数据的解释简单化
研究焦点从具体的测验移向更一般性的因素，因素用来对大量个体测验传达的潜在信息进行概括和组织
二、因素分析数学模型
因素分析是通过研究多个变量间相关系数矩阵（协方差矩阵）的内部依赖关系，找出能综合所有变量的少数几个随机变量，这几个随机变量是不可测量的，通常称为因子，或因素，然后根据相关性的大小把变量分组，使得同组内的变量之间相关性较高，但不同组的变量相关性较低。
在实际应用中，由于斜交旋转的结果太容易受研究者主观意愿的左右，所以建议尽量采用默认的正交旋转
4、计算因子值
因子值是各个因子在每个案例上的得分值，有了因子值可以在其他的分析中使用这些因子
求解因子值的方法主要有：回归法、Bartlett法和Anderson-Rubin法，一般使用回归法
当公因子之间彼此正交时，公因子方差等于和该变量有关的因子负荷的平方和，用公式表示为：hi2=ai12+ai22+…+aim2
如何理解公因子方差呢？请回忆一下测定系数或决定系数负荷系数的平方就是变量xi与因子fj的共同变
异
m个公因子对第i个变量方差的贡献称为第i个变量的共同度
进行因素分析是达到相同结果的一个统计方法
请看表1
表1 两个深度知觉、一个阅读理解测验和一个词汇测验之间的关系
RC VOCAB FR
EF
阅读理解(RC) 1.0
词汇(VOCAB) 0.62 1.0
图形旋转(FR) 0.12 0.09 1.0 分解图形(EF) 0.04 0.11 0.76 1.0
因素负荷或因素载荷aij，第i个变量在第j个因子上的载荷，实质就是公因子fj和变量xi的相关系数（也就是原始变量与因素分析时抽取出来的共同因素之间的相关）
因素分析的一个重要内容就是由p个变量中抽出m个公共因子，并确定每一变量在各个因子上的因子负荷系数
2、公因子方差或共同度
共同度(communality)又叫公共方差，变量xi的公因子方差记做hi2
心理测量学
第十四讲因素分析
一、概述
心理测验通常显示出从中度到高度的正相关
假设：设计的两个测验是测量阅读理解和词汇的，两者之间的相关是0.53
请问：为什么这些测验是相关的
也许：它们相关是因为它们都测量了非常多的相同东西——言语能力
归纳推理：通过注意到两个测验似乎拥有共同的特征，鉴别出言语能力这个更一般的、抽象的、普通的变量
奇怪：根据常识或者直觉就能够精确解释结果，心理学为什么把自己陷入复杂的方法中去
在很多情况下，心理测验之间的相关模式比直觉方法更复杂，直觉方法不能产生靠和有效的结果
两个心理学家观察相同的相关矩阵时，在主观评估基础因素的数量和同一性上可能也会产生分歧
因素分析为判定因素的数量和这些因素的统计特征提供了一个分析方法
0.88
0.09
0.76
0.15
0.04
0.72
0.20
0.78
这个分析表明，这里有两个不同的因素
因素负荷，或最初的四个测验和这两个因素之间的相关标示在表2中
阅读理解和词汇与第一个因素显示出高相关，与第二个因素显示出低相关
FR和EF都与第二个因素显示出高相关，但是与第一个因素显示出低相关
(fa1c) tfo1，rs)f，2，它…们，是fm各叫个做观公测因变子量(c所om共m有on的因子，解释了变量之间的相关。公共因子都是均值为0，方差为1的变量。
(2) ui称为特殊因子(unique factor)，它是每个观测变量所特有的因子，只和xi有关，相当于残差，表示该变量不能被公因子所解释的部分。代表公因子以外的影响因素，实际分析时忽略不计。特殊因子的均值为0。
因素模型的一般表达形式为： xi=ai1f1+ai2f2+…+aimfm+ui (i=1，2，…，k)
x1 =a11f1+a12f2+…+a1mfm+u1 x2=a21f1+a22f2+…+a2mfm+u2 …
xk=ak1f1+ak2f2+…+akmfm+uk
这个模型，称为因子模型，在该模型中：
公因子方差反映的是单个变量被所有公因子解释的部分比例，因子贡献反映的则是单个因子解释的数据总方差
四、因素分析的步骤
首先，计算所有变量的相关矩阵第二步是提取因子第三步是进行因子旋转第四步是计算因子值第五步是解释因子
1、计算相关矩阵
计算所有变量之间的相关系数，得到相关矩阵 R
三、基本概念
因素(factor)和因素负荷
公因子方差或共同度
特征值(eigenvalues)和因子的贡献（解释量）
1、因素(factor)和因素负荷
潜在变量、假想变量
在因素分析中，通过研究众多变量之间的内部依赖关系，然后用少数几个假想变量来表示基本的数据结构，这些假想变量能够反映原来众多的观测变量所代表的主要信息，并解释这些观测变量之间的相互依存关系，我们把这些假想变量称之为因素。
5、对因子做出解释
以上的步骤，大部分可由软件都可替你做好。但最主要的步骤5，却是要使用者自行依照自己的专业判断来执行
五、SPSS软件中的因素分析
从菜单上选择<Analyze>的<Data Reduction>下的<Factor> 命令，即打开了因素分析的主对话框，在主对话框中，有指定参与因素分析的变量，还有五个子对话框可供选择。
二是碎石检验准则(scree test criterion) ，这种图的形状像一个山峰，从第一个因子开始，曲线迅速下降，然后下降变得平缓，最后变成近似一条直线，曲线变平
开始的前一个点认为是提取的最大因子个数
3、因子旋转
因素分析的目的不仅是求出公因子，更主要的是要知道每个因子的意义。通过坐标变换使因子解的实际意义更容易解释
KMO测度：该测度从比较观测变量之间的简单相关系数和偏相关系数的相对大小出发，是变量间相关系数平方和占这两种系数平方和的比率，其值的变化范围从0 到1。KMO值越接近1越好。至少＞0.6
2、提取因子
要确定因子的个数和求因子解的方法
要按某种规则确定所需要的因子数，用某种计算方法计算因子负荷矩阵
正交旋转(orthogonal rotation)方法主要包括：方差最大法(varimax)、四次方最大法 (quartimax)、等量最大法(equimax)
方差最大法（Varimax）：使各因子（列）上与该因子有关的负荷平方的方差最大，即拉开列上各变量的负荷差异，最常用
斜交旋转(oblique rotation)方法，比正交旋转更具有一般性，它没有因子之间是不相关的这个限制，主要是直接斜交旋转(Direct Oblimin)、快速斜交旋转法(Promax)
各个因子间互不相关，所有变量都可以表示成公因子的线性组合，因素分析的目的就是减少变量的数目，用少数因子代替所有变量去分析整个问题
f1
a11
a12
f2
a1m
x1
u1
x2
u2
… … …
Fm
xk
uk
图1 因素分析模型
因素分析模型，是每个观测变量由一组因素的线性组合来表示，设有k个观测变量（此为标准化变量），分别为x1，x2，…，xk，其中xi 为具有零均值、单位方差的标准化变量
任取两因子，每个变量只能在一个因子上有较高负荷
简言之，就是调整因素负荷矩阵式中的行、列值向0和1极化，使某些变量的负荷尽可能往某个因子上集中，而另一些变量的负荷尽可能往另一个因子上集中
• 旋转图解：良好的旋转应当使得变量向量尽可能落在坐标轴附近，且各坐标轴附近积聚的变量数或者各因素的累计贡献应大致平均。二维坐标系中，正交旋转只需把坐标轴旋转到尽可能接近变量处即可。多维坐标系将因子空间分解成多个二维平面，分别进行简单结构的旋转，直到得出稳定、一致的结果。
表示全部公因子对变量xi的总方差所做出的贡献
变量 f1
x1
a11
x2
a21
x3
a31
x4
a41
x5
a51
表3
f2 a12 a22 a32 a42 a52
共同度(h2)
a112+a122 a212+a222 a312+a322 a412+a422 a512+a522

e商务文档

第14讲因素分析

相关文档推荐：