当前位置:文档之家› 因素分析

因素分析



5、对因子做出解释

以上的步骤,大部分可由软件都可替你做好。 但最主要的步骤5,却是要使用者自行依照自 己的专业判断来执行
五、SPSS软件中的因素分析
从菜单上选择<Analyze>的<Data Reduction>下的<Factor> 命令,即打开了因 素分析的主对话框,在主对话框中,有指定 参与因素分析的变量,还有五个子对话框可 供选择。 分别是<Descriptives>、<Extraction>、 <Rotation>、<Score>、<Options>
y
y’ x’
z’ x z

一般来说,转轴的方法有两大类:正交转 轴法和斜交转轴法 正交旋转是使因子轴之间仍然保持90度角, 即因子之间是不相关的


斜交旋转中,因子之间的夹角可以是任意 的,即因子之间不一定是正交的

正交旋转(orthogonal rotation)方法主要包 括:方差最大法(varimax)、四次方最大法 (quartimax)、等量最大法(equimax)

②因子个数的确定

有两个方法:一个是特征值准则,即取特征 值大于等于1的主成分或公因子作为初始因 子,放弃特征值小于1的
二是碎石检验准则(scree test criterion) ,这种图的形状 像一个山峰,从第一个因子开始,曲线迅速下降,然 后下降变得平缓,最后变成近似一条直线,曲线变平 开始的前一个点认为是提取的最大因子个数
附近,且各坐标轴附近积聚的变量数或者各因素的累计贡献 应大致平均。二维坐标系中,正交旋转只需把坐标轴旋转到 尽可能接近变量处即可。多维坐标系将因子空间分解成多个 二维平面,分别进行简单结构的旋转,直到得出稳定、一致 的结果。
对旋转的理解

降维的过程就通过旋转坐标,把方差最大方 向做为坐标,而淘汰方差较小的纬度,这样 就可以将N维空间的问题转化为一维空间的 距离问题。
A =
三、基本概念

因素(factor)和因素负荷 公因子方差或共同度 特征值(eigenvalues)和因子的贡献(解 释量)


1、因素(factor)和因素负荷

潜在变量、假想变量
在因素分析中,通过研究众多变量之间的内部 依赖关系,然后用少数几个假想变量来表示基 本的数据结构,这些假想变量能够反映原来众 多的观测变量所代表的主要信息,并解释这些 观测变量之间的相互依存关系,我们把这些假 想变量称之为因素。
3、特征值和因子的贡献(解释量)
每个公因子对数据的解释能力,可以用该 因子所解释的总方差来衡量,通常称为该 因子的贡献(contributions) ,记为Vp 它等于和该因子有关的因子负荷的平方和, 即Vp=∑a2ip

实际中更常用相对指标,即因子贡献率, 用每个因子所解释的方差占所有变量总方 差的比例来表示
3、因子旋转

因素分析的目的不仅是求出公因子,更主要的 是要知道每个因子的意义。通过坐标变换使因 子解的实际意义更容易解释
一般因素分析得到的结果往往是很难加以解释 的 ,当某些变量同时在几个因子上都有相当程 度的负荷量时,因子的解释工作就更加困难


因子旋转的目的是通过改变坐标轴的位置, 重新分配各个因子所解释的方差的比例, 使因子结构更简单,更易于解释

方差最大法(Varimax):使各因子(列) 上与该因子有关的负荷平方的方差最大, 即拉开列上各变量的负荷差异,最常用

斜交旋转(oblique rotation)方法,比正交旋转 更具有一般性,它没有因子之间是不相关的这 个限制,主要是直接斜交旋转(Direct Oblimin)、 快速斜交旋转法(Promax)
f1
a11 a12
x1
u1
f2

x2

u2

a1m
Fm
xk
uk
图1 因素分析模型

因素分析模型,是每个观测变量由一组因素的 线性组合来表示,设有k个观测变量(此为标 准化变量),分别为x1,x2,…,xk,其中xi 为具有零均值、单位方差的标准化变量
因素模型的一般表达形式为: xi=ai1f1+ai2f2+…+aimfm+ui (i=1,2,…,k) x1 =a11f1+a12f2+…+a1mfm+u1 x2=a21f1+a22f2+…+a2mfm+u2 … xk=ak1f1+ak2f2+…+akmfm+uk


这个模型,称为因子模型,在该模型中:

(1) f1,f2,…,fm叫做公因子(common factors),它们是各个观测变量所共有的因 子,解释了变量之间的相关。公共因子都 是均值为0,方差为1的变量。
(2) ui称为特殊因子(unique factor),它是每 个观测变量所特有的因子,只和xi有关,相 当于残差,表示该变量不能被公因子所解释 的部分。代表公因子以外的影响因素,实际 分析时忽略不计。特殊因子的均值为0。
心理测量学
第十四讲 因素分析
一、概述

心理测验通常显示出从中度到高度的正相 关
假设:设计的两个测验是测量阅读理解和 词汇的,两者之间的相关是0.53 请问:为什么这些测验是相关的



也许:它们相关是因为它们都测量了非常多 的相同东西——言语能力 归纳推理:通过注意到两个测验似乎拥有共 同的特征,鉴别出言语能力这个更一般的、 抽象的、普通的变量 进行因素分析是达到相同结果的一个统计方 法

当因素分析被运用到表1所表示的相关时, 结果与我们通过对这些相关进行日常分析 的结果是非常相似的
表2 对表1中的相关进行一个因素分析的结果
变量 阅读理解
因素负荷
因素1
0.88
因素2
0.09
词 汇
图形旋转
0.76
0.04
0.15
0.72
分解图形
0.20
0.78

这个分析表明,这里有两个不同的因素 因素负荷,或最初的四个测验和这两个因素之 间的相关标示在表2中 阅读理解和词汇与第一个因素显示出高相关, 与第二个因素显示出低相关 FR和EF都与第二个因素显示出高相关,但 是与第一个因素显示出低相关


(3) aij称为因子负荷(factor loadings),它是 第i个变量xi在第j个公因子fj上的负荷。因素 负荷或因素载荷,实质就是公因子fj和变量 xi的相关系数。矩阵A=(aij)称为因子载荷 矩阵。 a11 a21 … ak1 a12 a22 … ak2 … a1m … a2m … … … akm
公因子方差反映的是单个变量被所有公因 子解释的部分比例,因子贡献反映的则是 单个因子解释的数据总方差
四、因素分析的步骤

首先,计算所有变量的相关矩阵 第二步是提取因子


第三步是进行因子旋转
第四步是计算因子值 第五步是解释因子
1、计算相关矩阵

计算所有变量之间的相关系数,得到相关矩阵 R 根据计算出的相关矩阵还应该进一步判断应用 因子分析方法是否合适

当公因子之间彼此正交时,公因子方差等于和 该变量有关的因子负荷的平方和,用公式表示 为:hi2=ai12+ai22+…+aim2


如何理解公因子方差呢? 请回忆一下测定系数或决定系数 负荷系数的平方就是变量xi与因子fj的共同变 异


m个公因子对第i个变量方差的贡献称为第i个 变量的共同度 表示全部公因子对变量xi的总方差所做出的贡 献

在实际应用中,由于斜交旋转的结果太容易受 研究者主观意愿的左右,所以建议尽量采用默 认的正交旋转
4、计算因子值

因子值是各个因子在每个案例上的得分值,有 了因子值可以在其他的分析中使用这些因子 求解因子值的方法主要有:回归法、Bartlett法 和Anderson-Rubin法 ,一般使用回归法
二、因素分析数学模型

因素分析是通过研究多个变量间相关系数矩阵(协 方差矩阵)的内部依赖关系,找出能综合所有变量 的少数几个随机变量,这几个随机变量是不可测量 的,通常称为因子,或因素,然后根据相关性的大 小把变量分组,使得同组内的变量之间相关性较高, 但不同组的变量相关性较低。

各个因子间互不相关,所有变量都可以表示成 公因子的线性组合,因素分析的目的就是减少 变量的数目,用少数因子代替所有变量去分析 整个问题
特征值 a112+a212+a312 a122+a222+a322+
+a412+a512 a422+a522 解释量 (a112+a212+a312 (a122+a222+a322 +a412+a512) +a422+a522) ÷5 ÷5
因素模型: x1=a11f1+a12f2 +u1 x2=a21f1+a22f2 +u2 x3=a31f1+a32f2 +u3 x4=a41f1+a42f2 +u4 x5=a51f1+a52f2 +u5
在各因子上只有少数变量有较高的负荷,其它变 量上的负荷(绝对值)很低 任取两因子,每个变量只能在一个因子上有较高 负荷


简言之,就是调整因素负荷矩阵式中的 行、列值向0和1极化,使某些变量的负 荷尽可能往某个因子上集中,而另一些 变量的负荷尽可能往另一个因子上集中
• 旋转图解:良好的旋转应当使得变量向量尽可能落在坐标轴
相关主题