当前位置:
文档之家› 多元统计分析 第8章(因子分析)
多元统计分析 第8章(因子分析)
第八章 因子分析
因子分析的思想:一种降维的方法. 因子 分析是研究相关阵或协差阵的内部依赖关 系,它将多个变量综合为少数几个因子, 以再现原始变量与因子之间的相关关系.
因子分析是主成分分析的推广和发展.
探索性因子分析(Exploratory Factor Analysis,EFA) 验证性因子分析(confirmatory factor analysis,CFA)
6
案例1 已知某学校33个学生6门功课的相 关矩阵,研究这6门课的成绩由哪些因子 决定.
x1:文学,x2:法语,x3:英语, x4:数学,x5:美术,x6:音乐.
xi aiF i
7
相关矩阵
x1 x2 x3 x4 x5 x6 x1 1 x2 0.83 1 x3 0.78 0.67 1 x4 0.70 0.67 0.64 1 x5 0.66 0.65 0.54 0.54 1 x6 0.63 0.57 0.51 0.51 0.40 1
x2:跳远 x4:跳高 x6:100米跨栏 x8:撑杆跳高 x10:1500米
13
相关矩阵
_NA ME_
X1
X2
X3
X4 X5 X6
x7
x8 x9 x10
X1
1.00
.
.
.
.
.
.
.. .
X2
0.59 1.00
.
.
.
.
.
.. .
X3
0.35 0.42 1.00
.
.
.
.
.. .
X4
0.34 0.51 0.38 1.00
1
验证性因子分析模型的示意图
2
1
x1
?
2
x2
3
x3
4
x4
F1
因
子
个
数
F2
?
5
x5
探索性因子分析模型的示意图
3
注意:
(1)如果原始变量之间不相关,不需要进 行因子分析;
(2)因子分析方法的分析结果不是唯一的, 有主观因素的影响,比如因子个数是主观确 定的,旋转的方法可以选择,所以受到一些 人的怀疑,他们认为分析者想得到什么结果 就可以得到什么结果,事实并不是如此.
9
多个因子的模型:
x1 a11F1 a12 F2 a1m Fm 1
x2
a 21 F1
a22 F2
a2m Fm
Байду номын сангаас
2
x
p
a p1 F1
a p2 F2
a pm Fm
p
比如数学推导因子、记忆因子、计算因子 等,分别记为 F1 , F2 ,, Fm .
10
用这m个不可观测的相互独立的公因 子 F1, F2, ,Fm (也称潜因子)和一
个特殊 i来描述原始可测的相关变量
(科目成绩) x1 , x2 , , x p , 并解释分析学 生的学习能力.
11
教育测量中的项目反应理论模型:
Pj ( ) exp aj ( bj ) 1 exp aj ( bj )
X9
0.11 0.21 0.44 0.17 0.13 0.18 0.34 0.24 1 .
X10 -0.07 0.09 -0.08 0.18 0.39 0.00 -0.02 0.17 0 1
14
案例3 Harman(1976)给出的美国12个城市 的数据,共有五个社会经济变量,分别为 人口总数(POP),居民的教育程度或中等教 育的年数(SCHOOL),总工作人数(EMPLOY), 各种服务行业的人数(SERVICES)和中等的房 价(HOUSE). 分析这五个变量可以由几个因素 确定.
➢ 主分量分析不能作为一个模型来描述,它只是 通常的变量变换,而因子分析需要构造因子模 型;
➢ 主分量分析中主分量的个数和变量个数p相同, 它是将一组具有相关性的变量变换为一组不相 关的变量,而因子分析的目的是要用尽可能少 的公因子,以便构造一个结构简单的因子模型;
➢ 主分量分析是将主分量表示为原变量的线性组 合,而因子分析是将原变量表示为公因子和特 殊因子的线性组合.
数据见教材305页例9.6.1
15
因子分析的主要应用有: ➢寻求基本结构,简化观测系统,将具有
错综复杂关系的对象(变量或样本)综合为 少数几个因子(不可观测的,相互独立的 随机变量),以再现因子与原变量之间的 内在联系;
➢用于分类,对p个变量或n个样品进行分 类.
16
因子分析与主分量分析的区别:
17
因子分析
R型因子分析 (变 量 )
Q型因子分析 (样 品 )
变量的相关阵
变量的协差阵 样品的相似矩阵
18
一、正交因子模型
x AF
E(
x
)
(已
知),
D( x) (已 知)
E(F ) 0, D(F ) I m (公 共 因 子 间 不 相 关)
E( ) 0,
8
1904年Charles Spearman指出,如果第i 个变量(第i门功课)上的分数由两部分组成的
xi ai F i
那么各门功课相关的“效应”就可以被说明. 其中F是对所有变量都起作用的公因子, i 是 第i个变量所特有的,即每门课程的考试成绩 可以看作由一个公因子(智力因子)和一个 特殊因子之和组成. 这是最早的最简单的因 子模型.
.
.
.
.. .
X5
0.63 0.49 0.19 0.29 1.00
.
.
.. .
X6
0.40 0.52 0.36 0.46 0.34 1.00
.
.. .
X7
0.28 0.31 0.73 0.27 0.17 0.32 1.00
.. .
X8
0.20 0.36 0.24 0.39 0.23 0.33 0.24 1.00 . .
其中Pj()是答对项目j的概率,aj和bj是项 目参数,是被试的能力参数,类似因子
分析的公因子,但不再是线性关系,而
是非线性的关系,Pj()也不再是随机变
量,而是随机变量的期望.
12
案例2 对男子十项全能运动得分作因子分 析研究,然后作方差最大旋转,由旋转后 的因子载荷阵解释公因子的含义.
x1:100米 x3:投铅球 x5:400米 x7:铁饼 x9:标枪
(3)用因子分析方法能成功解决实际问题 就用,否则就不用.
4
§8.1 因子分析模型 §8.2 参数估计方法 §8.3 方差最大的正交旋转 §8.4 因子得分 §8.5 应用案例
5
§8.1 因子分析模型
因子分析的形成和早期发展一般认 为是从Charles Spearman在1904年发表 的文章开始. 他提出这种方法用来解决 智力测验得分的统计分析. 因子分析在 心理学、社会学、经济学等学科都取得 成功的应用.