当前位置：文档之家› 多元统计分析第8章(因子分析)

多元统计分析第8章(因子分析)

第八章因子分析
因子分析的思想：一种降维的方法. 因子分析是研究相关阵或协差阵的内部依赖关系，它将多个变量综合为少数几个因子，以再现原始变量与因子之间的相关关系.
因子分析是主成分分析的推广和发展.
探索性因子分析(Exploratory Factor Analysis，EFA) 验证性因子分析(confirmatory factor analysis，CFA)
6
案例1 已知某学校33个学生6门功课的相关矩阵，研究这6门课的成绩由哪些因子决定.
x1:文学，x2:法语，x3:英语， x4:数学，x5:美术，x6:音乐.
xi aiF i
7
相关矩阵
x1 x2 x3 x4 x5 x6 x1 1 x2 0.83 1 x3 0.78 0.67 1 x4 0.70 0.67 0.64 1 x5 0.66 0.65 0.54 0.54 1 x6 0.63 0.57 0.51 0.51 0.40 1
x2:跳远 x4:跳高 x6:100米跨栏 x8:撑杆跳高 x10:1500米
13
相关矩阵
_NA ME_
X1
X2
X3
X4 X5 X6
x7
x8 x9 x10
X1
1.00
.
.
.
.
.
.
.. .
X2
0.59 1.00
.
.
.
.
.
.. .
X3
0.35 0.42 1.00
.
.
.
.
.. .
X4
0.34 0.51 0.38 1.00
1
验证性因子分析模型的示意图
2
1
x1
？
2
x2
3
x3
4
x4
F1
因
子
个
数
F2
？
5
x5
探索性因子分析模型的示意图
3
注意：
（1）如果原始变量之间不相关，不需要进行因子分析；
（2）因子分析方法的分析结果不是唯一的，有主观因素的影响，比如因子个数是主观确定的，旋转的方法可以选择，所以受到一些人的怀疑，他们认为分析者想得到什么结果就可以得到什么结果，事实并不是如此.
9
多个因子的模型:
x1 a11F1 a12 F2 a1m Fm 1
x2
a 21 F1
a22 F2
a2m Fm
Байду номын сангаас
2
x
p
a p1 F1
a p2 F2
a pm Fm
p
比如数学推导因子、记忆因子、计算因子等，分别记为 F1 , F2 ,, Fm .
10
用这m个不可观测的相互独立的公因子 F1， F2，，Fm (也称潜因子)和一
个特殊 i来描述原始可测的相关变量
(科目成绩) x1 , x2 , , x p , 并解释分析学生的学习能力.
11
教育测量中的项目反应理论模型：
Pj ( ) exp aj ( bj ) 1 exp aj ( bj )
X9
0.11 0.21 0.44 0.17 0.13 0.18 0.34 0.24 1 .
X10 -0.07 0.09 -0.08 0.18 0.39 0.00 -0.02 0.17 0 1
14
案例3 Harman(1976)给出的美国12个城市的数据，共有五个社会经济变量，分别为人口总数(POP)，居民的教育程度或中等教育的年数(SCHOOL)，总工作人数(EMPLOY)，各种服务行业的人数(SERVICES)和中等的房价(HOUSE). 分析这五个变量可以由几个因素确定.
➢ 主分量分析不能作为一个模型来描述，它只是通常的变量变换，而因子分析需要构造因子模型；
➢ 主分量分析中主分量的个数和变量个数p相同，它是将一组具有相关性的变量变换为一组不相关的变量，而因子分析的目的是要用尽可能少的公因子，以便构造一个结构简单的因子模型；
➢ 主分量分析是将主分量表示为原变量的线性组合，而因子分析是将原变量表示为公因子和特殊因子的线性组合.
数据见教材305页例9.6.1
15
因子分析的主要应用有： ➢寻求基本结构，简化观测系统，将具有
错综复杂关系的对象(变量或样本)综合为少数几个因子(不可观测的，相互独立的随机变量)，以再现因子与原变量之间的内在联系；
➢用于分类，对p个变量或n个样品进行分类.
16
因子分析与主分量分析的区别：
17
因子分析
R型因子分析 (变量 )
Q型因子分析 (样品 )
变量的相关阵
变量的协差阵样品的相似矩阵
18
一、正交因子模型
x AF
E(
x
)
(已
知),
D( x) (已知)
E(F ) 0, D(F ) I m (公共因子间不相关)
E( ) 0,
8
1904年Charles Spearman指出，如果第i 个变量(第i门功课)上的分数由两部分组成的
xi ai F i
那么各门功课相关的“效应”就可以被说明. 其中F是对所有变量都起作用的公因子， i 是第i个变量所特有的，即每门课程的考试成绩可以看作由一个公因子（智力因子）和一个特殊因子之和组成. 这是最早的最简单的因子模型.
.
.
.
.. .
X5
0.63 0.49 0.19 0.29 1.00
.
.
.. .
X6
0.40 0.52 0.36 0.46 0.34 1.00
.
.. .
X7
0.28 0.31 0.73 0.27 0.17 0.32 1.00
.. .
X8
0.20 0.36 0.24 0.39 0.23 0.33 0.24 1.00 . .
其中Pj()是答对项目j的概率，aj和bj是项目参数，是被试的能力参数，类似因子
分析的公因子，但不再是线性关系，而
是非线性的关系，Pj()也不再是随机变
量，而是随机变量的期望.
12
案例2 对男子十项全能运动得分作因子分析研究，然后作方差最大旋转，由旋转后的因子载荷阵解释公因子的含义.
x1:100米 x3:投铅球 x5:400米 x7:铁饼 x9:标枪
（3）用因子分析方法能成功解决实际问题就用，否则就不用.
4
§8.1 因子分析模型 §8.2 参数估计方法 §8.3 方差最大的正交旋转 §8.4 因子得分 §8.5 应用案例
5
§8.1 因子分析模型
因子分析的形成和早期发展一般认为是从Charles Spearman在1904年发表的文章开始. 他提出这种方法用来解决智力测验得分的统计分析. 因子分析在心理学、社会学、经济学等学科都取得成功的应用.

e商务文档

多元统计分析第8章(因子分析)

相关文档推荐：

e商务文档

多元统计分析 第8章(因子分析)

相关文档推荐：

多元统计分析第8章(因子分析)