当前位置:文档之家› 第六章 因子分析.

第六章 因子分析.

因子分析(factor analysis)是一种数据简化的技术。它通过 研究众多变量之间的内部依赖关系,探求观测数据中的基 本结构,并用少数几个假想变量来表示其基本的数据结构。 这几个假想变量能够反映原来众多变量的主要信息。原始 的变量是可观测的显在变量,而假想变量是不可观测的潜 在变量,称为因子。
(一)正交因子模型: 因子分析的一般模型为:
X1 a11F1 a12F2 a1mFm 1 X 2 a21F1 a22F2 a2mFm 2
X p ap1F1 ap2F2 apmFm p
i
可将上式写成简单的矩阵形式
X AF
因子。
(1) m p ; (2) Cov(F, ε) 0 ,即公共因子与特殊因子是不相关的;
1

(3)
DF

D(F )


1
0
关且方差为 1;
0



Im
,即各个公共因子不相
1
12
(4)D

D(ε)


2 2
0
方差不要求相等。
0

,即各个特殊因子不相关,
第六章 因子分析
因子分析简介 因子分析过程
问题 思考
主成分分析和因子分析的联系与区别 因子分析模型需要满足哪些条件 变量共同度的定义及统计意义 因子分子中的因子载荷矩阵A矩阵和主成
分分析中的U矩阵是什么关系
内容和要求:
本章内容:因子分析的基本思想和原理、相关重要概 念及统计解释、因子分析过程及结果解释。
X 共有的因子,通常称为公共因子或共同因子,其 系数 aij 称为因子载荷,表示第 i 个变量或样品在第
j 个公因子的负荷,即相对重要程度。 i 称为特殊
因子,即未被公因子包含的其他因子。
因子分析一般有两种情况,一种是对变量作因 子分析,我们称为R型因子分析,该分析较为 常见,因为我们通常是为了简化分析变量进行 因子分析;另一种是对样品作因子分析,我们 称为Q型因子分析,该分析的原理与R型因子 分析完全一致,只是应用较少
E( X i Fj ) ai1E(F1Fj ) ai2E(F2Fj ) aimE(FmFj ) E(iFj )
在标准化条件下,有 E(XiFj ) rxiFj
E(Fi Fj ) rFiFj
故上式可以写成:
1Fj ai r2 F2Fj a r im FmFj riFj aij


2 p

因子分析模型要求满足模型基本假定并
且 m p 。其中重要条件是各因子之
间彼此不相关,且各因子方差同等散布, 均为1(因此称为正交模型)。
因此,因子分析就是想利用公因子去代 替原来的X以达到简化分析和寻找变量内 部结构的目的。
(二)重要概念的统计意义:因子载荷、 变量共同度、公因子方差贡献
学习要求: 熟练掌握因子分析的基本思想和基本原理。 熟练掌握公共因子、因子载荷、共同度、因子旋转等
重要概念及其相应统计意义。 能熟练使用软件进行因子分析,并能对因子分析结果
进行准确合理的解释。 能结合实际经济和社会问题利用因子分析考察事物内
部结构。
第一节、因子分析简介
一、什么是因子分析?
(三)基本思想:
基于对因子的认识,因子分析的基本思想就是通过变 量(或样品)的相关系数矩阵(或相似系数矩阵)内 部结构的研究,找出能控制所有变量(或样品)的少 数几个随机变量去描述多个变量(或样品)之间的相 关(或)相似关系。在分解原始变量的基础上,从中 归纳出潜在的“类别”,相关性较强的变量归为一类, 不同类间变量的相关性则较低。从而实现因子分析的 两个目的:一简化分析,二将原变量分类,对公因子 的意义作出合理可信的解释。
假定因子模型中各变量及公因子和特殊因子均 为标准化变量,即均值为0,方差为1的变量
1、因子载荷的统计意义。
已知因子模型为 X i ai1F1 ai2F2 aimFm
将两端右乘 Fj
X i Fj ai1F1Fj ai2F2Fj aimFmFj i Fj
对上式两边同时求期望值有
其中,( X1, X 2 , X p )为实测变量。aij
为因子载荷,表示第i个变量在第j个公因子 上的负荷,因子载荷越大,则说明第i个变 量与第j个因子的关系越密切。该结论将在 后面的分析中得到证明,A矩阵即为因子载 荷矩阵。F向量为不可观测的变量,即为X
的公共因子,是一种综合变量。 i 为特殊
因此:因子也是综合变量;因子具有更 明确的指标意义;具有不同意义的因子 便于揭示事物变化的内在结构;提取少 量重要因子可以达到降维和简化分析的 作用。
(二)因子分析的一般模型:
令因子为 F(factor),当我们研究 m 个因子对实 际问题的影响时可以建立因子模型,即
X i ai1F1 ai2F2 aimFm + i 。其中的 F 是对所有
因此因子载荷的统计意义就是第i个变量与 第j个公共因子的相关系数,表示 X i依赖 Fj 的份量,即是统计学中的权数,心理学上叫
而进行因子分析的起点就是因子模型,我们通 过估计因子模型中的参数即因子负荷和方差对 各因子的重要程度进行衡量,并利用因子负荷 矩阵所体现的各变量或样品之间的相关程度提 取出具有明确意义的公因子F,赋予其有实际 背景的解释进而给以命名,从而达到降维和分 类的目的。
三、因子分析的数学原理。
因R型因子分析应用广泛,故本章的解释均是 以R型因子分析为对象。

二、因子分析的基本思想
(一)什么是因子?
因子与主成分相似,也是一种综合变量,即对原 变量进行线性组合而形成的新变量。但它比主成 分有着更为明确的含义,表现为具有强烈倾向性 的综合变量,其倾向性取决于变量或样品间的相 关系数或相似系数的大小。
因子集中表现影响某现象变化的某类因素,它是 一个较抽象的概念,由一系列具有相同影响方向 的具体因素所构成,因此我们有时也称它为共同 因子,代表同一类变量的影响,提取的多个共同 因子可以揭示系统变化的内在结构,并可以使大 量变量得到简化。
相关主题