当前位置:文档之家› 基本思想第二节对应分析方法的基本原理第三节实例分析推

基本思想第二节对应分析方法的基本原理第三节实例分析推


• 因子分析是通过研究众多变量之间的内部依 赖关系,探求观测数据中的基本结构,并用 少数几个“抽象”的变量来表示其基本结构。 这几个抽象的变量被称为因子,它能反映原 来众多变量的主要信息。原始的变量是可观 测的显在变量,而因子一般是不可观测的潜 在变量。例如,在商业企业的形象评价中, 消费者可以通过一系列指标构成一个评价指 标体系,评价百货商场的各个方面的优劣, 但消费者真正关系的只是商店的环境、商店 的服务和商品的价格这3个方面。这3个方面 除了价格外,商店的环境和商店的服务质量 都是客观存在的、抽象的影响因素,都不便 于直接测量,只能通过其它具体指标进行间 接反映。因子分析就是一种通过显在变量测 评潜在变量,通过具体指标进行间接反映。
如果X为标准化随机向量,则Σ 就是相关 矩阵,即
R AA D
• (2)因子载荷阵不是唯一的。这是因为对于
m阶正交矩阵T,令
A AT, F T F
* *
则因子分析模型可以表示为
由于
Cov( F , ) E( F ) T E( F ) 0
* *
D(F * ) T D(F )T T T I m
• 2)变量共同度 hi2 及其统计意义 • 因子载荷阵A中第 i行元素的平方和称为 Xi 的共同度。
h a
2 i j 1
2 i
m
2 ij
i 1,2,, p
为了给出 h 的统计意义,下面计算Xi的方差
2 Var ( X i ) Var ( aij F j ei ) aij Var ( F j ) Var (ei ) j 1 j 1 2 aij i2 hi2 i2 j 1 m m m
即各个特殊因子不相关,方差要求相等。
2)Q型因子分析模型
• 类似地,Q型因子分析的数学模型可表 示为 X i ai1F1 ai 2 F2 aimFm i , i 1,2,, n
Q型因子分析与R型因子分析模型的差 异体现在 X1,X 2, ,X n 表示的是个样 品。
F1 F F 2 Fm
X1 X 2 X X p

1 2 p
aij 是 A称为因子载荷矩阵或因子负荷矩阵, 第i个变量在第j个因子上的负荷。
• 无论Q型因子分析或R型因子分析,都用 公共因子F代替X,一般要求 m p ,
m n ,因此,因子分析与主成分分析
一样,也是一种降低变量维数的一种统 计方法。下面我们将看到,因子分析的 求解过程与主成分分析类似,也是从协 方差阵(或相似系数阵)出发的。虽然 因子分析与主成分分析有许多相似之处, 但这两种模型又存在明显的不同。
k 1
rX i F j
cov( X i , F j ) var( X i ) var( F j )
aij
第i个变量Xi与第j个公共因子Fj的相关系 数即可以表示为Xi依赖Fj的份量(比重)。
• 在各公共因子不相关的前提下,aij 是Xi与Fj的相关系数,一方面他表 示Xi依赖于Fj的程度,绝对值越大, 密切程度越高;另一方面也反映了 第i个原有变量Xi在第j个公共因子Fj 上的相对重要性。
第八章 对应分析
• • • • 第一节 对应分析方法及基本思想 第二节 对应分析方法的基本原理 第三节 实例分析 推荐阅读
第一节 因子分析的概念
• 因子分析是主成分分析的推广和发展,它是多 元统计分析中降维的一种方法。因子分析是研究 相关阵或协方差阵的内部依赖关系,它将多个变 量综合为少数几个因子,以再现原始变量与因子 之间的相关关系,同时根据不同因子还可以对变 量进行分类。 • 因子分析概念起源于20世纪初Karl Pearson 和 Charles Spearmen等学者为定义和测验智力所作 的统计分析。目前因子分析在心理学、社会学、 教育学、经济学等学科都取得了成功的应用。
例如:某公司对100名招聘人员的知识和能力进行测评, 主要测评六个方面的内容:语言表达能力、逻辑思维能力、 判断事物的敏捷和果断程度、思想修养、兴趣爱好、生活 常识等,我们将每一个方面称为因子,显然这里所说的因 子不同于回归分析中的因素,因为前者是比较抽象的一种 概念,而后者有着极为明确的实际意义。假设100人测试 得分xi可以用上述六个因子表示成线性函数:
这说明变量Xi的方差由两部分组成:第 一部分为共同度hi2 ,它刻划了全部公共因 子对变量Xi的总方差所作的贡献,反映了公 共因子对变量Xi的影响程度。第二部分为特 殊因子ε i对变量Xi的方差所作的贡献。由于 Xi已作了标准化处理,因此有
h 1
2 i 2 i
hi2反映了全部公共因子对变量Xi的影响,是全
(1)变量X的协方差阵Σ 的分解式为:
D( X ) D( AF ) E[( AF )( AF )] AE( FF ) A AE( F ) E ( F ) A E ( ) AD( F ) A D( )

AA
X i ai1F1 ai 2 F2 aimFm i ,
i 1,2,, p
• 因子分析即是通过变量的相关系数矩阵 内部结构的研究,找出能够控制所有变 量的少数几个随机变量去描述多个变量 之间的相关关系,这里这少数几个随机 变量是不可观测的,通常称为因子,然 后根据相关性的大小把变量分组,使得 同组内的变量之间相关性较高,不同组 的变量相关性较低。 • 因子分析的研究内容十分丰富,常用的 因子分析类型是R型因子分析和Q型因子 分析。R型因子分析是对变量作因子分 析,Q型因子分析是对样品作因子分析。
• 我们可以得到变量 Xi 与公共因子 Fj 的协 方差为
Cov( X i , F j ) Cov[ aik Fk i , F j ]
k 1 m m
Cov[ aik Fk , F j ] Cov[ i , F j ] aij
由于变量Xi与公共因子Fj已作标准化处理,因此
X i ai1 F1 ai 2 F2 ai 6 F6 i ,
i 1,2,,100
其中F1,F2, ,F6 表示6个因子,它对所有 X i是共有因子, 通常称为公共因子,它 们的系数ai1,ai 2, ,ai 6 称为因子 载荷,它表示第 i个应试人员在六个方面 的能力。 i是第 i个应试人员的能力和知 识不能被前六个因子包 含的部分, 称为特殊因子。通常假 定 i~N(0, i2) .
部公共因子对变量方差所做出的贡献,或者说 Xi对公共因子的共同依赖程度,称为公共因子 对变量Xi的方差贡献。
hi2接近于1,表明该变量Xi的原始信息几乎都被
选取的公共因子说明了。
特殊因子ε i的方差,反映了原有变量方差中无
法被公共因子描述的比例。 大, i2 必小。而hi2 大,表明变量Xi 对公共因子 F1 , F2 ,, Fm 的共同依赖程度就大。 当hi2=1时,表明变量Xi完全能够由公共因子的线 性组合表示;当hi2≈0时,表明公共因子对变量Xi 的影响很小, Xi主要由特殊因子εi来描述。可见hi2 反映了变量Xi对公共因子的共同依赖程度,故称 公共因子方差hi2为变量Xi的共同度。
i 1
m
例7.1某校对学生进行了测量语言能力和数学能 力的六项考试。考试成绩都化为标准分。假定 x1,x2,x3 是语言能力的三项不同考试的标准分, x4,x5,x6是数学能力的三项不同的标准分。通过 部分学生这六项考试成绩,得到相关系数矩阵: 依此得出因子载荷矩阵:
• 满足下列条件: (1) m p (2) Cov( F , ) 0 ,即公共因子F与特殊 因子ε i是不相关的; (3) cov(F)=I, 即各个公共因子不相关且 方差为1。 12 0 0 (4 )
2 0 2 0 D( ) 2 0 p 0
• 再如,我们研究区域社会经济发展问题时,描述 社会和经济现象的指标很多,过多的指标容易导 致分析过程复杂化。一个合适的做法就是从这些 关系错综复杂的社会经济指标间提取少数几个主 要因子,每一个主要因子都能反映相互依赖的社 会经济指标间的共同作用,抓着这些主要因素就 可以帮助我们对复杂的社会经济发展问题进行深 入的分析、合理解释和正确评价。 • 因子分析的基本思想就是把每个研究变量分解为 几个影响因素变量,将每个原始变量分解成两部 分因素,一部分是由所有变量共同具有的少数几 个公共因子组成的,另一部分是每个变量独自具 有的因素,即特殊因子。
第二节 因子分析的数学模型
• 1、正交因子模型 • 1)R型因子分析模型 • R型因子分析中的公共因子是不可直接观 测但又客观存在的共同影响因素,每一 个变量都可以表示成公共因子的线性函 数和特殊因子之和。即 X i ai1F1 ai 2 F2 aimFm i , i 1,2,, p
• 主成分分析的数学模型实质上是一种线性变 换,将原来坐标变换到变异程度大的方向上 去,相当于从空间上转换观看数据的角度, 突出数据变异的方向,归纳重要的信息。在 主成分分析中每个主成分相应的系数aij是唯一 确定的。而因子分析模型是描述原指标协方 差阵结构的一种模型,是从显在变量去提炼 潜在因子的过程,正因为因子分析是一个提 炼潜在因子的过程,因此因子的个数m取多大 是要通过一定的规则确定的,并且因子分析 中因子载荷阵不是唯一确定的。一般来说, 作为“自变量”的因子是不可观测的。
显然,若hi2
• 3、公共因子Fj的方差贡献及其统计意义
• 因子载荷阵中第 j列元素的平方和称为公共因 子Fj对X的贡献。
g a
2 j i 1
p
2 ij
j 1,2,, m
• gj2表示第j个公共因子Fj对于X的每一分量Xi所 提供的方差贡献的总和。称第j个公共因子的方 差贡献。它是衡量某一公共因子相对重要性的 指标, gj2越大,表明公共因子Fj对X的贡献越 大,该因子的重要程度越高,或者说对X的影 响和作用越大,它是衡量每一个公共因子相对 重要性的一个指标。
相关主题