当前位置：文档之家› 基本思想第二节对应分析方法的基本原理第三节实例分析推

基本思想第二节对应分析方法的基本原理第三节实例分析推

• 因子分析是通过研究众多变量之间的内部依赖关系，探求观测数据中的基本结构，并用少数几个“抽象”的变量来表示其基本结构。这几个抽象的变量被称为因子，它能反映原来众多变量的主要信息。原始的变量是可观测的显在变量，而因子一般是不可观测的潜在变量。例如，在商业企业的形象评价中，消费者可以通过一系列指标构成一个评价指标体系，评价百货商场的各个方面的优劣，但消费者真正关系的只是商店的环境、商店的服务和商品的价格这3个方面。这3个方面除了价格外，商店的环境和商店的服务质量都是客观存在的、抽象的影响因素，都不便于直接测量，只能通过其它具体指标进行间接反映。因子分析就是一种通过显在变量测评潜在变量，通过具体指标进行间接反映。
如果X为标准化随机向量，则Σ 就是相关矩阵,即
R AA D
• （2）因子载荷阵不是唯一的。这是因为对于
m阶正交矩阵T，令
A AT, F T F
* *
则因子分析模型可以表示为
由于
Cov( F , ) E( F ) T E( F ) 0
* *
D(F * ) T D(F )T T T I m
• 2）变量共同度 hi2 及其统计意义 • 因子载荷阵A中第 i行元素的平方和称为 Xi 的共同度。
h a
2 i j 1
2 i
m
2 ij
i 1,2,, p
为了给出 h 的统计意义，下面计算Xi的方差
2 Var ( X i ) Var ( aij F j ei ) aij Var ( F j ) Var (ei ) j 1 j 1 2 aij i2 hi2 i2 j 1 m m m
即各个特殊因子不相关，方差要求相等。
2）Q型因子分析模型
• 类似地，Q型因子分析的数学模型可表示为 X i ai1F1 ai 2 F2 aimFm i , i 1,2,, n
Q型因子分析与R型因子分析模型的差异体现在 X1，X 2，，X n 表示的是个样品。
F1 F F 2 Fm
X1 X 2 X X p
，
1 2 p
aij 是 A称为因子载荷矩阵或因子负荷矩阵，第i个变量在第j个因子上的负荷。
• 无论Q型因子分析或R型因子分析，都用公共因子F代替X，一般要求 m p ，
m n ，因此，因子分析与主成分分析
一样，也是一种降低变量维数的一种统计方法。下面我们将看到，因子分析的求解过程与主成分分析类似，也是从协方差阵（或相似系数阵）出发的。虽然因子分析与主成分分析有许多相似之处，但这两种模型又存在明显的不同。
k 1
rX i F j
cov( X i , F j ) var( X i ) var( F j )
aij
第i个变量Xi与第j个公共因子Fj的相关系数即可以表示为Xi依赖Fj的份量（比重）。
• 在各公共因子不相关的前提下，aij 是Xi与Fj的相关系数，一方面他表示Xi依赖于Fj的程度，绝对值越大，密切程度越高；另一方面也反映了第i个原有变量Xi在第j个公共因子Fj 上的相对重要性。
第八章对应分析
• • • • 第一节对应分析方法及基本思想第二节对应分析方法的基本原理第三节实例分析推荐阅读
第一节因子分析的概念
• 因子分析是主成分分析的推广和发展，它是多元统计分析中降维的一种方法。因子分析是研究相关阵或协方差阵的内部依赖关系，它将多个变量综合为少数几个因子，以再现原始变量与因子之间的相关关系，同时根据不同因子还可以对变量进行分类。 • 因子分析概念起源于20世纪初Karl Pearson 和 Charles Spearmen等学者为定义和测验智力所作的统计分析。目前因子分析在心理学、社会学、教育学、经济学等学科都取得了成功的应用。
例如：某公司对100名招聘人员的知识和能力进行测评，主要测评六个方面的内容：语言表达能力、逻辑思维能力、判断事物的敏捷和果断程度、思想修养、兴趣爱好、生活常识等，我们将每一个方面称为因子，显然这里所说的因子不同于回归分析中的因素，因为前者是比较抽象的一种概念，而后者有着极为明确的实际意义。假设100人测试得分xi可以用上述六个因子表示成线性函数：
这说明变量Xi的方差由两部分组成：第一部分为共同度hi2 ，它刻划了全部公共因子对变量Xi的总方差所作的贡献，反映了公共因子对变量Xi的影响程度。第二部分为特殊因子ε i对变量Xi的方差所作的贡献。由于 Xi已作了标准化处理，因此有
h 1
2 i 2 i
hi2反映了全部公共因子对变量Xi的影响，是全
（1）变量X的协方差阵Σ 的分解式为：
D( X ) D( AF ) E[( AF )( AF )] AE( FF ) A AE( F ) E ( F ) A E ( ) AD( F ) A D( )
故
AA
X i ai1F1 ai 2 F2 aimFm i ,
i 1,2,, p
• 因子分析即是通过变量的相关系数矩阵内部结构的研究，找出能够控制所有变量的少数几个随机变量去描述多个变量之间的相关关系，这里这少数几个随机变量是不可观测的，通常称为因子，然后根据相关性的大小把变量分组，使得同组内的变量之间相关性较高，不同组的变量相关性较低。 • 因子分析的研究内容十分丰富，常用的因子分析类型是R型因子分析和Q型因子分析。R型因子分析是对变量作因子分析，Q型因子分析是对样品作因子分析。
• 我们可以得到变量 Xi 与公共因子 Fj 的协方差为
Cov( X i , F j ) Cov[ aik Fk i , F j ]
k 1 m m
Cov[ aik Fk , F j ] Cov[ i , F j ] aij
由于变量Xi与公共因子Fj已作标准化处理，因此
X i ai1 F1 ai 2 F2 ai 6 F6 i ,
i 1,2,,100
其中F1，F2，，F6 表示6个因子，它对所有 X i是共有因子，通常称为公共因子，它们的系数ai1，ai 2，，ai 6 称为因子载荷，它表示第 i个应试人员在六个方面的能力。 i是第 i个应试人员的能力和知识不能被前六个因子包含的部分，称为特殊因子。通常假定 i～N（0， i2） .
部公共因子对变量方差所做出的贡献，或者说 Xi对公共因子的共同依赖程度，称为公共因子对变量Xi的方差贡献。
hi2接近于1，表明该变量Xi的原始信息几乎都被
选取的公共因子说明了。
特殊因子ε i的方差，反映了原有变量方差中无
法被公共因子描述的比例。大， i2 必小。而hi2 大，表明变量Xi 对公共因子 F1 , F2 ,, Fm 的共同依赖程度就大。当hi2=1时，表明变量Xi完全能够由公共因子的线性组合表示；当hi2≈0时，表明公共因子对变量Xi 的影响很小， Xi主要由特殊因子εi来描述。可见hi2 反映了变量Xi对公共因子的共同依赖程度，故称公共因子方差hi2为变量Xi的共同度。
i 1
m
例7.1某校对学生进行了测量语言能力和数学能力的六项考试。考试成绩都化为标准分。假定 x1,x2,x3 是语言能力的三项不同考试的标准分， x4,x5,x6是数学能力的三项不同的标准分。通过部分学生这六项考试成绩，得到相关系数矩阵：依此得出因子载荷矩阵：
• 满足下列条件： (1） m p (2) Cov( F , ) 0 ，即公共因子F与特殊因子ε i是不相关的； (3) cov(F)=I, 即各个公共因子不相关且方差为1。 12 0 0 （4 ）
2 0 2 0 D( ) 2 0 p 0
• 再如，我们研究区域社会经济发展问题时，描述社会和经济现象的指标很多，过多的指标容易导致分析过程复杂化。一个合适的做法就是从这些关系错综复杂的社会经济指标间提取少数几个主要因子，每一个主要因子都能反映相互依赖的社会经济指标间的共同作用，抓着这些主要因素就可以帮助我们对复杂的社会经济发展问题进行深入的分析、合理解释和正确评价。 • 因子分析的基本思想就是把每个研究变量分解为几个影响因素变量，将每个原始变量分解成两部分因素，一部分是由所有变量共同具有的少数几个公共因子组成的，另一部分是每个变量独自具有的因素，即特殊因子。
第二节因子分析的数学模型
• 1、正交因子模型 • 1）R型因子分析模型 • R型因子分析中的公共因子是不可直接观测但又客观存在的共同影响因素，每一个变量都可以表示成公共因子的线性函数和特殊因子之和。即 X i ai1F1 ai 2 F2 aimFm i , i 1,2,, p
• 主成分分析的数学模型实质上是一种线性变换，将原来坐标变换到变异程度大的方向上去，相当于从空间上转换观看数据的角度，突出数据变异的方向，归纳重要的信息。在主成分分析中每个主成分相应的系数aij是唯一确定的。而因子分析模型是描述原指标协方差阵结构的一种模型，是从显在变量去提炼潜在因子的过程，正因为因子分析是一个提炼潜在因子的过程，因此因子的个数m取多大是要通过一定的规则确定的，并且因子分析中因子载荷阵不是唯一确定的。一般来说，作为“自变量”的因子是不可观测的。
显然，若hi2
• 3、公共因子Fj的方差贡献及其统计意义
• 因子载荷阵中第 j列元素的平方和称为公共因子Fj对X的贡献。
g a
2 j i 1
p
2 ij
j 1,2,, m
• gj2表示第j个公共因子Fj对于X的每一分量Xi所提供的方差贡献的总和。称第j个公共因子的方差贡献。它是衡量某一公共因子相对重要性的指标， gj2越大，表明公共因子Fj对X的贡献越大，该因子的重要程度越高，或者说对X的影响和作用越大，它是衡量每一个公共因子相对重要性的一个指标。

e商务文档

基本思想第二节对应分析方法的基本原理第三节实例分析推

相关文档推荐：