当前位置：文档之家› 因子分析 ppt课件

因子分析 ppt课件

ui
2 2
Hale Waihona Puke .....uip21(i1、2、...、p）
11
式中的系数按以下原则进行求解：（1） y i 与 y j 相互独立 ( i j , i ， j = 1 、 2 、 3 、 . . . 、 p ) （2） y1 是所有线性组合中方差最大的；
y2是与 y1 不相关的一切线性组合中方差最大的； yp是与 y1 、 y2 、 ...、 yp 1 都不相关的一切线性组合中方差最大的。
.....................................................
xp a p1 f1 a p2 f2 ......a pk fk p 用矩阵表示为X AF
5
在这个数学模型中，F称为公共因子，因为它出现在每个变量的线性表达式中，简称因子。因子可理解为高维空间中
第十章
SPSS 因子分析
ppt课件
本章内容
• 10.1 因子分析概述 • 10.2 因子分析的基本内容 • 10.3 因子分析的基本操作及案例
2
10.1 因子分析概述
• 10.1.1因子分析的意义
在实际问题的分析过程中，人们往往希望尽可能多的搜集关于分析对象的数据信息，进而能够比较全面的、完整的把握和认识它。于是，对研究对象的描述就会有很多指标。但是效果如何呢？如果搜集的变量过多，虽然能够比较全面精确的描述事物，但在实际建模时这些变量会给统计分析带来计算量大和信息重叠的问题。而消减变量个数必然会导致信息丢失和信息不完整等问题的产生。
假设原有变量有p个，分别用 x1、x2、x3、 ...、xp 表示，且每个变量的均值是0，标准差是1，现将每个
原有变量用k（k<p）个因子f1、f2、 ...、fk 的线性
组合来表示，即：
x1 a11 f1 a12 f2 ......a1k fk 1 x2 a21 f1 a22 f2 ......a2k fk 2
为单位矩阵，如果该检验对应的P值小于给定的显著性水平 a，则应拒绝原假设，认为原有变量适合进行因子分析。
4、KMO检验
该统计量取值在0-1之间，越接近于1说明变量间的相
关性越强，原有变量适合做因子分析。0.9以上表示非常合
适；0.8-0.9表示合适；0.7-0.8表示一般；0.6-0.7表
示尚可；0.5-0.6表示不太合适；0.5以下表示极不合适。
因子分析是解决上述问题的一种非常有效的方法。它以最少的信息丢失，将原始众多变量综合成较少的几个综合指标（因子），能够起到有效降维的目的。
3
• 因子分析的特点
1、因子个数远远少于原有变量的个数； 2、因子能够反应原有变量的绝大部分信息； 3、因子之间不存在线性关系； 4、因子具有命名解释性。
4
• 10.1.2因子分析的数学模型和相关概念 • 数学模型
互相垂直的k个坐标轴；A称为因子载荷矩阵a ，i j 称为因子载
荷，是第i个原始变量在第j个因子上的负荷；称为特殊因子
，表示原始变量不能被因子解释的部分。其均值为0，相当于多元线性回归模型中的残差。
• 因子分析的几个相关概念
1、因子载荷在因子不相关的前提下，因子载荷是第i个变量与第j个因
子的相关系数。因子载荷越大说明因子与变量的相关性越强，所以因子载荷说明了因子对变量的重要作用和程度。
12
可见，主成分分析关键的步骤是如何求出上述方程中的系数。通过方程的推导可以发现，每个方程中的系数向量是原始变量相关系数矩阵的特征值对应的特征向量。具体求解步骤如下：（1）将原有变量进行标准化处理；（2）计算变量的相关系数矩阵；
rij2
MSAi
i j
rij2
pij2
i j
i j
其中rij为第i个变量与第j个变量的简单相关系数；
pij为第i个变量与第j个变量在控制了剩余变量下
10
的偏相关系数。
• 10.2.3因子提取和因子载荷矩阵的求解
因子载荷矩阵的求解一般采用主成分法。主成份分析法通过坐标变换的手段，将原有的p个变量标准化后进行线性组合，转换成另一组不相关的变量y，即：
7
10.2 因子分析的基本内容
• 10.2.1因子分析的基本步骤
1、因子分析的前提条件；因子分析的前提条件是原始变量之间应存在较
强的相关关系。 2、因子提取； 3、使因子更具有命名可解释性； 4、计算各样本的因子得分。
8
• 10.2.2因子分析的前提条件
1、计算相关系数并进行统计检验如果相关系数矩阵中的大部分相关系数小于0.3，那么
6
2、变量共同度
变量共同度也称为公共方差。第i个变量的共同度定义为因子载荷矩阵中第i行元素的平方和，即：
k
hi 2 a ij 2 j 1
3、因子的方差贡献
因子方差贡献是因子载荷矩阵中第j列元素的平方和，反映了第j个因子对原有变量总方差的解释能力。该数值越高，说明相应因子的重要性越高。
p
S j 2 aij 2 i 1
y1 u11x1 u12x2 ......u1p xp
y2 u21x1 u22x2 ......u2 p xp
.....................................................
y1 up1x1 up2x2 ......upp xp
其中ui12
这些变量不适合进行因子分析。
2、计算反映象相关矩阵
rij2
MSAi
i j
rij2
pij2
i j
i j
其中rij为第i个变量与第j个变量的简单相关系数；
pij为第i个变量与第j个变量在控制了剩余变量下
的偏相关系数。
9
3、Bartlett’s球度检验
以原有变量的相关系数矩阵为出发点，假设相关系数
根据以上原则确定的变量依次为原始变量的第1、第 2…第p个主成分。其中第一个主成分在总方差中所占比例最大，其余主成分在总方差中所占比例依次递减，即主成分综合原始变量的能力依次减弱。在主成份的实际应用中，一般只选取前面几个主成分即可，这样既减少了变量的数目，又能够用较少的主成分反映原始变量的绝大部分信息。

e商务文档

因子分析 ppt课件

相关文档推荐：