因子分析 ppt课件
ui
2 2
Hale Waihona Puke .....uip21(i1、2、...、p)
11
式中的系数按以下原则进行求解: (1) y i 与 y j 相 互 独 立 ( i j , i , j = 1 、 2 、 3 、 . . . 、 p ) (2) y1 是 所 有 线 性 组 合 中 方 差 最 大 的 ;
y2是 与 y1 不 相 关 的 一 切 线 性 组 合 中 方 差 最 大 的 ; yp是 与 y1 、 y2 、 ...、 yp 1 都 不 相 关 的 一 切 线 性 组 合 中 方 差 最 大 的 。
.....................................................
xp a p1 f1 a p2 f2 ......a pk fk p 用矩阵表示为X AF
5
在这个数学模型中,F称为公共因子,因为它出现在每个 变量的线性表达式中,简称因子。因子可理解为高维空间中
第十章
SPSS 因子分析
ppt课件
本章内容
• 10.1 因子分析概述 • 10.2 因子分析的基本内容 • 10.3 因子分析的基本操作及案例
2
10.1 因子分析概述
• 10.1.1因子分析的意义
在实际问题的分析过程中,人们往往希望尽可能多的 搜集关于分析对象的数据信息,进而能够比较全面的、完 整的把握和认识它。于是,对研究对象的描述就会有很多 指标。但是效果如何呢?如果搜集的变量过多,虽然能够 比较全面精确的描述事物,但在实际建模时这些变量会给 统计分析带来计算量大和信息重叠的问题。而消减变量个 数必然会导致信息丢失和信息不完整等问题的产生。
假设原有变量有p个,分别用 x1、x2、x3、 ...、xp 表示,且每个变量的均值是0,标准差是1,现将每个
原有变量用k(k<p)个因子f1、f2、 ...、fk 的线性
组合来表示,即:
x1 a11 f1 a12 f2 ......a1k fk 1 x2 a21 f1 a22 f2 ......a2k fk 2
为单位矩阵,如果该检验对应的P值小于给定的显著性水平 a,则应拒绝原假设,认为原有变量适合进行因子分析。
4、KMO检验
该统计量取值在0-1之间,越接近于1说明变量间的相
关性越强,原有变量适合做因子分析。0.9以上表示非常合
适;0.8-0.9表示合适;0.7-0.8表示一般;0.6-0.7表
示尚可;0.5-0.6表示不太合适;0.5以下表示极不合适。
因子分析是解决上述问题的一种非常有效的方法。它 以最少的信息丢失,将原始众多变量综合成较少的几个综 合指标(因子),能够起到有效降维的目的。
3
• 因子分析的特点
1、因子个数远远少于原有变量的个数; 2、因子能够反应原有变量的绝大部分信息; 3、因子之间不存在线性关系; 4、因子具有命名解释性。
4
• 10.1.2因子分析的数学模型和相关概念 • 数学模型
互相垂直的k个坐标轴;A称为因子载荷矩阵a ,i j 称为因子载
荷,是第i个原始变量在第j个因子上的负荷; 称为特殊因子
,表示原始变量不能被因子解释的部分。其均值为0,相当于 多元线性回归模型中的残差。
• 因子分析的几个相关概念
1、因子载荷 在因子不相关的前提下,因子载荷是第i个变量与第j个因
子的相关系数。因子载荷越大说明因子与变量的相关性越强 ,所以因子载荷说明了因子对变量的重要作用和程度。
12
可见,主成分分析关键的步骤是如何求出上述方程 中的系数。通过方程的推导可以发现,每个方程中的系 数向量是原始变量相关系数矩阵的特征值对应的特征向 量。具体求解步骤如下: (1)将原有变量进行标准化处理; (2)计算变量的相关系数矩阵;
rij2
MSAi
i j
rij2
pij2
i j
i j
其中rij为第i个变量与第j个变量的简单相关系数;
pij为第i个变量与第j个变量在控制了剩余变量下
10
的偏相关系数。
• 10.2.3因子提取和因子载荷矩阵的求解
因子载荷矩阵的求解一般采用主成分法。主成份分析 法通过坐标变换的手段,将原有的p个变量标准化后进行线 性组合,转换成另一组不相关的变量y,即:
7
10.2 因子分析的基本内容
• 10.2.1因子分析的基本步骤
1、因子分析的前提条件; 因子分析的前提条件是原始变量之间应存在较
强的相关关系。 2、因子提取; 3、使因子更具有命名可解释性; 4、计算各样本的因子得分。
8
• 10.2.2因子分析的前提条件
1、计算相关系数并进行统计检验 如果相关系数矩阵中的大部分相关系数小于0.3,那么
6
2、变量共同度
变量共同度也称为公共方差。第i个变量的共同度定义 为因子载荷矩阵中第i行元素的平方和,即:
k
hi 2 a ij 2 j 1
3、因子的方差贡献
因子方差贡献是因子载荷矩阵中第j列元素的平方和, 反映了第j个因子对原有变量总方差的解释能力。该数值越 高,说明相应因子的重要性越高。
p
S j 2 aij 2 i 1
y1 u11x1 u12x2 ......u1p xp
y2 u21x1 u22x2 ......u2 p xp
.....................................................
y1 up1x1 up2x2 ......upp xp
其中ui12
这些变量不适合进行因子分析。
2、计算反映象相关矩阵
rij2
MSAi
i j
rij2
pij2
i j
i j
其中rij为第i个变量与第j个变量的简单相关系数;
pij为第i个变量与第j个变量在控制了剩余变量下
的偏相关系数。
9
3、Bartlett’s球度检验
以原有变量的相关系数矩阵为出发点,假设相关系数
根据以上原则确定的变量依次为原始变量的第1、第 2…第p个主成分。其中第一个主成分在总方差中所占比例 最大,其余主成分在总方差中所占比例依次递减,即主成分 综合原始变量的能力依次减弱。在主成份的实际应用中,一 般只选取前面几个主成分即可,这样既减少了变量的数目, 又能够用较少的主成分反映原始变量的绝大部分信息。