当前位置:文档之家› 《主成分分析》PPT课件

《主成分分析》PPT课件

3、主成分的方差依次递减,重要性依次递减,即
Var(F1) Var(F2 ) Var(Fp )
F1,F2,…,Fp分别称为原变量的第一、第二、…、第p个主成分。
2019/5/5
江西理工大学理学院
了解了主成分分析的基本思想、数学模型后,问 题的关键: 1、如何进行主成分分析?(主成分分析的方法) 基于相关系数矩阵还是基于协方差矩阵做主成分 分析。当分析中所选择的经济变量具有不同的量 纲,变量水平差异很大,应该选择基于相关系数 矩阵的主成分分析。 2、如何确定主成分个数? 主成分分析的目的是简化变量,一般情况下主成 分的个数应该小于原始变量的个数。关于保留几 个主成分,应该权衡主成分个数和保留的信息。 3、如何解释主成分所包含的经济意义?
j 'C j j
若矩阵 ,是由特征向量 j 所构成的,则有:
1
j'C j




0
0



k
2019/5/5
江西理工大学理学院
主成分分析的目标:
1、量从(相主关成的分X1), XY2,1…,Y2,X,…k ,,求Yk。出相互独立的新综合变 2、或Y=损(失Y的1,指Y2标,…—,方Yk差),’等所于反X映=信(息X的1,X含2,量…无,X遗k)漏’

2


1
a1 u1 , u2 ,
下面我们来看,是否由U的第一列元素所构成为 原始变量的线性组合是否有最大的方差。
2019/5/5
江西理工大学理学院
证明:设有P维正交向量 a1 a11 , a21 ,, a p1
F1 a11X1 ap1X p aX
1

V (F1 )

a1a1

a1U
2019/5/5
江西理工大学理学院
主成分分析的运用:
1、对一组内部相关的变量作简化的描述 2、用来削减回归分析或群集分析(Cluster)中变量 的数目 3、用来检查异常点 4、用来作多重共线性鉴定 5、用来做原来数据的常态检定
2019/5/5
二、数学模型
江西理工大学理学院
假设我们所讨论的实际问题中,有p个指标,我 们把这p个指标看作p个随机变量,记为X1, X2,…,Xp,主成分分析就是要把这p个指标的问 题,转变为讨论p个指标的线性组合的问题,而 这些新的指标F1,F2,…,Fk(k≤p),按照保留 主要信息量的原则充分反映原指标的信息,并
江西理工大学理学院
主成分分析:将原来较多的指标简化为少数 几个新的综合指标的多元统计方法。
主成分:由原始指标综合形成的几个新指标。 依据主成分所含信息量的大小成为第一主成 分,第二主成分等等。
2019/5/5
江西理工大学理学院
主成分分析得到的主成分与原始变量之间的关 系: 1、主成分保留了原始变量绝大多数信息。 2、主成分的个数大大少于原始变量的数目。 3、各个主成分之间互不相关。 4、每个主成分都是原始变量的线性组合。
且相互独立。
2019/5/5
江西理工大学理学院
这种由讨论多个指标降为少数几个综合指 标的过程在数学上就叫做降维。主成分分 析通常的做法是,寻求原指标的线性组合 Fi。
F1 u11 X1 u21 X 2 up1 X p F2 u12 X1 u22 X 2 up2 X p
11 12 1P
设X的协方差阵为 X

21

22


2P


P1
P2


PP

由的于知Σ识x为可非得负,定必的存对在称正阵交,阵则U,有使利得用线性代数
2019/5/5
1 0
UΣXU






0 p
江西理工大学理学院
其1中21,…2, p…。,而pU为恰Σ好X的是特由征特根征,根不相妨对假应设的
特征向量所组成的正交阵。
u11 u12 u1 p
U

(u1 ,,up
)


u21

u22

u2
p



u
p1
up2

u
pp

Ui u1i,u2i,,upi i 1,2,, P
k
j tr(C ) 矩阵C对角线上的元素之和
2019/5/5 j1
江西理工大学理学院
(3)任一k阶的实对称矩阵C的性质:
A、实对称矩阵C的非零特征根的数目=C的秩
B、k阶的实对称矩阵存在k个实特征根
C、实对称矩阵的不同特征根的特征向量是正交的
D、若 j 是实对称矩阵C的单位特征向量,则
的方差 。
X与Y之间的计算关系是:
Y1 a11 a1k X1











即Y=AX
Yk ak1 akk Xk
如何求解主成分?
2019/5/5
江西理工大学理学院
一、从协方差矩阵出发求解主成分 (一)第一主成分:
2019/5/5
江西理工大学理学院
四、总体主成分的求解及其性质
矩阵知识回顾: (1)特征根与特征向量
A、若对任意的k阶方阵C,有数字 与向量 满
足: C ,则称 为C的特征根, 为C的相 应于 的特征向量。 B、同时,方阵C的特征根 是k阶方程 C I 0
的根。 (2)任一k阶方阵C的特征根 j 的性质:
第一章 主成分分析
2019/5/5
主成分分析的重点
江西理工大学理学院
1、掌握什么是主成分分析; 2、理解主成分分析的基本思想; 3、理解主成分求解方法:协方差矩阵与相
关系数矩阵的差异; 4、掌握运用数学软件求解主成分; 5、对软件输出结果进行正确分析.
2019/5/5
一、主成分分析的基本思想
Fp u1 p X1 u2 p X 2 upp X p
2019/5/5
江西理工大学理学院
满足如下的条件:
1、每个主成分的系数平方和为1。即
u2 1i

u2 2i

u2 pi

1
2、主成分之间相互独立,即无重叠的信息。即
Cov(Fi,Fj) 0,i j,i,j 1, 2, ,p
相关主题