当前位置:文档之家› 主成分分析

主成分分析


二、举例:
例2-1 测得10名幼儿的身高、体重如下表第(2)、(3)列,试作 主成分分析。
1、对指标x1,x2作标准化变换:
2、求相关系数矩阵R:
3、求R的特征根:
4、解方程组求特征向量lij
(2)第二主成分:
第三节 主成分个数的确定 及其实际意义的解释
一、主成分个数的确定:
(1)考察z1所提供的信息量sz12
互垂直。
(2)各Zi互不相关。
(3)这些Zi提供原指标所含有的全部信息, 且Z1提供的信息量最多,Z2其次,,Zp最少。 称Zi为原指标x1,,xp的第 i 主成分(i=1, 2,,p)。
主成分分析和聚类分析
都可以减少原有指标(样品)的个数,但主 成分分析是从原有指标出发,寻找几个综合指标 (或样品)来减少指标(或样品)个数;而聚类
主成分分析
Principle component analysis
第一节
概述
当指标之间有一定的相关关系时,
如果用较少的指标来代替较多的指标,
而这些较少的指标既综合反映了原来较
多的信息,相互之间又是无关联的。这
些少数综合的指标就是原来多数指标的 主要成分。这种处理问题的方法称主成 分分析(principle
Z2为x1和x2的第二主成分(second principal
component),这就是主成分分析的基本思想。
一般地,对N个对象观察p个指标,可以得到Np 个数据。见表1-1。
当p个指标间存在相关关系时,可以通过一定 的数学方法找到一组新指标Z1,,Zp,
它们满足:
(1)各Zi是原指标的线性函数,且它们相
第四节 主成分分析的一般步骤
步骤:
提示:
主成分分析整个过程的第二、三、四、五
步,一般由计算机执行,人工做的是第一、六
步,即定观察指标、观察对象,收集数据、录
入数据,最后决定选取的主成分个数,解释主
成分的实际意义,并用主成分解决具体问题。
第五节 主成分分析的应用
一、综合评价
表5-1 主成分体型分类表
component analysis)
N对数据的分布示意图
主成分分析的基本思想
据数学知识可得,Z1、Z2与x1、x2有关系式 Z1=l11x1+l12x2 , Z2=l12x1+l22x2 即新指标是Z1、Z2原指标x1、x2的线性函数; Z2 轴垂直于Z1轴,且Z1、Z2不相关。统计学上称Z1 为x1和x2的第一主成分(first principal component),
二、主成分回归
(一)主成分回归的步骤 1、求自变量的主成分; 2、舍去贡献率近似为0的主成分;
3 、将留下的主成分替代原自变量,用最
小二乘法建立与目标变量的回归方程;
4 、将主成分表达式代入回归方程,得到
原自变量与目标变量的回归方程。
例5-2
例5-2 实测得到13名儿童的性别(X1) ( 男 取 1 , 女 取 2 ) 、 月 龄 ( X2 ) 、 身 高 ( X3 )、体重( X4 )、胸围( X5 )、心象 面积(X6) 见表5-2,作主成分回归。
分析是先把原有指标(或样品)聚成几类,再在
某一类指标(或样品)中各挑选一个典型指标 (或样品)来减少指标(或样品)个数,两者是
不同的。由于两者都可以减少指标(或样品)各
数,因此两者都可以和其它统计分析方法(如判 别分析、回归分析法)结合使用。
第二节 主成分的求法

一、由样本资料求主成分的一般步骤:
(2)考察z2所提供的信息量sz22
2、主成分的贡献率:
3、主成分个数的确定:
(1)根据累计贡献率
( 2 )根据特征根 i 的大小,保留 >1的主成分 一般将两者结合使用。
二、主成分实际意义的解释:
一般可根据主成分表达式中系数lij(j=1,2,…,p)的符号 和绝对值大小,结合各观察指标的意义,根据专业知识加 以解释。 Zi=li1y1+…+lipyp,i=1,2,…,p 例2-1 10名幼儿身高、体重资料求主成分一例中,已求 得1=1.9547,2=0.0543,1+2=2。 第一主成分的贡献率=1/(1+2)=1.9547/2=97.7% 第二主成分的贡献率=2/(1+2)=0.0543/2=2.3% 若以Z1代替原来两个指标,仅损失2.3%的信息。 由表达式 Z1=0.7071y1+0.7071y2 Z2=-0.7071y1+0.7071y2
表5-2
多元回归结果
(1)求主成分
(2)舍去贡献率近似为0的主成分,产生被保 留的主成分变量
(3)
(4)
Thanks!
相关主题