数学建模 主成分分析
1 2 1 2 1 2
x2
x1
o
引例:
2014-4-21
换个角度观察 事实上,散点的分布总有可能沿着某一个 方向略显扩张,这里沿椭圆的长轴方向数 据变化跨度就明显大于椭圆的短轴方向。
Y1 Y2
Y2
2014-4-21
换个角度观察 结论:长轴方向变量为第一主成分;短轴 方向变量为第二主成分。
推广一般主成分确定的模型
或
Y TX
其中T是正交矩阵
2014-4-21
主成分满足的约束
要求:①Y的各分量是不相关的;②并且Y的 第一个分量的方差是最大的;第二个分量 的方差次之,……,等等。③为了保持信 息不丢失,Y的各分量方差和与X的各分 量方差和相等。
2014-4-21
2014-4-21
近几年全国数学建 模竞赛题
葡萄酒的评价 太阳能小屋的设计
2010年B题 上海世博会影响力的 定量评估 2009年B题 眼科病床的合理安排 2011年A题 城市表层土壤重金属 污染分析 2012年A题 葡萄酒的评价 均可归属为基于数据分析的综合评价模型
2014-4-21
两类模型常用建模方法
综合评价法 测试分析法 专题建模法 信息合理运用法
2014-4-21
综合评价基本方法 综 合 指 数 法
简易的方法有:
功 效 评 分 法 法 T OP SIS 最优权法
2014-4-21
二、明确信息量的数学意义
我们知道,当一个变量所取数据相近时,这 个变量(数据)提供的信息量较为单一,当这 个变量取数据差异较大时,说明它对各种场景 的“遍历性”越强,提供的信息就更加充分, 从数学角度来论,变量的标准差或方差越大, 变量涵盖的信息越足。
Y1 t11 t12 t1 p X 1 Y t X t t 2 p 2 2 21 22 Y t t t p p 1 p 2 pp X p
2014-4-21
第 K 主成分求法
综上:针对一般情形,第 k 主成分应该是在 TkTk 1 且 TkTi 0 或 TiTk 0 ( i k ) 的 条 件 下 , 使 得 D(Yk ) TkΣTk 达到最大的 Yk Tk X 。这样我们构造目 标函数为
主成分的方差及它们的协方差
这里如果我们就取 m 个主成分, 应该注意到, 对于 Y1 ,, Ym 有:
D(Yi ) D(TiX) Ti D(X)Ti TiΣTi
i 1, 2, , m
Cov(Yi , Yk ) Cov(TiX, TkX) TiCov(X, X)Tk TiΣTk i, k 1, 2, , m
复习:关于随机向量的协方差矩阵 X ( X , X , X ,, X ) X 的协方差矩阵为
1 2 3 n
所以协方差矩阵是对称矩阵,且为非负定的!
2014-4-21
第一主成分求法
利用拉格朗日乘数法构造目标函数为: 1 (T1 , ) T1 ΣT1 (T1T1 1) T =
结论:如果 X 的协差阵 Σ 的特征根为
1 2 p 0 。由此知道若 k 为第 k 大
特征根,其相应的单位化的特征向量为Tk 。 k Y T 则第 主成分 k k X ; D(Yk ) k ; cov( Yk , Yi ) 0, k i ; Y T; 其中 T 为 的特征向 量构成的正交矩阵。
2014-4-21
Y t X t X t X T X 1p p 1 1 11 1 12 2 Y2 t21 X 1 t 22 X 2 t 2 p X p T2 X Y t X t X t X T X p p 1 1 p 2 2 pp p p
2014-4-21
第二主成分及第k主成分满足条件
考虑到Y2 =t21x1+t22x2 + t23x3 +... +tp1xp = T'2X ,及我们的准 则
第 二 主 成 分 为 , 满 足
, 且 Cov (Y2 , Y1 ) Cov (T2 X, T1 X) 0 , 使 得 D (Y2 ) T2 ΣT2 达到最大的 Y2 T2 X 。 一般情形,第 k 主成分为,满足 TkTk 1 , 且 Cov(Yk , Yi ) Cov(Tk X, Ti X) 0( i k ) , 使得 D(Yk ) Tk ΣTk 达到最大的 Yk Tk X 。
2014-4-21
思考:如何减少变量,但信息量保留得较多。
由此产生了主成分分析法。 主成分分析也称主分量分析(principal components analysis,PCA)是由美国 的科学家哈罗德· 霍特林(Harold otelling)于1933年首先提出的。
2014-4-21
2014-4-21
2014-4-21
2014-4-21
2014-4-21
一、降维的两个准则 准则1:信息量损失尽可能少。
准则2:新主成分之间相关性低、重叠少。
常见相关模型及其 建模方法
1 . 发散思维模型 2 . 专题求解模型
近几年赛题 为例
2009年A题 制动器试验台的控制方法分析 B题 眼科病床的合理安排 2010年A题 储油罐的变位识别与罐容表标定 B题 上海世博会影响力的定量评估 2011年A题 城市表层土壤重金属污染分析 B题 交巡警服务平台的设置与调度 2012年A题 B题
1
对目标函数 1 (T1 , ) 求导数有: 1 2ΣT1 2T1 0 即 (Σ I)T1 0 Y1的方差 T1
T1
| I | 0
两边左乘 T1 得到 T1 ΣT1 由于 X 的协差阵 Σ 为非负定的,其特征方程的根均大于等于零, 不妨设 1 2 p 0 。由于 Y1 的方差为 。那么, Y1 的 最大方差值为 1 ,其相应的单位化特征向量为 T1 。
2 (T2 , , ) T2 ΣT2 (T2T2 1) 2 (T1T2 )
第二主成分及第k主成分求法
对目标函数 2 (T2 , , ) 求导数有:
2 2 ΣT2 2T2 2 T1 0 T2
ΣT2 T1T2 用 T1 左乘上式有 表明גּ是T ∑ T' 为特征向量 1 的特征值, 1 T1 0 2T 由于 T1 ΣT2 0 ,T1T2 0 ,那么,T1T1 0 ,即有 0 。 从而 ( Σ I)T2 0 而且将方程两边同乘以 T 2’,有 T2 ΣT2
矩阵表示形 式为:
Y1 cos Y sin 2 sin X 1 TX cos X 2
1
由坐标转换公式得
Y1 X 1 cos X 2 sin
其中, T 为旋转变换矩阵,它是正交矩阵,即有 T T 或 TT I 。故由 X 到 Y 用的是正交变换。
2014-4-21
三、明确重叠少数学意义
我们知道,当一个变量与有关联时 难免表达信息有重复,没关联反映在数 学上最好是两变量独立,而这一要求过 强,较难满足,这里我们就要求新主成 分之间无线性关系就好,反映在概率理 论上就是每两个主成分之间的协方差为 “0”或相关系数为“0” 。
常用的方法有:
2014-4-21
层次分析法 主成份分析法 熵权法 数据包络分析法 模糊综合评价法 灰色理论评价方法
测试分析法
回归分析 曲线拟合 计算机模拟与仿真
2014-4-21
专题建模法
数学规划(线性规划与非线性规划) 概率论与数理统计 图论 微分方程 各学科实际问题
T2T2 1
2014-4-21
在求第二主成分之前,注意到我们已经求得, ? 那么, 如果 Y2 与 Y1 不相关, Cov (Y2 , Y1 ) T2 ΣT1 T2T1 。 即有 T2T1 0 或 T1T2 0 。 这时, 我们可以构造求第二 主成分的目标函数,即
其中 D(Yi ) 表示方差,Cov表示协方差, 这里X是多维随机向量,D(X)则表述 的是X的协方差阵,一般用
2014-4-2 E[(X i E( X i )(X j E( X j )) 11 12 1n 21 22 2n , ij cov(X i , X j ) cov(X j , X i ) ji n1 n 2 nn
k (Tk , , i ) Tk ΣTk (TkTk 1) 2 i (TiTk )
i 1 k 1
对目标函数 k (Tk , , i ) 求导数有:
k 1 k 2ΣTk 2Tk 2 iTi 0 i 1 Tk
2014-4-21
2014-4-21
信息合理运用法
将与问题相关的论文合理运用 07年选区的重新划分与统计物理 将其他问题的论文合理运用
2014-4-21
问题实际背景,在众多评价问题中,人们往往
会对评价样品收集尽可能多的指标,例如人口普 查往往要调查每个人的姓名、年龄、性别、文化 程度、住房、职业、收入、消费等几十项指标; 再如,2012年葡萄评价有24指标。 从收集资料的角度来看,收集较多的数据有利于 完整反映样品的特征,但是这些指标从统计角度 来看相互之间具有一定的依赖关系,从而使所观 测的数据在反映信息上有一定重叠,同时又使得 问题变得复杂。