当前位置:文档之家› 数学建模-主成分分析法模板

数学建模-主成分分析法模板

根据主成分分析的方法,分析……的数据。

步骤如下:Step 1:为了消除不同变量的量纲的影响,首先需要对变量进行标准化,设检测数据样本共有n 个,指标共有p 个,分别设1X ,2X ,p X ,令ij X (i=1,2,…,n;j=1,2,…,p)为第i 个样本第j 个指标的值。

作变换)Var(X )E(X X Y j j j j -=(j=1,2,…,p)得到标准化数据矩阵jjij ij s x x y -=,其中∑==i 1i ij j x n 1x ,∑=-=n 1i 2j ij 2j )x x (n 1sStep 2:在标准化数据矩阵p n ij )y (Y ⨯=的基础上计算p 个原始指标相关系数矩阵⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎣⎡==⨯pp 2p 1p p 22221p 11211pp ij r r r r r r r r r )r (R ΛM M M M ΛΛ其中,∑∑∑===----=n1k n1k 2j k j 2i k in1k j k j i k iij )x x ()x x()x x )(x x(r (i,j=1,2,…,p)Step 3:求相关系数矩阵R 的特征值并排序0p 21≥λ≥≥λ≥λΛ,再求出R 的特征值相应的正则化特征向量)e ,,e ,e (e ip i21i i K =,则第i 个主成分表示为各指标k X 的组合∑=⋅=p1i k ik i X e Z 。

Step 4:计算累积贡献率确定主成分的数目。

主成分i Z 的贡献率为)p ,,2,1i (w p1k kii Λ=λλ=∑=累计贡献率为)p ,,2,1i (pi1k kΛ=λ∑=一般取累计贡献率达85%~95%的特征值m 21,,,λλλΛ所对应的第1、第2,…,第m (m ≤p )个主成分。

Step 5:计算主成分载荷,确定综合得分。

当主成分之间不相关时,主成分载荷是主成分和各指标的相关系数,相关系数越大,说明主成分对该指标变量的代表性就越好,计算公式为)p ,,2,1j ,i (e )x ,z (p l ij i j i ij Λ=λ==Step 6:各主成分的得分,确定综合评分函数。

得到各主成分的载荷以后,可以计算各主成分的得分⎪⎪⎩⎪⎪⎨⎧+++=+++=+++=p m p 22m 11m m pp 22221212p p 12121111x l x l x l z x l x l x l z x l x l x l z ΛK K K ΛΛ ⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡==⨯nm 2n 1n m 22221m 11211mn ij z z z z z z z z z )z (Z ΛM M M M ΛΛ,其中ij z 表示第i 个样本第j 个主成分得分,则第i 个样本的综合得分∑=⋅=m1k ik k i z w f (i=1,2,…,n);附件中共有 28 个月的数据,这里仅随机选择 2005 年 4 月的数据来说明利 分析进行水质综合评价的过程(同理可进行其他月份的数据分析)。

调用 MATLAB 统计工具箱 princomp 函数,格式为:[pc,score,latent,tsquare]=princomp(ingredients)其中 ingredients 指标准化后的样本指标矩阵,pc 是指各主成分关于指标的线性组合的系数矩阵,score 为各主成分得分,latent 是方差矩阵的特征值,tsquare 为Hotelling 2T 统计量。

各种指标的相关系数矩阵:(填充数据)各个主成分的贡献率:表1 主成分的贡献率表由表可看出,前三个主成分的累积贡献率已达到(填充数据),取控制参数α=0.06(因为28个月中前三个成分贡献率最低为94%),因此取前三个主成分对(填充文字)进行综合评价。

根据R 的特征值的相应的正则化单位特征向量,前m个主成分关于指标的线性组合为:(填充表达式)(分析)根据线性表达式中的系数及符号,可对各主成分的实际意义作如下解释:第1主成分为除(变量)之外的三项指标的综合;第2主成分与(变量)成正相关,与(变量)成负相关;第3主成分为除(变量)之外的三项指标的综合。

以各个主成分的方差贡献率为权重可得到(文字)的最终综合评价。

表2 XX综合评价表上表给出了XX的综合评价,综合得分越高说明(文字),排名越高x=[0.0581 0.0356 0.0435 0.0680 0.0557 0.1112 0.1194 0.1184 0.1083 0.13920.0423 0.0346 0.0354 0.0770 0.0089 0.0642 0.0483 0.0499 0.0534 0.05440.0407 0.0139 0.0688 0.0234 0.0080 0.0047 0.0151 0.0314 0.0252 0.01830.0139 0.0391 0.0056 0.0093 0.0053 0.0290 0.0087 0.0174 0.0234 0.01580.0097 0.0263 0.0086 0.0028 0.0064 0.0064 0.0045 0.0062 0.0111 0.00750.0315 0.0375 0.0305 0.0198 0.0213 0.0376 0.0243 0.0398 0.0357 0.02780.0253 0.0295 0.0443 0.0286 0.0295 0.0468 0.0304 0.0334 0.0248 0.02330.0321 0.0242 0.0437 0.0203 0.0132 0.0233 0.0153 0.0212 0.0270 0.02130.0431 0.0276 0.0628 0.0142 0.0184 0.0184 0.0206 0.0285 0.0455 0.03160.0610 0.0440 0.0488 0.1853 0.0176 0.1086 0.1848 0.1148 0.0888 0.13520.0250 0.0318 0.0233 0.0444 0.0391 0.0273 0.0284 0.0251 0.0300 0.03270.0286 0.0212 0.0334 0.0408 0.0490 0.0285 0.0192 0.0328 0.0255 0.02850.0250 0.0152 0.0337 0.0361 0.0609 0.0251 0.0215 0.0232 0.0164 0.01990.0200 0.0190 0.0148 0.0085 0.0134 0.0037 0.0100 0.0072 0.0125 0.00890.0271 0.0163 0.0508 0.0223 0.0243 0.0175 0.0200 0.0222 0.0183 0.01640.0060 0.0290 0.0079 0.0195 0.0102 0.0063 0.0179 0.0093 0.0124 0.01590.0197 0.0237 0.0162 0.0078 0.0101 0.0078 0.0072 0.0117 0.0164 0.01160.0259 0.0243 0.0350 0.0214 0.0162 0.0287 0.0197 0.0182 0.0220 0.01820.0327 0.0220 0.0562 0.0391 0.0367 0.0416 0.0282 0.0220 0.0273 0.02320.0286 0.0204 0.0160 0.0180 0.0286 0.0165 0.0166 0.0227 0.0223 0.01680.0344 0.0349 0.0286 0.0255 0.0268 0.0377 0.0259 0.0254 0.0393 0.03170.0271 0.0185 0.0270 0.0105 0.0239 0.0140 0.0139 0.0153 0.0183 0.01440.0318 0.0370 0.0377 0.0793 0.0603 0.0582 0.0754 0.0901 0.0482 0.07350.0056 0.0472 0.0071 0.0692 0.0240 0.0104 0.0791 0.0421 0.0240 0.04560.0133 0.0242 0.0170 0.0039 0.0141 0.0080 0.0064 0.0097 0.0119 0.00900.0025 0.0497 0.0011 0.0024 0.0146 0.0057 0.0049 0.0072 0.0050 0.00480.1428 0.0123 0.0983 0.0292 0.1437 0.0613 0.0385 0.0402 0.0590 0.03870.0466 0.0199 0.0456 0.0200 0.1100 0.0479 0.0240 0.0331 0.0350 0.02900.0149 0.0271 0.0085 0.0076 0.0430 0.0101 0.0085 0.0079 0.0146 0.01010.0220 0.0230 0.0187 0.0123 0.0154 0.0294 0.0224 0.0182 0.0232 0.02030.0313 0.0244 0.0174 0.0125 0.0283 0.0238 0.0175 0.0259 0.0300 0.02130.0134 0.0324 0.0061 0.0100 0.0050 0.0116 0.0073 0.0117 0.0173 0.01330.0062 0.0311 0.0016 0.0024 0.0048 0.0036 0.0021 0.0038 0.0072 0.00530.0044 0.0340 0.0040 0.0022 0.0058 0.0029 0.0032 0.0036 0.0063 0.00430.0074 0.0491 0.0019 0.0063 0.0073 0.0221 0.0109 0.0105 0.0146 0.0125];%原始数据,行为变量,列为样本%x=x';%可有可无;Newdata=zscore(x);%数据进行标准化[PC,SCORE,latent,tsquare]=princomp(Newdata);%stdr=std(x);%求各变量的标准差%[n,m]=size(x);。

相关主题