当前位置:文档之家› 主成分分析实验报告

主成分分析实验报告

项目名称实验4—主成分分析所属课程名称多元统计分析(英)项目类型综合性实验_____________ 实验(实训)日期2012年4 月15日二、实验(实训)容:【项目容】主成分分析。

【方案设计】题目:由原始数据求主成分。

【实验(实训)过程】(步骤、记录、数据、程序等)附后【结论】(结果、分析)附后三、指导教师评语及成绩:评语:成绩:指导教师签名:批阅日期:实验报告4主成分分析(综合性实验)(Prin cipal comp onent an alysis)实验原理:主成分分析利用指标之间的相关性,将多个指标转化为少数几个综合指标,从而达到降维和数据结构简化的目的。

这些综合指标反映了原始指标的绝大部分信息,通常表示为原始指标的某种线性组合,且综合指标间不相关。

利用矩阵代数的知识可求解主成分实验题目:下表中给出了不同国家及地区的男子径赛记录:(t8a6)Country 100m 200m 400m 800m 1500m 5000m 10,000m Marathon(s) (s) (s) (min) (min) (min) (min) (mins) Argentina 10.39 20.81 46.84 1.81 3.7 14.04 29.36 137.72 Australia 10.31 20.06 44.84 1.74 3.57 13.28 27.66 128.3 Austria 10.44 20.81 46.82 1.79 3.6 13.26 27.72 135.9 Belgium 10.34 20.68 45.04 1.73 3.6 13.22 27.45 129.95 Bermuda 10.28 20.58 45.91 1.8 3.75 14.68 30.55 146.62 Brazil 10.22 20.43 45.21 1.73 3.66 13.62 28.62 133.13 Burma 10.64 21.52 48.3 1.8 3.85 14.45 30.28 139.95 Canada 10.17 20.22 45.68 1.76 3.63 13.55 28.09 130.15 Chile 10.34 20.8 46.2 1.79 3.71 13.61 29.3 134.03 China 10.51 21.04 47.3 1.81 3.73 13.9 29.13 133.53 Columbia 10.43 21.05 46.1 1.82 3.74 13.49 27.88 131.35 Cook Islands 12.18 23.2 52.94 2.02 4.24 16.7 35.38 164.7 Costa Rica 10.94 21.9 48.66 1.87 3.84 14.03 28.81 136.58 Czechoslovakia 10.35 20.65 45.64 1.76 3.58 13.42 28.19 134.32 Denmark 10.56 20.52 45.89 1.78 3.61 13.5 28.11 130.78 Dominican Republic 10.14 20.65 46.8 1.82 3.82 14.91 31.45 154.12 Finland 10.43 20.69 45.49 1.74 3.61 13.27 27.52 130.87 France 10.11 20.38 45.28 1.73 3.57 13.34 27.97 132.3 German (D.R.) 10.12 20.33 44.87 1.73 3.56 13.17 27.42 129.92German (F.R.) 10.16 20.37 44.5 1.73 3.53 13.21 27.61 132.23 Great Brit.& N. Ireland 10.11 20.21 44.93 1.7 3.51 13.01 27.51 129.13Greece 10.22 20.71 46.56 1.78 3.64 14.59 28.45 134.6 Guatemala 10.98 21.82 48.4 1.89 3.8 14.16 30.11 139.33 Hungary 10.26 20.62 46.02 1.77 3.62 13.49 28.44 132.58 India 10.6 21.42 45.73 1.76 3.73 13.77 28.81 131.98 Indonesia 10.59 21.49 47.8 1.84 3.92 14.73 30.79 148.83 Ireland 10.61 20.96 46.3 1.79 3.56 13.32 27.81 132.35 Israel 10.71 21 47.8 1.77 3.72 13.66 28.93 137.55 Italy 10.01 19.72 45.26 1.73 3.6 13.23 27.52 131.08 Japan 10.34 20.81 45.86 1.79 3.64 13.41 27.72 128.63 Kenya 10.46 20.66 44.92 1.73 3.55 13.1 27.38 129.75 Korea 10.34 20.89 46.9 1.79 3.77 13.96 29.23 136.25 D.P.R Korea 10.91 21.94 47.3 1.85 3.77 14.13 29.67 130.87 Luxembourg 10.35 20.77 47.4 1.82 3.67 13.64 29.08 141.27 Malaysia 10.4 20.92 46.3 1.82 3.8 14.64 31.01 154.1 Mauritius 11.19 22.45 47.7 1.88 3.83 15.06 31.77 152.23 Mexico 10.42 21.3 46.1 1.8 3.65 13.46 27.95 129.2 Netherlands 10.52 20.95 45.1 1.74 3.62 13.36 27.61 129.02 New Zealand 10.51 20.88 46.1 1.74 3.54 13.21 27.7 128.98 Norway 10.55 21.16 46.71 1.76 3.62 13.34 27.69 131.48 Papua New Guinea 10.96 21.78 47.9 1.9 4.01 14.72 31.36 148.22 Philippines 10.78 21.64 46.24 1.81 3.83 14.74 30.64 145.27 Poland 10.16 20.24 45.36 1.76 3.6 13.29 27.89 131.58 Portugal 10.53 21.17 46.7 1.79 3.62 13.13 27.38 128.65 Rumania 10.41 20.98 45.87 1.76 3.64 13.25 27.67 132.5 Singapore 10.38 21.28 47.4 1.88 3.89 15.11 31.32 157.77 Spain 10.42 20.77 45.98 1.76 3.55 13.31 27.73 131.57 Sweden 10.25 20.61 45.63 1.77 3.61 13.29 27.94 130.63 Switzerland 10.37 20.46 45.78 1.78 3.55 13.22 27.91 131.2 Taipei 10.59 21.29 46.8 1.79 3.77 14.07 30.07 139.27Thailand 10.39 21.09 47.91 1.83 3.84 15.23 32.56 149.9 Turkey 10.71 21.43 47.6 1.79 3.67 13.56 28.58 131.5 USA 9.93 19.75 43.86 1.73 3.53 13.2 27.43 128.22 USSR10.07 20 44.6 1.75 3.59 13.2 27.53 130.55 Western Samoa10.8221.86492.024.2416.2834.71161.83(数据来源:1984年洛杉机奥运会IAAF/AFT 径赛与田赛统计手册) 实验要求: (1) 试用Princomp 过程求主成分;并对结果进行解释; (2) 试用方差累积贡献率和Scree 图确定主成分的个数; (3) 计算各国第一主成分的得分并排名; (4) 试对结果进行解。

实验题目分析报告:(1)试用Princomp 过程求主成分;并对结果进行解释;(2)试用方差累积贡献率和Scree 图确定主成分的个数;PrinlPrin2Prin3 □rin4^rinS 3rin6 3rin7 Prins0.566873 03^22620.127&2B-5^37^4 0.13^5241 A.1R5542 &.336975 0.461525 0.3605S7 -.259116 -.153357 0.656137 -.112640 -.096054 0.355&45 0.243273 -.SG&467 9.6523^11 -.2LB323 3.LS6625 -.052354 -.0&0127 6.360654 &.SL2+35 -.532432 -.4-7339S 0 . S+3&53 -.014652 -.233015 -.036165 0.572015-.133797-.153443-.4^4510-.4-57715 -.157B43 0. 6100110.135291比加舟跖-.2S39/9-.141299a.54bb9/G.3&6773 -.3&6B63 0.1S1752-.133176 219G17 -.176871 -.796795 G. 3-11926 -.433363 0.263,2990.2395120.437328 0.315285 0.39S822 0.1S8164tigenvectorsS M b亡-e f e-b h如上就是主成分分析截图,利用 sas 处理数据后我们可以知道:有8个主成分Eigenvalues of the Correlation MatrixEigenvalue Differenut Proportion Currulative1 5.744527849.82739.327320.877618290+718297159.10979.937S315932114 e.035271760^8199 e.?574斗 B * 124049390.044169110+01559.972950.079S3027G,01191512 e.eiw9.9S29石0.06796515 6.021545620.0085B. 991470・046419530.023S19430.005S0.997280.0028 1.0^0©12:52 Thursday, April 23, 2&12 2 igen^slue从上面的主成分累计贡献率截图和碎石图我们可以分析:选取两个主成分的贡献率就已经达到0.9375.所以我们选取2个主成分个数。

相关主题