多元统计分析课程设计题目课程设计题目1. 下表给出了1991年我国30个省、区、市城镇居民的月平均消费数据,所考察的八个指标如下(单位均为元/人)X1 :人均粮食支出; X2 :人均副食支出;X3 :人均烟酒茶支出; X4 :人均其他副食支出;X5 :人均衣着商品支出; X6 :人均日用品支出;X7 :人均燃料支出; X8 :人均非商品支出;问题:(1)求样品相关系数矩阵R;(2)从R 出发做主成分分析,求各主成分的贡献率,及前两个主成分的累积贡献率;(3)求出前两个主成分并解释其意义.按第一主成分将30个省、区、市排序,结果如何?表一 1991年我国30个省、区、市城镇居民的月平均消费数据省市X1 X2 X3 X4 X5 X6 X7 X81 山西8.35 23.53 7.51 8.62 17.42 10.00 1.04 11.212 内蒙古9.25 23.75 6.61 9.19 17.77 10.48 1.72 10.513 吉林8.19 30.50 4.72 9.78 16.28 7.60 2.52 10.324 黑龙江7.73 29.20 5.42 9.43 19.29 8.49 2.52 10.005 河南9.42 27.93 8.20 8.14 16.17 9.42 1.55 9.766 甘肃9.16 27.98 9.01 9.32 15.99 9.10 1.82 11.357 青海10.06 28.64 10.52 10.05 16.18 8.39 1.96 10.818 河北9.09 28.12 7.40 9.62 17.26 11.12 2.49 12.659 陕西9.41 28.20 5.77 10.80 16.36 11.56 1.53 12.1710 宁夏8.70 28.12 7.21 10.53 19.45 13.30 1.66 11.9611 新疆 6.93 29.85 4.54 9.49 16.62 10.65 1.88 13.6112 湖北8.67 36.05 7.31 7.75 16.67 11.68 2.38 12.8813 云南9.98 37.69 7.01 8.94 16.15 11.08 0.83 11.6714 湖南 6.77 38.69 6.01 8.82 14.79 11.44 1.74 13.2315 安徽8.14 37.75 9.61 8.49 13.15 9.76 1.28 11.2816 贵州7.67 35.71 8.04 8.31 15.13 7.76 1.41 13.2517 辽宁7.90 39.77 8.49 12.94 19.27 11.05 2.04 13.2918 四川7.18 40.91 7.32 8.94 17.60 12.75 1.14 14.8019 山东8.82 33.70 7.59 10.98 18.82 14.73 1.78 10.1020 江西 6.25 35.02 4.72 6.28 10.03 7.15 1.93 10.3921 福建10.60 52.41 7.70 9.98 12.53 11.70 2.31 14.6922 广西7.27 52.65 3.84 9.16 13.03 15.26 1.98 14.5723 海南13.45 55.85 5.50 7.45 9.55 9.52 2.21 16.3024 天津10.85 44.68 7.32 14.51 17.13 12.08 1.26 11.5725 江苏7.21 45.79 7.66 10.36 16.56 12.86 2.25 11.6926 浙江7.68 50.37 11.35 13.30 19.25 14.59 2.75 14.8727 北京7.78 48.44 8.00 20.51 22.12 15.73 1.15 16.6128 西藏7.94 39.65 20.97 20.82 22.52 12.41 1.75 7.9029 上海8.28 64.34 8.00 22.22 20.06 15.12 0.72 22.8930 广东12.47 76.39 5.52 11.24 14.52 22.00 5.46 25.502. 下表是49位女性在空腹情况下三个不同时刻的血糖含量(用X1 ,X2 ,X3表示)和摄入等量食糖一小时后的三个时刻的血糖含量(用小X4 ,X5 ,X6表示)的观测值(单位:mg/100ml).问题:分别从样本协方差阵S和样本相关系数矩阵R出发做主成分分析,求主成分的贡献率和各个主成分. 在两种情况下,你认为应保留几个主成分?其意义如何解释?就此而言,你认为基于S和R的分析那个结果更为合理?表二 49位女性在空腹和摄入食糖后三个不同时刻的血糖含量编号空腹摄入食糖X1 X2 X3 X4 X5 X61 60 69 62 97 69 982 56 53 84 103 78 1073 80 69 76 66 99 1304 55 80 90 80 85 1145 62 75 68 116 130 916 74 64 70 109 101 1037 64 71 66 77 102 1308 73 70 64 115 110 1099 68 67 75 76 85 11910 69 82 74 72 133 12711 60 67 61 130 134 12112 70 74 78 150 158 10013 66 74 78 150 131 14214 83 70 74 99 98 10515 68 66 90 119 85 10916 78 63 75 164 98 13817 103 77 77 160 117 12118 77 68 74 144 71 15319 66 77 68 77 82 8920 70 70 72 114 93 12221 75 65 71 77 70 10922 91 74 93 118 115 15023 66 75 73 170 147 12124 75 82 76 153 132 11525 74 71 66 143 105 10026 76 70 64 114 113 12927 74 90 86 73 106 11628 74 77 80 116 81 7729 67 71 69 63 87 7030 78 75 80 105 132 8031 64 66 71 83 94 13332 71 80 76 81 87 8633 63 75 73 120 89 5934 90 103 74 107 109 10135 60 76 61 99 111 9836 48 77 75 113 124 9737 66 93 97 136 112 12238 74 70 76 109 88 10539 60 74 71 72 90 7140 63 75 66 130 101 9041 66 80 86 130 117 14442 77 67 74 83 92 10743 70 67 100 150 142 14644 73 76 81 119 120 11945 78 90 77 122 155 14946 73 68 80 102 90 12247 72 83 68 104 69 9648 65 60 70 119 94 8949 52 70 76 92 94 100 3. 考察1985年至2000年全国如下各价格指数:X1 :商品零售价格指数;X2 :居民消费价格指数;X3 :城市居民消费价格指数;X4 :农村居民消费价格指数;X5 :农产品收购价格指数;X6 :农村工业品零售价格指数;观测数据见下表.问题:按年份用下列方法进行系统聚类分析,画出谱系聚类图,并给出聚为3类的结果.(a)最短距离法;(b)最长距离法;(c)类平均距离法;表三全国各年度各种价格指数年份X1 X2 X3 X4 X5 X6 1985 128.1 100.0 134.2 100.0 166.8 111.1 1986 135.8 106.5 143.6 106.1 177.5 114.7 1987 145.7 114.3 156.2 112.7 198.8 120.2 1988 172.7 135.8 188.5 132.4 244.5 138.5 1989 203.4 160.2 219.2 157.9 281.2 164.4 1990 207.7 162.2 222.0 165.1 273.9 172.0 1991 213.7 170.8 233.3 168.9 268.4 177.2 1992 225.7 181.7 253.4 176.8 277.5 182.7 1993 254.9 208.4 294.2 201.0 314.7 204.3 1994 310.2 258.6 367.8 248.0 440.3 239.4 1995 356.1 302.8 429.6 291.4 527.9 274.6 1996 377.8 327.9 467.4 314.4 550.1 291.6 1997 380.8 337.1 481.9 322.3 525.3 294.8 1998 370.9 334.4 479.0 319.1 483.3 288.3 1999 359.8 329.7 472.8 314.3 424.3 280.5 2000 354.4 331.0 476.6 314.0 409.0 277.14. 考察1985年至2000年全国如下各价格指数:X1 :商品零售价格指数;X2 :居民消费价格指数;X3 :城市居民消费价格指数;X4 :农村居民消费价格指数;X5 :农产品收购价格指数;X6 :农村工业品零售价格指数;观测数据见下表.问题:先将数据标准化,再按年份用下列方法进行系统聚类分析,画出谱系聚类图,并给出聚为3类的结果.(a)最短距离法;(b)最长距离法;(c)重心距离法.表四全国各年度各种价格指数年份X1 X2 X3 X4 X5 X6 1985 128.1 100.0 134.2 100.0 166.8 111.1 1986 135.8 106.5 143.6 106.1 177.5 114.7 1987 145.7 114.3 156.2 112.7 198.8 120.2 1988 172.7 135.8 188.5 132.4 244.5 138.5 1989 203.4 160.2 219.2 157.9 281.2 164.4 1990 207.7 162.2 222.0 165.1 273.9 172.0 1991 213.7 170.8 233.3 168.9 268.4 177.2 1992 225.7 181.7 253.4 176.8 277.5 182.7 1993 254.9 208.4 294.2 201.0 314.7 204.3 1994 310.2 258.6 367.8 248.0 440.3 239.4 1995 356.1 302.8 429.6 291.4 527.9 274.6 1996 377.8 327.9 467.4 314.4 550.1 291.6 1997 380.8 337.1 481.9 322.3 525.3 294.8 1998 370.9 334.4 479.0 319.1 483.3 288.3 1999 359.8 329.7 472.8 314.3 424.3 280.5 2000 354.4 331.0 476.6 314.0 409.0 277.15. 研究货运总量y(万吨)与工业总产值x1(亿元)、农业总产值x2(亿元)。