理学院《应用多元统计分析》课程论文论文题目:多元统计分析中国城镇居民人均消费水平专业:统计学班级:112班姓名:杨晓丹学号*********** 指导教师:韩明职称教授2013年12月12日摘要本文通过选取2011年我国31个省市自治区城镇居民在食品、衣着、居住、家庭设备用品及服务、医疗保健、交通和通信、教育文化娱乐服务及其他商品和服务等方面的人均消费性支出,运用聚类分析及主成分分析对各地区进行比较和分析。
用聚类分析将各地区进行分类,对分类的地区进行比较,用主成分分析根据所选主要成分将各地区排名。
找出各地区城镇居民在消费性支出方面存在的差异,并提出相应缩小差异的建议。
除了地区间的比较,将结果同前一年比较,明确地区经济发展变化。
关键字:人均消费性支出聚类分析主成分分析目录摘要 (I)1 绪论 (1)1.1选题背景和研究现状 (1)1.2研究目的 (1)2 内容 (2)2.1数据收集 (2)2.2聚类分析 (3)2.3主成分分析 (4)2.4结果对比 (8)3 总结 (10)参考文献 (11)附录 (12)1 绪论1.1 选题背景和研究现状近年来,我国国民经济得到了迅速发展,人民生活水平进一步提高,物质文明建设达到了前所未有的水平。
但由于我国各地区经济发展水平不均衡,加之各地人口、资源、政策等各方面存在的差异,使各地区居民人均消费水平参差不齐,不同的地区具有不同的特点。
在这一背景下,研究我国各地区城镇居民家庭平均每人全年消费性支出情况,比较地区间的差异和差距,通过与前几年结果作对比,进而明确促进和抑制我国城镇居民人均消费性支出发展的影响因素。
1.2研究目的消费结构可以反映居民的生活质量和经济发展水平。
一般来说,经济越发达的地区,其消费结构就越趋向于追求安逸享受的消费结构。
在这样的消费结构中,教育文化娱乐服务支出所占的比例就会较大。
反之,在经济较不发达的地区中,生活必需品消费支出所占的比例就会较大。
随着社会主义市场经济体制的逐步完善,我国的社会生产力不断日益加快发展,经济总量和综合实力迅速上升,城镇居民的生活水平显著提高。
相对过去而言,居民食品方面的消费支出比重在逐渐下降,而在交通通讯、文化娱乐等方面的消费支出比重越来越大。
消费结构的变化,反映居民需求的变化。
研究我国城镇居民消费性支出情况及其影响因素,对建立合理的消费结构,扩大内需,搞活社会主义市场经济,制定产业政策,促进国民经济的发展都有着极其重要的意义。
2 内容2.1数据收集表1 我国各地区城镇居民家庭平均每人全年消费性支出情况【1】单位:元——资料来源:2012年《中国统计年鉴》2.2聚类分析运用R对表1数据进行Q型聚类分析。
得到聚类图如下从上图可以看出a) 如果根据各地区城镇居民人均全年消费状况把31各地区分为2类,结果为:第一类:上海第二类:其他地区这样分类不能突出城市之间的差距,只能说明上海市经济在我国最为发达。
b) 如果根据各地区城镇居民人均全年消费状况把31各地区分为3类,结果为:第一类:上海第二类:北京,天津,浙江,广东,江苏,福建、内蒙古第三类:其他地区这样分类只显示了经济较为发达地区,而没有对其他地区进行细分。
c) 如果根据各地区城镇居民人均全年消费状况把31各地区分为5类,结果为:第一类:上海第二类:西藏第三类:其他地区第四类:内蒙古第五类:北京,天津,浙江,广东,江苏,福建。
上海是国际大都市,经济最为发达。
西藏有其特殊的政治背景和特殊的地理位置。
内蒙古位于我国北部边疆,地理位置较为特殊,故独自归为一类。
北京,天津,浙江,广东,江苏,福建这些城市经济都比较发达,人均消费性支出高。
这样分类较为合理。
2.3主成分分析(1)计算相关矩阵:由所得结果可以看出前两个特征值的累计贡献率已达到87.1%,这说明前两个主成分已基本包含了全部指标具有的信息。
因此,我们提取2个特征值。
碎石图碎石图表现出从第三个主成分开始折线变得平坦,这与提取两个主成分相符。
Comp. 1 Comp.2Comp.3Comp.4Comp.5Comp.6Comp.7Comp.8北京-5.579 -0.765 -0.549 -0.1299-0.46560.24 -0.172-0.1896天津-2.971 -0.323 -1.033 -0.72410.517630.2143 0.2199-0.3201河北 1.5422 -0.243 -0.983 0.32017-0.0597-0.195 -0.149-0.0974山西 1.577 -0.292 -0.564 0.72531-0.2152-0.219 -0.512 0.0942内蒙古-1.792 -2.344 0.5618 0.532540.3647 -0.311 0.0813-0.0086辽宁-0.516 -0.909 -0.461 -0.37770.357790.1466 0.0191-0.1164吉林0.3748 -1.036 -0.794 0.234160.37148-0.122 -0.238 0.1923黑龙江 1.3295 -1.031 -0.461 -0.289 0.277070.0952 -0.053-0.0066上海-7.463 1.3955 0.635 0.5405 0.779120.4265 -0.3650.12029江苏-1.44 0.0623 0.9172 0.0183-0.8050.7406 -0.182 0.1946(5)计算综合得分和各地区排名根据加权法计算出的综合得分,其计算公式如下:()()2121145190.0854810.0126475.0744625.0/126475.0744625.0C C C C C +=++=由所得排名可以看出排名第一的是上海,第二是北京,第三是浙江。
排名后三位的是青海,贵州,西藏上海、北京、浙江等地区城镇居民消费性支出较高,这应该与这些地区的经济水平较为发达相关。
青海、贵州、西藏等地区城镇居民消费性支出偏低,这应该与这些地区经济水平较为落后相关,而经济水平落后则与当地的地理位置,人口密集度等相关。
其他消费性支出较为靠前的地区集中于我国东南部沿海地区,而我国中西部地区消费性支出中游偏下。
2.4结果对比【2】同样以衣着和食品为两个主要成分排名,比较2010年与2011年的结果,2011年浙江省名次跃居第三,内蒙古,江苏,福建的排名也有所上升,而排名靠后的地区大致没有变化。
说明经济发达的地区,经济速度飞快,在不断发展,且地区之间的竞争激烈。
而经济相对较落后的地区发展速度缓慢。
我国应该注重这些相对较落后地区,通过相应政策刺激这些地区的消费,进而拉动经济。
3 总结从聚类分析,主成分分析的分析结果看,尽管不同的分析方法所得的结果不同,但是上海、北京、天津、浙江、广东的城镇居民人均消费性支出都处于较高位置,而青海、甘肃、西藏的人均消费性支出处于低位。
对比前一年的排名结果可知,我国各地区的人均消费性支出排名总体没有太大差异,北京、上海、浙江、广东依旧名列前茅,而青海、西藏、贵州等地依旧落后于其他地区。
城镇居民的人均消费性支出直接反应地区的经济发展水平。
消费拉动经济,促进消费,改善消费结构的关键在于提高居民的收入。
其中教育文化消费在消费中占据很大的比例,要鼓励居民学习,引导居民正确的消费观,构建学习型社会,创造财富,拉动消费。
我国应该采取相应政策,刺激消费,缩小地区间差距。
参考文献[1]2012年中国统计年鉴[2]附录聚类分析> one<-read.csv("E://11.csv")> x1<-one[,2]> x1[1] 6905.51 6663.31 3927.26 3558.04 4962.40 5254.96 4252.85 [8] 4348.45 8905.95 6060.91 7066.22 5246.76 6534.94 4675.16 [15] 4827.61 4212.76 5363.68 4943.89 7471.88 5074.49 5673.65 [22] 5847.90 5571.69 4565.85 4802.26 5184.18 5040.47 4182.47 [29] 4260.27 4483.44 4537.46> x2<-one[,3]> x3<-one[,4]> x4<-one[,5]> x5<-one[,6]> x6<-one[,7]> x7<-one[,8]> x8<-one[,9]> X<-data.frame(x1,x2,x3,x4,x5,x6,x7,x8)> d<-dist(scale(X))> hc1<-hclust(d,'average')> opar<-par(mfrow=c(2,1),mar=c(5.2,4,0,0))>plclust(hc1,hang=-1);re1<-rect.hclust(hc1,k=5,border='red' )> par(opar)主成分分析> one<-read.csv("E://11.csv")> x1<-one[,2]> x1[1] 6905.51 6663.31 3927.26 3558.04 4962.40 5254.96 4252.85 4348.45 8905.95 6060.91 7066.22 5246.76[13] 6534.94 4675.16 4827.61 4212.76 5363.68 4943.89 7471.88 5074.49 5673.65 5847.90 5571.69 4565.85[25] 4802.26 5184.18 5040.47 4182.47 4260.27 4483.44 4537.46 > x2<-one[,3]> x3<-one[,4]> x4<-one[,5]> x5<-one[,6]> x6<-one[,7]> x7<-one[,8]> x8<-one[,9]> X<-data.frame(x1,x2,x3,x4,x5,x6,x7,x8)计算相关矩阵:> cor(X))求相关矩阵的特征值和主成分负荷> PCA=princomp(X,cor=T)> PCA> PCA$loadings确定主成分> X.pr<-princomp(X,cor=T)> summary(X.pr,loadings=T)画碎石图> screeplot(PCA,type='lines') 主成分得分> PCA$scores。