当前位置:文档之家› 居民消费指数分析报告

居民消费指数分析报告

各地居民消费指数聚类分析报告
小组成员:蒋敏王凝煜张乐
一、 2001年社会经济背景:GDP(国内生产总值):95933亿元
其中第一产业增加值14610亿元,增长2.8%;第二产业增加值49069亿元,增长8.7%;第三产业增加值32254亿元,增长7.4%
CPI(居民消费价格指数):比上年增长0.7%
总人口:127627万人
城镇人口48064万人,占37.7%;乡村人口79563万人,占62.3%。

全国男性人口为65672万人,女性为61955万人。

0-14岁人口比重为22.5%,15-64岁人口比重为70.4%,65岁及以上老年人口比重为7.1%,老年人口达到9062万人。

全年全国出生人口1702万人,出生率为13.38‰;死亡人口818万人,死亡率为6.43‰;全年净增人口884万人,自然增长率为6.95‰
全国从业人员和职工人数
从业人员:73025万人,比上年末增加940万人。

其中城镇就业人员2 3940万人,增加789万人。

年末国有企业下岗职工为515万人,比上年末减少142万人。

全年通过多种途径使227万人实现了再就业。

年末城镇登记失业率为3.6%。

城乡居民收入(平均每人)
全年全国城镇居民人均可支配收入6860元,比上年实际增长8.5%。

农村居民人均纯收入2366元,实际增长4.2%。

城乡储蓄存款余额:73762亿元
外汇储备:2122亿美元
进出口贸易总额:5098亿美元
其中出口总额2662亿美元,增长6.8%;进口总额2436亿美元,增长8.2%
部分工业产品产量
原煤:11.1亿吨;钢材:15745万吨;粮食:45262万吨;油料:287 2万吨;卷烟:3402万箱;彩色电视机:3967万部;家用电冰箱:1349万台
社会消费品零售总额:37595亿元
其中批发零售贸易业零售额25511亿元,增长10.7%;餐饮业零售额4 369亿元,增长16.4%;其他行业零售额7716亿元,增长4.9%。

运输
铁路14575亿吨公里,增长6.7%;公路6180亿吨公里,增长0.8%;水运24860亿吨公里,增长4.7%;民航44亿吨公里,增长3.8%。

二、导言
在古老的分类学中,人们主要靠经验和专业知识,很少利用数学方法。

随着生产技术和科学的发展,分类越来越细,以至有事仅凭经验和专业知识还不能进行明确分类,于是统计这个有用的工具逐渐被引入分类学中,形成了形成了数值分类学。

近些年来,数理统计的多元统计方法有了迅速的发展,多远分析的技术自然被引入分类学中,于是从数值分类学中逐渐分离出聚类分析这个新的分支。

我们认为,所研究的样品或指标(变量)之间存在着程度不同的相似性(亲流关系)。

于是根据一批样品的多个观测指标,具体找出一些能够度量样品或指标之间相似程度的统计量,以这些统计量为划分类型的依据,把一些相似程度较大的样品或指标聚合为一类,把另外一些彼此之间相似程度较大的样品或指标聚合成另一类。

关系密切的聚合到一个小得分类单位,关系疏远的聚合到一个大的分类单位,直到把所有的样品或指标都聚合完毕,把不同的类型一一划分出来,形成一个由小到大的分类系统。

最后再把整个分类系统画成一张分群图(又称谱系图),用它把所有的样品或指标间的亲疏关系表现出来。

在经济,社会,人口研究中,存在着大量的分类研究、构造分类模式的问题。

例如在经济研究中,为了研究不同地区城镇居民生活中得收入及消费状况,往往需要划分为不同的类型去研究;在人口研究中,需要构造人口生育分类模式、人口死亡分类函数,以此来研究人口的生育和死亡规律。

过去人们主要靠经验和专业知识,做定性分类处理,致使许多分类带有主观性和任意性,不能很好的揭示客观事物内在的本质差别和联系,特别是对多因素、多指标的分类问题,定性分类更难以实现准确分类。

聚类分析不仅可以用来对进行分类,也可以用来对变量进行分类。

对样品的分类常称为Q型聚类分析,对变量的分类常称为R型聚类分析。

与多元分类的其他方法相比,聚类分析的方法较粗糙,理论上还不完善,但由于他能解决许多实际问题,所以很受人们的重视,同回归分析、判别分析称为多元分析的三大方法。

三、在以上的背景下,通过《中国统计网》得到以下数据
1.现对以上数据通过SPSS软件用系统聚类法进行聚类分析:
此表是反映每一阶段的聚类结果,Coefficients是表示聚合系数。

第二列和第三列是表示聚合的类
2.聚合系数随分类数变化的曲线
此图是聚合系数随分类数变化的曲线,由图可以看出,当分类数为19或20时,曲线变的比较平缓;这个分类数也符合我们分类的目的。

3.接近度矩阵
氏距离,所以样品间的距离越大,样品越相异。

如果选择的是Pearson相关系数,则接近度矩阵是相似性矩阵。

4.系统聚类分析中的类成员
上图说明当样本聚为5类,四类,三类或两类时分别的分类情况,各个序号相同的编号聚为一类,可得到分类结果。

如分为5类是结果如下:广西,甘肃宁夏一类,青海一类,上海为一类;天津是一类,其他各省为第五类。

其余各种分类类结果同理可得。

5.冰柱图
上,从左到右就可以找到各类所包含的样品,由此图可以看出,比如我们分为三类,最左边的类数应选3,每个样品右边都有一列x,如果某个样品右边的x个数少于三,那么他和前面多于三个的x聚为一类,如此下去直到找到全部三类为止。

6.树状聚类图,从图中可以由分类个数得到分类情况
* * * * * * * * * * * * * * * * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * * * * * * * * * * * * * * * * *
Dendrogram using Average Linkage (Between Groups)
Rescaled Distance Cluster Combine
C A S E 0 5 10 15
20 25
Label Num
+---------+---------+---------+---------+---------+
山西省 4 -+
广东省 19 -+-+
辽宁省 6 -+ |
吉林省 7 -+ +-+
浙江省 11 -+ | +-+
陕西省 27 ---+ | |
新疆维吾尔自治区 31 -----+ |
江苏省 10 -+-+ |
湖北省 17 -+ | |
河南省 16 ---+---+-+
安徽省 12 ---+ | |
河北省 3 ---+ | |
福建省 13 ---+-+ | +---+
山东省 15 ---+ +-+ | |
黑龙江省 8 -----+ | |
湖南省 18 -+-----+ | +---+
西藏自治区 26 -+ +-+ | |
四川省 23 -------+ | |
内蒙古自治区 5 -----+-+ | +-+
贵州省 24 -----+ +-----+ | |
重庆市 22 -------+ | |
北京市 1 -----------------+ +-----+
海南省 21 -------------------+ |
江西省 14 -----------+-------+ +-------+
云南省 25 -----------+ | |
广西壮族自治区 20 -------------+-------+ |
+-----+
宁夏回族自治区 30 -------------+ +---+ | |
甘肃省 28 ---------------------+ | +---------+
天津市 2 ---------------------------------+ | |
上海市 9
---------------------------------------+ |
青海省 29
-------------------------------------------------+
由此图得到的分类情况如下:如果我们选择分类数为3 ,就从距离为18的地方往下切,得到的分类结果如下{1,天津,上海}{2青海}{3.其余}。

四.参考文献
文献来源:中国统计网、《多元统计分析》。

相关主题