当前位置:文档之家› 基于主成分分析的经济发展水平综合评价

基于主成分分析的经济发展水平综合评价

基于主成分分析的经济发展水平综合评价1吴冲,王栋哈尔滨工业大学管理学院,哈尔滨 (150001)E-mail:wuchong@摘要:衡量一个国家的经济发展程度,要从其社会生产的各个方面去考察,要看各项生产能力的综合效果。

为了客观、科学地分析我国的经济发展状况,本文首次把居民消费价格指数和商品零售价格指数引入评价指标体系中,提出一种新的社会发展水平综合指标体系,并通过SPSS分析软件进行上机计算,应用主成分分析方法对我国31个省、直辖市、自治区(不包括香港、澳门和台湾)的经济发展水平进行综合分析和评价,突出了各大省市经济发展进程的特点和优势,为我国实现均衡发展提供理论依据。

关键词:主成分分析,经济发展,综合评价1. 引言要描述和评价一个社会的经济发展状况,最理想的是找到一个总括性社会指标体系评价方法,其测度结果能够反映社会经济发展的全部或大部分信息。

20世纪60年代以来一些国际性组织、国家和地区的职能部门以及研究学者曾经提出各种不尽完全相同的指标体系评价方法[1]。

我国系统地研究社会发展指标体系评价方法起步较晚,但发展很快,20世纪80年代以来,国内一些政府部门、研究单位和个人先后设计了一些“社会指标体系评价方法”[2-4],如:唐晓东[5]采用了21个指标变量的函数模型来评价我国社会经济发展状况,然而此模型一个最大缺点,就是没有把所有反映经济情况的因素考虑在内,得不到预期效果。

但到目前为止,还没有形成一套完善、客观的社会经济发展综合指标体系评价方法,为了更加全面、客观地反映我国各地区的社会发展水平,本文在借鉴国内外研究成果的基础上,通过对我国已有研究成果的修正和充实,首次把居民消费价格指数和商品零售价格指数引入评价指标体系中,提出一种新的社会发展水平综合指标体系。

在实际经济问题中,不同的经济变量之间具有一定的相关性,如职工平均工资和消费水平必然有一定的关联性,这样势必增加分析问题的复杂性,因此需要有一种进行简化的方法。

主成分分析法可以用较少的指标来代替原来较多的指标,并使这些较少的指标尽可能地反映原来指标的信息,从根本上解决了指标间的信息重叠问题,又大大简化了原指标体系的指标结构,用主成分分析法分析经济发展水平的优势主要体现在: (1)全面性(消除评价指标的相互影响),在满足n pf的条件下,不限制指标的个数,可以综合评价一国的经济发展状况,主成分分析的降维处理技术能较好地解决多指标评价的要求,在选择了()p个主成分后,m m p仍能保留原是数据信息的85%以上,因此这一方法综合评价经济发展水平比较全面,可以克服片面追求个别经济指标而忽略全面经济发展指标的倾向;(2)可加性(数据标准化处理),在综合评价经济发展水平时,所建立的评价指标量纲往往不同,变差不能直接综合,主成分分析法避免了此现象的发生,因为在计算过程中,主成分分析法把各个指标进行了标准化处理,这就使得各个经济指标之间具有可比性即可加性;(3)客观性(科学的确定权重),在层次分析法计算过程中,通过专家打分来确定权重,也就是说在确定权重的问题上具有了人为因素,而主成分分析法在确定综合因子的权重时,克服了某些评价方法中人为确定权重的缺陷,使得综合评价结果唯一;(4)简单性(计算简介),随着电子计算机技术的发展,SPSS、SAS等计1本课题得到高校博士点基金(20050213037)资助。

算机软件的推进与使用,使得主成分分析法在综合评价实践中的广泛应用成为现实。

2. 主成分分析的原理主成分分析法 (Principal Components Analysis)也称主分量分析法,是由Hotelling 于1933年首先提出,它可以在力保原始数据信息丢失最少的情况下,对高维变量空间进行降维。

用少数的变量来解释整个问题。

设有N 个样本,每个样本观测到P 个变量(记为,,,12x x x p L),构成一个n p ×阶的地理数据矩阵X : 111212122212x x x p x x x p Xx x x np n n =⎛⎞⎜⎟⎜⎟⎜⎟⎝⎠L L L L L L L 主成分分析的目的在于利用p 个原始变量(,,,)12x x x p L 构造少数几个新的综合变量,使得新变量为原始变量的线性组合,新变量互不相关,心变量包含p 个原始变量的绝大部分信息。

这样定义,,,12x x x p L 为原变量指标,,()12z z z m p m ≤L 为新的综合变量指标,每一个新综合变量指标是p 个原始变量的线性组合:11111221221122221122z l x l x l x p p z l x l x l x p p z l x l x l x m mp p m m =+++=+++=+++⎧⎪⎨⎪⎩L L M L 同时要求满足以下几个条件:(1)z i 与z j (; ,1,2,,)i j i j m ≠=L 相互无关;(2)1z 是,,,12x x x p L 的一切线性组合中方差最大者;2z 是与1z 不相关的,,,12x x x p L 的所有线性组合中方差最大者;……;z m 是与,121z z z m −L都不相关的,,,12x x x p L 所有线性组合中方差最大者,则新变量,12z z z m L分别称为原变量,,,12x x x p L 的第一,第二,……第M 主成分。

从以上的分析可以看出,主成分分析的实质就是确定原来变量(1,2,,)x jp j =L 在诸主成分(1,2,)z i m i =L 上的系数(1,2; 1,2)l i m j p ij ==L L 。

从数学上可以证明,它们分别是p 个原始变量(,,,)12x x x p L 相关矩阵的前m 个具有较大特征值所对应得特征向量,而各个综合变量Z i的方差()Var Z i 恰好是相应的特征根i λ。

各主成分的方差贡献率大小按特征根顺序排列,是依次递减的,即:012p λλλ≥≥≥≥L 。

本文的整个计算求解过程采用SPSS 统计分析软件来进行。

3. 指标确定我们根据选取的指标要能够客观、系统地反映一个地区经济发展水平的原则,并根据数据获取情况,另外结合所研究的具体问题,本文选择反映经济情况的8项主要指标:地区生产总值(1X ),居民消费水平(2X ),基本建设投资(3X ),职工平均工资(4X ),居民消费价格指数(X),商品零售价格指数(6X),货物周转量(7X),工业总产值(8X)。

指标数值均来自2006 5年中国统计年鉴及相应整理数据[6]。

将数据进行标准化处理,如附表所示,利用SPSS软件进行主成分分析,得出方差解释表,见表1。

表1 方差解释表Tab.1 variance explained table由表1可以看出,前3个特征值的累积贡献率已达到85.928%,这说明用前3个因子来反映事物的信息占全部信息的85.928%以上,于是,取前3个因子作为主成分,碎石图的分析结果也说明了这一点。

图1 碎石图Fig1 Scree Plot图1是分析结果碎石图(Scree Plot),明显的拐点为3,可以得出保留前3个因子将能概括大部分信息,前3个因子贡献占总方差的本例为85.918%,说明提取前3个公共因子是比较合适的。

表2 主成分载荷矩阵Tab.2 Component Matrix从图2可以看出,地区生产总值和工业总产值在第一主成分上的载荷较大,即与第一主成分的相关系数较高;基本建设投资在第二主成分上的载荷较大,即与第二主成分相关程度较高;消费价格指数在第三主成分上的载荷较大,即与第三主成分相关程度较高。

因此可将主成分命名如下:第一主成分:产出主成分; 第二主成分:建设投资主成分; 第三主成分:消费价格主成分。

表3 主成分得分系数矩阵Tab.3 Component Score Coefficient Matrix根据该表以及变量的观测值可计算因子得分,主成分得分系数矩阵的数值是主成分载荷除以相应的特征根得到的结果。

到目前为止,通过主成分分析法,将8个评价指标转化为了具有典型经济涵义的3个综合评价指标。

4. 经济发展水平的综合分析和评价为了考察每个城市,并对它们进行分析评价,采用回归方法将三个主成分表示成八个指标的线性组合,即得分函数:L0.2180.221Z=+L0.2320.2262Z=+0.1613Z=−上式可看作进城市经济发展评价模型,将31个省市标准化后的数据代入上三式,便得到各城市的得分,见表4。

表4 主成分得分表Tab.4 scores Table应说明一点的是,某城市的主成分因子得分为负数,这是因为在计算时对原始数据作了标准化处理,把各经济指标的平均水平当作零来处理的缘故。

因此,某城市的主成分因子得分为负数,只表明该城市的经济发展水平在全国31个省市的平均发展水平之下。

将Z1、Z2、Z3得分绘制在三维坐标系中,如图2,由载荷阵及Z1、Z2、Z3表达式可以看出,Z1、Z2、Z3越大所代表的综合能力越大。

图2 各城市主成分因子得分散布图Fig2 Score spread map根据图2可以看出,位于正中间上方的是广东省,其生产总值、基本投资建设和消费水平相对来说都比较高;而位于正中间下方的是西藏省,其消费水平与全国的平均消费水平不相上下,但其生产总值和基本投资建设却低于全国平均水平;位于左上角的城市是生产总值和基本建设投资都很高的城市,如:江苏、和山东;位于右上角的城市是生产总值和消费水平都很高的城市,如:上海、北京和天津。

结合生产总值、基本建设投资和消费水平三方面,可对我国地区经济发展做出如下评价:31个省市大体上可分为7个类别,广东属一类,它位于图2正上方,说明该地区的生产总值、基本建设投资以及消费水平都很高,是投资者首选的黄金地带;江苏和山东属一类,位于图2的左上角,是生产总值和基本建设投资相对较高而其消费水平相对来说不高的省市;河北、河南和辽宁属一类,其生产总值与我国的平均生产总值不相上下但其基本投资建设费用比较高,说明这三个省的基本建设正在逐步完善;浙江属一类,其生产总值比河北、河南和辽宁高,但其基本建设投资和消费与这三个城市不相上下;上海、北京和天津基本属于一类,该地区的生产总值高而且消费水平相对来说也比较高,但其基本建设投资相对来说较低,说明这三个城市的基本建设比较完善;海南、贵州、青海、甘肃、新疆、宁夏和西藏属一类,这几个省市的消费水平基本与我国平均消费水平持平但其生产总值远远落后于我国的平均生产总值,而其基本建设投资却高于我国基本建设投资的平均水平,说明国家比较重视这几个省市的经济发展;其他地区属于一类。

需要说明的是,本文对全国31个省市的评价是一种比较分析评价,方便读者的对比。

相关主题