当前位置:文档之家› 基于全国城镇居民平均每人全年家庭收入来源的统计分析汇总

基于全国城镇居民平均每人全年家庭收入来源的统计分析汇总

基于全国城镇居民平均每人全年家庭收入来源的统计分析摘要本文采用2012年中国省会城市和城镇居民家庭收入来源的统计数据,首先运用各收入来源对家庭可支配收入进行回归分析,然后运用逐步回归法分析工资性收入、经营净收入、财产性收入和转移性收入对可支配收入的显著性关系;然后利用聚类分析对各城市进行分类;最后利用因子分析对各地区进行因子分析,通过计算综合得分,获得各地区综合排名,关键词可支配收入;聚类分析;回归分析;因子分析。

1、研究背景及目的改革开放以来,我国的国民经济增长迅速,居民的收入水平也大幅提高,但居民收入分配差距也在不断扩大。

虽然随着世界范围的经济危机的衰亡,但是经济危机的影响依然存在,各行业各业都在面临了巨大的压力下缓解了过来,从而也深深地影响了我国城镇居民的收入来源。

随着社会的进步和经济的快速发展,我国居民的收入方式已经变得丰富起来,包括工资性收入、经营净收入、财产性收入及转移性收入等多种收入方式,因此,分析我国居民的收入来源变得犹为重要。

本研究目的如下:通过对我国各省城镇居民收入来源的分析,一方面了解我国各省的主要经济结构,另一方面确定各省的收入形式,为国家制定政策提供依据。

2、研究方法为了研究我国各省城镇居民的收入来源的构成,我们采用了工资性收入、经营净收入、财产性收入、转移性收入、总收入和可支配收入等六大指标。

本研究采用的数据是《分地区城镇居民平均每人全年家庭收入来源》,数据摘自《中国统计年鉴2013》11-14。

本数据分析主要采用的研究方法有聚类分析,回归分析和因子分析。

基恩思路是:首先利用饼图和条形图得出全国的平均收入构成分布比例及各省的品均可支配收入情况;然后运用聚类分析对各省的收入构成情况进行分类;然后运用回归分析研究各收入来源对可支配收入的显著性;最后运用因子分析对各个城市提取公因子,根据提取出的公因子对各个城市进行排名。

3、实证分析由于从国家统计局网站下载的数据为EXCEL格式,可以将数据导入成SPSS数据,共设置了6个变量,分别是“可支配收入”、“总收入”、“工资性收入”、“财产性收入”、“转移性收入”。

样本是中国2012年分地区城镇居民平均每人全年家庭收入来源的统计数据。

见附表3.1简单的统计图形图1可以看出在所有的的收入来源中,工资性收入占主导地位,转移性收入次之,说明我国家庭的收入来源主要靠就业工资,但是国家的补贴仍然处于重要地位,说明我国居民仍有部分处于失业、待就业状态,国家的扶持让他们能继续维持生计。

图2是我国城镇家庭平均可支配收入的比较,通过图形我们可以看出在各个城市的对比中上海处于领先地位,说明上海地区在我国处于比较重要的地位,经济比较发达,人民生活水平比较高。

3.2回归分析以“可支配收入”为被解释变量,以“工资性收入”、“经营净收入”、“财产性收入”和“转移性收入”为解释变量,进行多元回归,采用逐步回归法。

得到的图3至图5所示图3模型汇总e模型R R 方调整 R 方标准估计的误差Durbin-Watson1 .951a.904 .901 1809.7323043653507002 .980b.961 .958 1177.1601029639965003 .998c.996 .995 388.4602003600063004 .999d.997 .997 335.1407269520137001.853a. 预测变量: (常量), 工资性收入。

b. 预测变量: (常量), 工资性收入, 转移性收入。

c. 预测变量: (常量), 工资性收入, 转移性收入, 经营净收入。

d. 预测变量: (常量), 工资性收入, 转移性收入, 经营净收入, 财产性收入。

e. 因变量: 可支配收入综上所述,我们可以得到:(1)最终模型表达式为:可支配收入=724.066+0.852*工资性收入+0.91*转移性收入+1.056*经营净收入+0.826*财产性收入(2)最终模型拟合度较好,R²=0.997比较接近于1。

(3)模型中自变量的系数的显著性p都小于0.05,回归方程的线性关系显著。

(4)通过逐步回归也间接的表明收入的来源重要性排名上,“工资性收入”占主导地位,“转移性收入”次之,“财产性收入”最少,与饼图的分析结果相同。

(5)分析结论:通过以上分析,可以发现可支配收入与“工资性收入”、“转移性收入”、“经营净收入”和“财产性收入”都有显著关系。

残差-582.714599609375000 494.252380371093750-.000000000006718312.77227030748760032标准残差-1.739 1.475 .000 .933 32a. 因变量: 可支配收入图6为残差统计表,可以看出预测值及标准化的预测值、残差及残差预测值的最小值、最大值、均值、标准差和样本数。

这些数据中无离群值,可以认为模型是健康的。

除了分析残差统计外,还可以直接做出标准残差的直方图和正态P-P图来观察其是否服从正态分布。

通过图7和图8可以看出残差具有正态分布趋势,因此可以认为回归模型是恰当的。

图7图8图9通过图9的序列图还可以看出,标化残差均在0上下波动,且波动范围没有超过±2,没有发现明显方差不齐或者比较异常的点。

说明模型拟合比较合理。

3.3聚类分析图10图113 河北 3 1318.6934 山西 3 1270.9645 内蒙古 3 2864.1986 辽宁 3 2633.0827 吉林 3 744.2718 黑龙江 3 2557.8049 上海 1 1632.79110 江苏 2 1646.03111 浙江 2 2956.69112 安徽 3 865.85913 福建 2 2064.32214 江西 3 870.52115 山东 2 2858.50216 河南 3 797.84517 湖北 3 684.35918 湖南 3 1501.63219 广东 2 3101.05320 广西 3 669.98621 海南 3 785.20422 重庆 3 1754.07723 四川 3 188.75124 贵州 3 1903.60925 云南 3 775.33126 西藏 3 5369.43627 陕西 3 1805.79328 甘肃 3 2076.16829 青海 3 1865.08930 宁夏 3 685.89831 新疆 3 1523.997通过图10和图11可以把全国分成三类,北京和上海为第一类,天津、江苏、浙江、福建、山东和广东为第二类,其余的为第三类。

通过聚类,把全国的各省份分成三类,有利于中央做决策,避免对每个省分别作决策,把相似的省份放在一起进行经济分析、比较更能说明问题,不同的省份放在一个类中进行比较,避免经济较弱的城市与较强的城市比较,做无用功。

3.4因子分析我们已经通过回归分析和聚类分析对影响可支配收入的收入来源方式进行了回归分析获知各种影响指标,以及影响程度和方向,又运用了聚类分析对各个城市进行了分类,但是由于各种变量的多重共线性问题,不太利于具体经济意义解释,因此我们可以利用因子分析对构成收入来源的各个变量提取公因子,对数据进行降维处理。

首先利用主菜单分析中的降维工具条进行因子分析。

在处理过程中,将“工资性收入”、“转移性收入”、“经营净收入”和“财产性收入”选入变量列表中。

接着在相应的按钮中选中输出相关系数矩阵和KMO和Bartlett的球形度检验的复选框,并且设置特征根大于1为提取公因子的要求,利用最大方差法进行因子旋转,最后保存因子得分变量,并显示因子得分系数矩阵,输出结果见图12至图17。

(1)KMO 和 Bartlett 的检验,如图12所示,KMO的取值为0.557,表明变量间有较强的相关性,数据很适合做因子分析。

Bartlett检验的Sig.值为0.000,说明数据来自正态总体,适合进一步分析。

图12KMO 和 Bartlett 的检验取样足够度的 Kaiser-Meyer-Olkin 度量。

.557Bartlett 的球形度检验近似卡方46.283 df 6 Sig. .000(2)变量共同度,指的是按照所选标准提取相应数量主成分后,各变量中信息分别被提取的比例。

如图13所示,所有变量共同度都在80%以上,所以提取这几个公因子对各变量的解释力还可以。

图13公因子方差初始提取工资性收入 1.000 .836经营净收入 1.000 .842财产性收入 1.000 .864转移性收入 1.000 .846提取方法:主成份分析。

(3)解释的总方差,由图14中可以看出,“初始特征值”一栏显示前两个特征值大于1,所以只选取了前两个公因子;“提取平方和载入”一栏显示第一公因子的方差贡献率是56.905%,前两个公因子的方差总和占所有主成分方差的87.711%,可见选取前两个因子已足够替代原来的变量。

图14(4)碎石图,是按照特征根大小排列的主成分散点图。

如图3所示,我们可以看到有三个成分的特征值超过1。

(4)碎石图,是按照特征根大小排列的主成分散点图。

如图3所示,我们可以看到有三个成分的特征值超过1。

图15(4)碎石图,是按照特征根大小排列的主成分散点图。

如图15所示,我们可以看到有两个成分的特征值超过1。

(5)成分矩阵,如图16可见,在所有变量中的因子得分并不高,因此有必要进行因子旋转。

我们利用最大方差法进行因子旋转得到的旋转成分矩阵如图16所示。

图16旋转成份矩阵a成份1 2经营净收入.912 .102财产性收入.904 .216转移性收入.067 .917工资性收入.264 .875提取方法 :主成份。

旋转法 :具有 Kaiser 标准化的正交旋转法。

a. 旋转在 3 次迭代后收敛。

这样每个因子就很明确了。

经营净收入和财产性收入归为第一类,可命名为不确定收入;转移性收入和工资性收入归为第二类,命名为确定收入。

图17成份得分系数矩阵成份1 2工资性收入-.027 .535经营净收入.576 -.140财产性收入.545 -.060转移性收入-.167 .609提取方法 :主成份。

旋转法 :具有 Kaiser 标准化的正交旋转法。

构成得分。

通过图17,可以得出F1=-0.027*工资性收入+0.576*经营净收入+0.545*财产性收入+-0.167*转移性收入。

同时F2计算方法同样如此。

图18成份得分协方差矩阵成份 1 23.5因子分析后续分析当我们得到个城市的因子得分后就可以对各个城市分类排序。

我们可以利用计算变量和排序来进行各城市的经济综合得分计算和排序,具体操作步骤如下:【1】打开数据文件,依次单击“转换”→“计算变量”命令,弹出如图4所示的对话框。

图19在“目标变量”一栏中输入“综合得分”,这一变量将最终代表各个城市的综合经济实力。

相关主题