我国各省市的就业影响因素分析 摘要:就业问题是一个影响国家民生的重要问题,就业问题牵涉广泛,影响深远。近年来,我国高校毕业生数量逐年增多,大学生面临严峻的就业形势,加之09年全球金融危机的影响,就业形势至今仍处于紧张的状况。面对即将就业的大学生,选择一个好的城市就业发展比较关键。因此必须对就业问题进行全面深入分析。本文研究我国各省市就业影响因素,通过对就业相关因素进行分析建立模型,分析我国各个省市的就业情况,并向当前大学生提出就业意见,从而提高我国的就业率。 关键词:就业形势 经济发展 主成分分析 因子分析 就业城市选择 引言 我国的经济一直在飞速发展,可是在经济发展的背后却存在着许多重大的问题,就业问题就是其中一个不容忽视的问题,其已成为各国面临和关注的一个焦点。对于就业压力日益严峻的中国市场来说,积极扩大就业,降低社会失业率,是近年来我国政府宏观调控的主要目标之一。作为一个特殊的群体,大学生的就业将遭遇多方面的挑战和挤压,在整群环境担忧的情况下,应届毕业生在就业过程中或许将不得不面对残酷的现实。 大学生就业难已不是一个新问题,每年全国都会有几百万的大学生毕业,但是仍然会有百分之十几的应届大学生找不到工作。从目前高校对大学生的就业状况统计看,大学生就业前途仍旧不容乐观。受2009年金融危机的影响,带来的工作岗位的减少,大量员工失业。目前形势虽然有所缓和,但是对于没有社会经验的应届毕业生来说,就业形势紧张的现状似乎仍然无法避免。根据现状调查了解很多大学生比较喜欢到北京、上海、广东这些一线城市就业发展,然而对于就业最好的城市的选择是不是真是如此呢?这就需要我们根据表格中的数据,分析各省市的就业形势,建立数学模型对大学生就业给出指导性建议。 我们知道就业的影响因素是多方面的,有国民收入、工业总产值、农业总产值、总人口数、固定资产投资、财政收入、就业人口数、失业人口数、城镇单位就业人员平均工资等。利用《2011年统计年鉴》查找最新相关数据,利用SPSS软件分别对各个因素进行了主成分分析和因子分析,进而从数据分析中了解各个省市的就业发展现状。
一、主成分分析 在数据处理中,经常会遇到高维数据组,由于数据维数过高,则变量较多,而且变量间往往存在相关关系,因此很难直接抓住他们的主要信息,这就需要有一种简化数据的方法,是高维数据降维,来获得主要的信息,而且在低维空间将信息分解为互不相关的部分以获得更有意义的解释。主成分分析就是这样一种处理高维数据的方法,它通过投影的方法,将高维数据尽可能少的信息损失为原则进行综合化为少数几个不相关变量。本文研究的是更省市的就业问题,其中包含了九个影响就业的因素变量,通过主成分分析得出几个主要影响就业的因素,从而对其进行分析解释。 ⑴ 利用因子分析结果进行主成分分析,得出特征根与方差贡献率为:
Total Variance Explained
Component
Initial Eigenvalues Extraction Sums of Squared Loadings
Total % of Variance Cumulative % Total % of Variance Cumulative %
1 6.148 68.315 68.315 6.148 68.315 68.315 2 1.717 19.073 87.388 1.717 19.073 87.388 3 .586 6.512 93.901 4 .260 2.884 96.785 5 .180 2.004 98.789 6 .071 .793 99.582 7 .018 .205 99.787 8 .011 .125 99.912 9 .008 .088 100.000 根据上表可知,本文共提取两个公因子,累计方差贡献率高达87.388%,说明了这两个因子能够充分体现就业的主要影响因素。 利用因子分析结果进行主成分分析,得出两个公因子的载荷矩阵为:
Component Matrix
Component 1 2 国民收入 .949 .277 工业总产值 .892 .370 农业总产值 .837 -.405 总人口数 .949 -.212 固定资产投资 .949 -.030 财政收入 .806 .558 就业人口数 .924 -.215 失业人口数逆指标 -.659 .257 城镇单位就业人员平均工资 -.113 .933
⑵计算特征向量矩阵:令a1为第一个公因子的因子载荷,a2为第二个公因子的因子载荷,运用公式Zi=ai/SQRT(λi)得出特征向量矩阵: z1 z2 国民收入(x1) 0.38 0.21 工业总产值(x2) 0.36 0.28 农业总产值(x3) 0.34 -0.31 总人口数(x4) 0.38 -0.16 固定资产投资(x5) 0.38 -0.23 财政收入(x6) 0.33 0.43 就业人口数(x7) 0.37 -0.16 失业人员数(x8) -0.27 0.20 城镇单位就业人员平均工资(x9) -0.05 0.71 由表可得到主成分的表达式为: Y1=0.38x1+0.36x2+0.34x3+0.38x4+0.38x5+0.33x6+0.37x7-0.27x8-0.05x9 Y2=0.21x1+0.28x2-0.31x3-0.16x4-0.23x5+0.43x6-0.16x7+0.20x8+0.71x9 (3)计算主成分: 运用Compute命令,对标准化的数据进行主成分计算,得出因子得分为: 地区 Y1得分 Y2得分 综合得分 综合排名 北 京 10002.61 51364.49 19032.28 11 天 津 8962.96 40705.67 15892.68 15 河 北 24585.35 26840.73 25077.72 6 山 西 10386.47 26270.70 13854.14 18 内蒙古 11104.84 27327.89 14646.48 16 辽 宁 21529.42 29221.23 23208.61 8 吉 林 9775.60 22241.28 12496.97 22 黑龙江 10437.09 21238.33 12795.09 21 上 海 15348.81 56242.78 24276.33 7 江 苏 49008.83 45873.88 48324.45 2 浙 江 28186.57 39067.95 30562.07 4 安 徽 16062.76 25213.93 18060.54 12 福 建 14734.67 27088.95 17431.72 14 江 西 10829.89 20854.26 13018.30 20 山 东 47249.74 37585.51 45139.96 3 河 南 28629.67 25121.80 27863.87 5 湖 北 17899.35 26051.34 19679.00 10 湖 南 16460.36 22787.96 17841.73 13 广 东 50076.22 49508.05 49952.18 1 广 西 10502.53 22556.74 13134.07 19 海 南 838.69 22085.90 5477.14 31 重 庆 8319.22 25920.24 12161.68 23 四 川 20942.39 25492.97 21935.82 9 贵 州 5027.71 21770.49 8682.81 26 云 南 8516.77 21227.02 11291.53 24 西 藏 -1907.77 35362.23 6228.61 28 陕 西 11031.82 25484.25 14186.92 17 甘 肃 4635.35 21201.26 8251.84 27 青 海 -81.14 25915.66 5594.19 30 宁 夏 331.74 26667.95 6081.17 29 新 疆 5076.13 23569.19 9113.33 25 根据图表综合排名可以看出,就业最好的城市前五名分别为广东(49952.18)、江苏(48324.45)、山东(45139.96)、浙江(30562.07)、河南(27863.87),虽然在综合得分排名上看上海排第七名,北京排第十一名。但是,从第二主成分得分情况看,上海得分为56242.78,北京得分为51364.49,不亚于综合得分排名第一的广东(49508.05),其中天津也可以算得上名列前茅。无可置疑,贵州、甘肃、西藏、宁夏、青海、海南相对来说是就业情况最差的几个城市。
二、因子分析 因子分析同主成分分析一样,也是一种简化和分析数据的方法。这种方法又不同于主成分分析,他把每个变量分解为两部分因素,一部分是由这些变量内含的共同因素所构成的,即所谓公共因素部分,另一部分是每个变量各自独有的因素,即所谓独特部分或单一因素部分。因子分析关注的是找出这些公共的因子,利用少数的公共因子的线性函数与独特因素之和来解释原来的观测变量,并对这些公共因子的实际意义进行解释,而不是按分解的方差贡献率来决定因子,这是和主成分分析的一个很大的差别。 (1)根据因子分析结果,得出原始变量的共同度:
Communalities
Initial Extraction 国民收入 1.000 .976 工业总产值 1.000 .932 农业总产值 1.000 .865 总人口数 1.000 .946 固定资产投资 1.000 .901