年某些地区各行业工资水平的分析————————————————————————————————作者:————————————————————————————————日期:22009年某些地区各行业工资水平的分析1、研究背景及意义1.1研究背景工资水平是指一定区域和一定时间内劳动者平均收入的高低程度。
生产决定分配,只有经济发展才能提供更多的可分配的社会产品,因此一个地区的工资水平在一定程度上反映了其经济发展的水平。
工资水平的影响因素包括地域的影响。
企业所在的地区对企业的工资水平有相当大的影响,顺应这种大环境的要求才不会引起员工的异议。
一般企业在确定其工资水平时,都应该对本地区的工资水平进行调查,以便对相关的工资环境有一个大概的了解。
1.2研究意义1、通过多元统计分析方法,研究一个地区的工资水平与其经济发展水平的内在联系。
2、将平均工资划分为3类,分析哪些地区、哪些行业的工资水平较高,可为员工和企业提供宏观上的指引。
2、数据描述本数据集象征性地抽取全国15个省市(北京、天津、河北、山西、辽宁、吉林、上海、江苏、浙江、安徽、福建、江西、湖南、广东、海南)的工资状况,各省市分别记录了其9个主要行业(企业、机关、农林牧渔业、采矿业、制造业、建筑业、计算机软件业、批发零售业、住宿餐饮业)的平均工资水平,具体参见下图:3、分析方法3.1通过描述统计分析方法,判断哪些行业平均工资水平较高通过比较不同行业(如企业、机关、建筑业、制造业······)的均值、标准差、极大值、极小值,可以从总体上判断哪些行业的工资水平比较高,哪些行业的较低。
3.2通过系统聚类分析方法,判断哪些地区平均工资水平较高通过对不同地区进行聚类,使具有相似特征(亲疏程度高)的地区聚集在一起,使差异性大的地区分离开来,有助于合理地分析地域工资水平的情况。
4、输出结果分析4.1描述统计结果分析1、由表1分析统计量的输出结果可知:平均工资水平较高的三个行业分别是:计算机软件业(55777.2元)、机关(43972.53元)、采矿业(39323.93元);平均工资水平较低的三个行业分别是:农林牧渔业(20035.47元)、住宿餐饮业(20619.67元)、制造业(27943.33元)。
在9个行业中,极大值最大的是计算机软件业(105413元),极小值最小的是农林牧渔业(8841元)。
Descriptive StatisticsN Minimum Maximum Mean Std. Deviation企业15 22000 62046 3.33E4 11642.301机关15 26668 74734 4.40E4 17047.500农林牧渔业15 8841 45925 2.00E4 10432.601采矿业15 22846 66138 3.93E4 12600.091制造业15 21242 48207 2.79E4 7662.814建筑业15 19519 69131 2.96E4 13359.351计算机软件业15 27753 105413 5.58E4 23372.698批发零售业15 16263 60260 2.99E4 12801.976住宿餐饮业15 13577 38040 2.06E4 6566.173Valid N (listwise) 154.2系统聚类结果分析1、表2数据中给出了样本处理的基本信息,包括样本总数、含有缺失值的样本数以及百分比等。
Case Processing Summary aCasesValid Missing Total N Percent N Percent N Percent15 83.3% 3 16.7% 18 100.0%a. Squared Euclidean Distance used2、表3显示的是用欧式距离平方计算的近似矩阵表,其中的数值表示各个样本之间的相似系数,数值越大表示两样本距离越大。
Proximity MatrixCaseSquared Euclidean Dista 1:北京2:天津3:河北4:山西5:辽宁6:吉林7:上海8:江苏1:北京.000 .756 3.452 3.773 2.598 3.896 .873 1.666 2:天津.756 .000 1.766 1.842 1.340 1.994 1.985 .540 3:河北 3.452 1.766 .000 .077 .162 .124 6.936 .657 4:山西 3.773 1.842 .077 .000 .349 .123 7.184 .831 5:辽宁 2.598 1.340 .162 .349 .000 .212 5.817 .369 6:吉林 3.896 1.994 .124 .123 .212 .000 7.476 .785 7:上海.873 1.985 6.936 7.184 5.817 7.476 .000 4.185 8:江苏 1.666 .540 .657 .831 .369 .785 4.185 .000 9:浙江 1.634 .720 1.579 1.679 1.101 1.600 3.719 .402 10:安徽 2.959 1.353 .093 .119 .213 .202 6.105 .518 11:福建 2.832 1.313 .371 .428 .203 .296 5.900 .340 12:江西 4.363 2.289 .275 .224 .362 .063 8.021 .942 13:湖南 3.683 1.912 .299 .306 .226 .084 7.128 .718 14:广东 1.577 .685 .518 .726 .220 .677 4.262 .064 15:海南 3.534 1.863 .153 .282 .142 .180 7.046 .583 This is a dissimilarity matrix3、表4显示的是聚类表,该表反映的是每一个阶段聚类的结果,实际上就是聚类过程,系数(Coefficients)表示的是“聚合系数”,第2列和第3列表示的是聚合的类。
聚类进程中系数逐渐变大,结果时类与类差异较大。
Agglomeration ScheduleStageCluster CombinedCoefficientsStage Cluster First AppearsNext Stage Cluster 1 Cluster 2 Cluster 1 Cluster 21 12 13 .051 0 0 32 8 14 .064 0 0 103 6 12 .074 0 1 84 3 4 .077 0 0 55 3 10 .106 4 0 96 11 15 .139 0 0 77 5 11 .173 0 6 88 5 6 .229 7 3 99 3 5 .279 5 8 1310 8 9 .471 2 0 1111 2 8 .648 0 10 1312 1 7 .873 0 0 1413 2 3 1.065 11 9 1414 1 2 4.326 12 13 04、表5显示的是冰柱图,横轴:案例(Case)表示被聚类的对象,纵轴:群集数(Number of clusters)表示被聚成几类,两样本之间的“x”表示将其两边的样本联结起来聚成新类。
根据将样本设成5类的设定,由图可知:湖南、江西、吉林、海南、福建、辽宁、安徽、山西、河北聚为一类,浙江、广东、江苏聚为一类,天津为一类,上海为一类,北京为一类,其他同理。
VerticalIcicleNumber ofclusters Case13:湖南12:江西6:吉林15:海南11:福建5:辽宁10:安徽41 X X X X X X X X X X X X X X X2 X X X X X X X X X X X X X X X3 X X X X X X X X X X X X X X X4 X X X X X X X X X X X X X X X5 X X X X X X X X X X X X X X X6 X X X X X X X X X X X X X X X7 X X X X X X X X X X X X X X8 X X X X X X X X X X X X X9 X X X X X X X X X X X X10 X X X X X X X X X X X11 X X X X X X X X X X12 X X X X X X X X X X13 X X X X X X X X X14 X X X X X X X X X 5、图6是用组间连接聚类生成的树状聚类图。
如图可知第1类包括上海、北京,第2类包括天津、浙江、广东、江苏,第3类包括安徽、山西、河北、辽宁、海南、福建、吉林、湖南、江西。
* * * * * * * * * * * * * * * * * * * H I E R A R C H I C A L C L U S T E RA N A L Y S I S * * * * * * * * * * * * * * * * * * *Dendrogram using Average Linkage (Between Groups)Rescaled Distance Cluster CombineC A S E 0 5 10 15 20 25Label Num +---------+---------+---------+---------+---------+江西 12 ─┐湖南 13 ─┼─┐吉林 6 ─┘│福建 11 ─┐│海南 15 ─┼─┼───────┐辽宁 5 ─┘││河北 3 ─┐││山西 4 ─┼─┘├─────────────────────────────────────┐安徽 10 ─┘││江苏 8 ─┬───┐││广东 14 ─┘├─┐││浙江 9 ─────┘├───┘│天津 2 ───────┘│北京 1 ─────────┬───────────────────────────────────────┘上海 7 ─────────┘5、结论与分析结论1:不同行业平均水平工资的比较平均工资水平较高的三个行业分别是:1、计算机软件业(55777.2元)2、机关(43972.53元)3、采矿业(39323.93元)平均工资水平较低的三个行业分别是:1、农林牧渔业(20035.47元)2、住宿餐饮业(20619.67元)3、制造业(27943.33元)结论2:不同地区平均工资水平的比较根据系统聚类将所有样本分成三类,第1类包括上海、北京,第2类包括天津、浙江、广东、江苏,第3类包括安徽、山西、河北、辽宁、海南、福建、吉林、湖南、江西。