实证分析
本文的目的在于测量受教育程度和工作年限对居民收入的影响。
文章选取了中国社会科学院经济研究所收入分配课题组(李实、赵人伟老师主持,福特基金赞助)于2002年对城镇居民所作的抽样数据,该数据覆盖22个省(市、自治区),调查了6835户城镇家庭,涉及20632位城镇居民。
该调查的优点是样本容量大,而且对城乡居民和农民工的基本信息和工作单位、工作年限以及工资详细组成都进行了调查,因而数据的选取有助于这个问题的研究。
因为文章的研究与收入有关,经过对未参加工作和已经下岗或退休的个体进行筛选,最后剩下10174个样本数据,样本容量之大及覆盖面之广足以保证研究所具有的代表性。
通过对主要变量进行统计分析,得到下表:
其中低收入是指收入按由小到大排序是,最低20%收入的人口数;中低收入处于由低到高的是20%—40%的人口数;中等收入是处于由低到高的是40%—60%的人口数;中高收入是处于由低到高的是60%—80%的人口数;其余统计到最高收入。
由此图可以看出,按照收入等距离分组时,处于高收入组的人口最多,占到人口总数的35.5%。
由此图可看出受教育年限主要集中在5年到15年之间,因而2002年底参加工作的城镇居民中,学历主要分布在初中和高中两个阶段。
因问卷中针对2002年底就业(在岗)成员统计一个问题是第一次参加工作时间。
根据这个时间可以计算出到2002年底,个体参加工作的年限。
由上表所知,城镇居民工作年限主要集中早12到36年之间。
为了测度多种因素共同作用下对城镇居民收入的影响,这里构建了多元线性回归模型,具体模型表示为:INC=F (E,YJ,Z )。
其中INC 表示城镇居民年收入,YJ 表示城镇居民的工作年限,Z 表示一系列的控制变量。
Z 是通过设置虚拟变量来反映,主要包括性别、年龄、工作单位性质、职业和地区变量。
依据相关数据,利用stata 软件进行运算,得到的回归结果如下:
上表为进行多元回归的结果。
表中age 表示个体的年龄,age2表示年龄的平方,用来反映与收入的非线性关系;gender 表示相别的虚拟变量,当gender 取1的时候表示的是男性,
Number of obs 10049F( 95, 9953)71.36
Prob > F 0R-squared
0.4052Adj R-squared 0.3995
取0表示女性;type_unit表示工作单位性质,其中0表示政府,取1表示企业,取2表示事业单位,取3表示其他。
从结果中可以看出,模型整体显著,拟合优度为40%,模型的拟合程度不算太好。