当前位置:文档之家› 工资及其主要影响因素分析概要

工资及其主要影响因素分析概要

上海大学2013 ~2014 学年冬季学期研究生课程论文课程名称:高级计量经济学课程编号: 01SAQ9004 论文题目: 工资及其主要影响因素分析作者姓名: 李腾龙学号: ******** 成绩: 论文评语:评阅人:评阅日期:工资及其主要影响因素分析摘要:本文目的在于分析相关人员的教育、工作经验、任期、性别、婚姻等因素对其工资的影响,从而可以为企业根据员工的相关背景开具工资提供参考依据。

同时,更重要的是,通过本次的建模学习过程,使自己更加深入地学习了计量经济学的相关知识,拥有了计量经济学的实证分析经验,并且还初步掌握了相关软件的使用方法。

关键词:工资、虚拟变量、最小二乘回归、异方差检验、SAS软件一、引言亚当.斯密《国富论》中说:“一国国民每年的劳动,本来就是供给他们每年消费的一切生活必需品和便利的源泉。

”一个劳动者的工资,要用来养家糊口,因此对于它的研究至关重要。

职工工资的增长逐渐成为一个热点话题,在百度中输入“职工工资”,你会得到非常多相关报道,工资协商制、工资拖欠、工资保障机制也成为学术界人士争相研究的焦点。

而也是随着职工工资的增长,其他的一些问题,诸如个税征收、社会保障机制改革等接踵而来。

因此,研究好职工工资的影响因素,对于预测工资走向,安排生产生活,体制改革等有积极意义。

影响工资的因素有很多,在此我们主要选教育年限、经验、任期、性别、婚姻等因素来研究,从该研究中发现更深层次的原因,这就是本问研究的主要目的。

二、背景知识1.虚拟变量定心信息通常是以二值信息的形式出现:一个人是男还是女;一个人是已婚还是未婚;这些信息可以通过定义一个二值变量或0-1变量来刻画。

在计量经济学中,二值变量通常称为虚拟变量。

2.多重共线性在多元线性回归模型经典假设中,其重要假定之一是回归模型的解释变量之间不存在线性关系,也就是说,解释变量中的任何一个都不能是其他解释变量的线性组合。

如果违背这一假定,即线性回归模型中某一个解释变量与其他解释变量间存在线性关系,就称线性回归模型中存在多重共线性。

多重共线性违背了解释变量间不相关的古典假设,将给普通最小二乘法带来严重后果。

多重共线性的解决方法有:1.保留重要解释变量,去掉次要或可替代解释变量;2.用相对数变量替代绝对数变量;3.差分法;4.逐步回归分析;5.主成份分析;6.偏最小二乘回归;7.岭回归;8.增加样本容量。

3.异方差性异方差性(heteroscedasticity )是相对于同方差而言的。

所谓同方差,是为了保证回归参数估计量具有良好的统计性质,经典线性回归模型的一个重要假定:总体回归函数中的随机误差项满足同方差性,即它们都有相同的方差。

如果这一假定不满足,即:随机误差项具有不同的方差,则称线性回归模型存在异方差性。

若线性回归模型存在异方差性,则用传统的最小二乘法估计模型,得到的参数估计量不是有效估计量,甚至也不是渐近有效的估计量;此时也无法对模型参数的进行有关显著性检验。

对存在异方差性的模型可以采用加权最小二乘法进行估计。

异方差性的检测——White test在此检测中,原假设为:回归方程的随机误差满足同方差性。

对立假设为:回归方程的随机误差满足异方差性。

判断原则为:如果nR^2>chi^2 (k-1),则原假设就要被否定,即回归方程满足异方差性。

三、数据本文研究的数据来源于叶明确老师课堂中所使用的工资数据,共计526个样本数据。

本文选取了受教育年限(educ ),工作年限(exper ),任期(tenure ),性别(female ),婚姻(married )等因素作为自变量,研究其与工资之间的影响关系。

关于性别、婚姻等变量的量化,我们定义:性别:“female=1”表示女性,“female=0”表示男性; 婚姻:“married=1”表示已婚,“married=0”表示未婚; 得到数据样本如下:四、 分析1.建模参考经济学中的经典模型,本文我们也采用log(wage)作为因变量,建立最小二乘回归模型:εββββββ+⨯+⨯+⨯+⨯+⨯+=tenure er married female educ wage 543210exp )log(2.回归结果我们采用SAS 软件进行方程的回归,命令如下:proc reg data =ltl;model lwage=educ exper tenure female married;run;结果:我们看到,模型的拟合度约是40%,而模型的F检验值为70.83,是显著的。

但是,我们还发现,在95%置信度的标准下,exper的结果是不显著的,需要进一步修正。

2.相关系数矩阵为了检测变量间的多重共线性,我们检查变量间的相关系数,命令:proc corr data=ltl;var educ exper tenure female married;run;回归结果如下:我们发现,exper 与tenure 相关系数较高,married 与exper 和tenure 的相关系数都比较高。

从现实来讲,任期较长的工作人员,自然地工作经验较为丰富。

而工作时间较长的人,年龄相应地较大,已婚的可能性也较大。

所以很显然,我们的自变量自己存在多重共线性。

接下来我们对模型进行修正。

3.模型修正(多重共线性修正)第一步:log(wage)对单个自变量进行回归:1. εββ+⨯+educ 10=log(wage),得到2R =0.1858,参数统计显著;2. εββ+⨯+=er wage ex p )log(10,得到2R =0.0124,参数统计显著;3. εββ+⨯+=tenure )log(10wage ,得到2R =0.1060,参数统计显著;4. εββ+⨯+=emale wage f )log(10,得到2R =0.1396,参数统计显著;5. εββ+⨯+=m arried )log(10wage ,得到2R =0.0733,参数统计显著; 可看到,educ 的拟合优度最强,并且已被证明与其他变量的相关系数不强,所以选择educ 作为基本回归方程,第二步:将其余变量逐一引入:1. εβββ+⨯+⨯+er educ ex p =log(wage)210,得到2R =0.2493,且统计是显著的;2. εβββ+⨯+⨯+tenure educ 210=log(wage),得到2R =0.3085,且统计是显著的;3. εβββ+⨯+⨯+female educ 210=log(wage),得到2R =0.3002,且统计是显著的;4. εβββ+⨯+⨯+married educ 210=log(wage),得到2R =0.2442,且统计是显著的;我们得到,educ 和tenure 组合的拟合优度最强,且对模型参数影响不大。

第三步,继续引入变量:1. εββββ+⨯+⨯+⨯+er tenure educ ex p =log(wage)3210,得到2R =0.3160,模型的拟合度并没有明显提高,educ ,tenure 两个参数都是统计显著的,而exper 在1%显著性水平下是不显著的,在5%显著性水平下显著;; 2. εββββ+⨯+⨯+⨯+female tenure educ 3210=log(wage),得到2R =0.3828,参数统计显著;3. εββββ+⨯+⨯+⨯+married tenure educ 3210=log(wage),得到2R =0.3343,参数统计显著;我们得到,educ 、tenure 、female 组合的拟合优度最好,继续插入变量,第四步:1. εβββββ+⨯+⨯+⨯+⨯+er female tenure educ ex p =log(wage)43210,得到2R =39.23,educ ,tenure ,female 三个参数都是统计显著的,exper 在1%显著性水平下是不显著的,在5%显著性水平下显著;2. εβββββ+⨯+⨯+⨯+⨯+married female tenure educ 43210=log(wage),得到2R =0.3996,并且参数统计显著;所以,最终我们选取R 2最高,并且统计显著的模型,得到的初步模型为:εβββββ+⨯+⨯+⨯+⨯+married female tenure educ 43210=log(wage)回归结果如下:我们看到所有参数都是统计显著,并且模型F检验值为86.70,说明该回归模型也是显著的。

5.散点图我们利用SAS软件,做出log(wage)与educ、tenure之间的散点图:Proc sgplot data=ltl;scatter x=educ y=lwage;run;可以看到,log(wage) 与tenure之间线性关系不明显;从而我们引入变量tenure2来进一步优化模型:6.加入变量我们对比如下2个模型:εβββββ+⨯+⨯+⨯+⨯+=tenure married female educ wage 43210)log(:)1(εββββββ+⨯+⨯+⨯++⨯+⨯+=2543210)log(:)2(tenure tenure married female educ wage得到模型(2)结果如下:我们看到,与模型(1)相比,新的模型R 2有所提高,且在5%置信水平下,所有参数统计都显著,说明变量tenure 2的引入是合理的。

所以,最终我们确定了模型为:εββββββ+⨯+⨯+⨯++⨯+⨯+=2543210)log(tenure tenure married female educ wage200086113.004165.012691.028079.007871.054649.0)log(tenure tenure married female educ wage ⨯-⨯+⨯+⨯-⨯+=∧五、 模型检验1.经济意义检验我们看到受教育的系数为0.07871,为正数,表明其他条件不变的情况下,教育每增加一年,工资收入将增加7.8%;任期的系数为0.04165,为正数,表明其他条件不变的情况下,任期增加一年,工资收入将增加4.6%;虚拟变量married 的系数为0.12691,表明其他条件不变的情况下,总体上已婚员工的工资要大于未婚员工虚拟变量female 的系数为-0.28079,为负数,表明其他条件不变的情况下,总体上,男性的工资要比女性高[(0.54694-0. 28079)*100]%。

所以模型能通过经济意义上的检验。

2.统计检验(1)拟合优度:从回归结果中可以看到,4150.02=R ,调整后,消除解释变量对拟合优度的影影响,4094.0_2=R ,对于经济数据来说,模型的拟合度还不错;(2)F 检验:原假设为0:43210====ββββH ,给定显著性水平05.0=α,在F 分布表中查出自由度为k=4和n-k-1=521的临界值38.2)521,4(=αF 。

相关主题