当前位置：文档之家› 工资及其主要影响因素分析概要

工资及其主要影响因素分析概要

上海大学2013 ～2014 学年冬季学期研究生课程论文课程名称：高级计量经济学课程编号： 01SAQ9004 论文题目: 工资及其主要影响因素分析作者姓名: 李腾龙学号: ******** 成绩: 论文评语:评阅人:评阅日期:工资及其主要影响因素分析摘要：本文目的在于分析相关人员的教育、工作经验、任期、性别、婚姻等因素对其工资的影响，从而可以为企业根据员工的相关背景开具工资提供参考依据。

同时，更重要的是，通过本次的建模学习过程，使自己更加深入地学习了计量经济学的相关知识，拥有了计量经济学的实证分析经验，并且还初步掌握了相关软件的使用方法。

关键词：工资、虚拟变量、最小二乘回归、异方差检验、SAS软件一、引言亚当.斯密《国富论》中说：“一国国民每年的劳动，本来就是供给他们每年消费的一切生活必需品和便利的源泉。

”一个劳动者的工资，要用来养家糊口，因此对于它的研究至关重要。

职工工资的增长逐渐成为一个热点话题，在百度中输入“职工工资”，你会得到非常多相关报道，工资协商制、工资拖欠、工资保障机制也成为学术界人士争相研究的焦点。

而也是随着职工工资的增长，其他的一些问题，诸如个税征收、社会保障机制改革等接踵而来。

因此，研究好职工工资的影响因素，对于预测工资走向，安排生产生活，体制改革等有积极意义。

影响工资的因素有很多，在此我们主要选教育年限、经验、任期、性别、婚姻等因素来研究，从该研究中发现更深层次的原因，这就是本问研究的主要目的。

二、背景知识1.虚拟变量定心信息通常是以二值信息的形式出现：一个人是男还是女；一个人是已婚还是未婚；这些信息可以通过定义一个二值变量或0-1变量来刻画。

在计量经济学中，二值变量通常称为虚拟变量。

2.多重共线性在多元线性回归模型经典假设中，其重要假定之一是回归模型的解释变量之间不存在线性关系，也就是说，解释变量中的任何一个都不能是其他解释变量的线性组合。

如果违背这一假定，即线性回归模型中某一个解释变量与其他解释变量间存在线性关系，就称线性回归模型中存在多重共线性。

多重共线性违背了解释变量间不相关的古典假设，将给普通最小二乘法带来严重后果。

多重共线性的解决方法有：1.保留重要解释变量，去掉次要或可替代解释变量；2.用相对数变量替代绝对数变量；3.差分法；4.逐步回归分析；5.主成份分析；6.偏最小二乘回归；7.岭回归；8.增加样本容量。

3.异方差性异方差性（heteroscedasticity ）是相对于同方差而言的。

所谓同方差，是为了保证回归参数估计量具有良好的统计性质，经典线性回归模型的一个重要假定：总体回归函数中的随机误差项满足同方差性，即它们都有相同的方差。

如果这一假定不满足，即：随机误差项具有不同的方差，则称线性回归模型存在异方差性。

若线性回归模型存在异方差性，则用传统的最小二乘法估计模型，得到的参数估计量不是有效估计量，甚至也不是渐近有效的估计量；此时也无法对模型参数的进行有关显著性检验。

对存在异方差性的模型可以采用加权最小二乘法进行估计。

异方差性的检测——White test在此检测中，原假设为：回归方程的随机误差满足同方差性。

对立假设为：回归方程的随机误差满足异方差性。

判断原则为：如果nR^2>chi^2 (k-1），则原假设就要被否定，即回归方程满足异方差性。

三、数据本文研究的数据来源于叶明确老师课堂中所使用的工资数据，共计526个样本数据。

本文选取了受教育年限（educ ），工作年限（exper ），任期（tenure ），性别（female ），婚姻（married ）等因素作为自变量，研究其与工资之间的影响关系。

关于性别、婚姻等变量的量化，我们定义：性别：“female=1”表示女性，“female=0”表示男性；婚姻：“married=1”表示已婚，“married=0”表示未婚；得到数据样本如下：四、分析1.建模参考经济学中的经典模型，本文我们也采用log(wage)作为因变量，建立最小二乘回归模型：εββββββ+⨯+⨯+⨯+⨯+⨯+=tenure er married female educ wage 543210exp )log(2.回归结果我们采用SAS 软件进行方程的回归，命令如下：proc reg data =ltl;model lwage=educ exper tenure female married;run;结果：我们看到，模型的拟合度约是40%，而模型的F检验值为70.83，是显著的。

但是，我们还发现，在95%置信度的标准下，exper的结果是不显著的，需要进一步修正。

2.相关系数矩阵为了检测变量间的多重共线性，我们检查变量间的相关系数，命令：proc corr data=ltl;var educ exper tenure female married;run;回归结果如下：我们发现，exper 与tenure 相关系数较高，married 与exper 和tenure 的相关系数都比较高。

从现实来讲，任期较长的工作人员，自然地工作经验较为丰富。

而工作时间较长的人，年龄相应地较大，已婚的可能性也较大。

所以很显然，我们的自变量自己存在多重共线性。

接下来我们对模型进行修正。

3.模型修正（多重共线性修正）第一步：log(wage)对单个自变量进行回归：1. εββ+⨯+educ 10=log(wage)，得到2R =0.1858，参数统计显著；2. εββ+⨯+=er wage ex p )log(10，得到2R =0.0124，参数统计显著；3. εββ+⨯+=tenure )log(10wage ，得到2R =0.1060，参数统计显著；4. εββ+⨯+=emale wage f )log(10，得到2R =0.1396，参数统计显著；5. εββ+⨯+=m arried )log(10wage ，得到2R =0.0733，参数统计显著；可看到，educ 的拟合优度最强，并且已被证明与其他变量的相关系数不强，所以选择educ 作为基本回归方程，第二步：将其余变量逐一引入：1. εβββ+⨯+⨯+er educ ex p =log(wage)210，得到2R =0.2493，且统计是显著的；2. εβββ+⨯+⨯+tenure educ 210=log(wage)，得到2R =0.3085，且统计是显著的；3. εβββ+⨯+⨯+female educ 210=log(wage)，得到2R =0.3002，且统计是显著的；4. εβββ+⨯+⨯+married educ 210=log(wage)，得到2R =0.2442，且统计是显著的；我们得到，educ 和tenure 组合的拟合优度最强，且对模型参数影响不大。

第三步，继续引入变量：1. εββββ+⨯+⨯+⨯+er tenure educ ex p =log(wage)3210，得到2R =0.3160，模型的拟合度并没有明显提高，educ ，tenure 两个参数都是统计显著的，而exper 在1%显著性水平下是不显著的，在5%显著性水平下显著；； 2. εββββ+⨯+⨯+⨯+female tenure educ 3210=log(wage)，得到2R =0.3828，参数统计显著；3. εββββ+⨯+⨯+⨯+married tenure educ 3210=log(wage)，得到2R =0.3343，参数统计显著；我们得到，educ 、tenure 、female 组合的拟合优度最好，继续插入变量，第四步：1. εβββββ+⨯+⨯+⨯+⨯+er female tenure educ ex p =log(wage)43210，得到2R =39.23，educ ，tenure ，female 三个参数都是统计显著的，exper 在1%显著性水平下是不显著的，在5%显著性水平下显著；2. εβββββ+⨯+⨯+⨯+⨯+married female tenure educ 43210=log(wage)，得到2R =0.3996，并且参数统计显著；所以，最终我们选取R 2最高，并且统计显著的模型，得到的初步模型为：εβββββ+⨯+⨯+⨯+⨯+married female tenure educ 43210=log(wage)回归结果如下：我们看到所有参数都是统计显著，并且模型F检验值为86.70，说明该回归模型也是显著的。

5.散点图我们利用SAS软件，做出log(wage)与educ、tenure之间的散点图：Proc sgplot data=ltl;scatter x=educ y=lwage;run;可以看到，log(wage) 与tenure之间线性关系不明显；从而我们引入变量tenure2来进一步优化模型：6.加入变量我们对比如下2个模型：εβββββ+⨯+⨯+⨯+⨯+=tenure married female educ wage 43210)log(:)1(εββββββ+⨯+⨯+⨯++⨯+⨯+=2543210)log(:)2(tenure tenure married female educ wage得到模型（2）结果如下：我们看到，与模型（1）相比，新的模型R 2有所提高，且在5%置信水平下，所有参数统计都显著，说明变量tenure 2的引入是合理的。

所以，最终我们确定了模型为：εββββββ+⨯+⨯+⨯++⨯+⨯+=2543210)log(tenure tenure married female educ wage200086113.004165.012691.028079.007871.054649.0)log(tenure tenure married female educ wage ⨯-⨯+⨯+⨯-⨯+=∧五、模型检验1.经济意义检验我们看到受教育的系数为0.07871，为正数，表明其他条件不变的情况下，教育每增加一年，工资收入将增加7.8%；任期的系数为0.04165，为正数，表明其他条件不变的情况下，任期增加一年，工资收入将增加4.6%；虚拟变量married 的系数为0.12691，表明其他条件不变的情况下，总体上已婚员工的工资要大于未婚员工虚拟变量female 的系数为-0.28079，为负数，表明其他条件不变的情况下，总体上，男性的工资要比女性高[(0.54694-0. 28079)*100]%。

所以模型能通过经济意义上的检验。

2.统计检验（1）拟合优度：从回归结果中可以看到，4150.02=R ，调整后，消除解释变量对拟合优度的影影响，4094.0_2=R ，对于经济数据来说，模型的拟合度还不错；（2）F 检验：原假设为0:43210====ββββH ，给定显著性水平05.0=α，在F 分布表中查出自由度为k=4和n-k-1=521的临界值38.2)521,4(=αF 。

e商务文档

工资及其主要影响因素分析概要

相关文档推荐：