第四次实验————利用所给数据(bothtwins data Excel文件)研究教育的工资回报率问题。
组员:实验内容:1、实验目的:利用所给数据(bothtwins data Excel文件)研究教育的工资回报率问题。
2、实验要求:运用Eviews软件进行数据分析,利用已知数据建立回归模型,考虑诸如遗漏变量和测量误差的模型内生性问题。
由于数据都是不同家庭的双胞胎数据,分析时请利用这一数据特征二、实验报告:(1)、问题提出随着社会的发展,教育的工资回报率问题被提上了日程。
对于影响工资回报率的因素我们愈加关注。
为了这一问题,我们利用所给数据(bothtwins data Excel文件)研究教育的工资回报率问题。
同时考虑诸如遗漏变量和测量误差的模型内生性问题。
(2)、指标选择根据分析问题的需要,依据指标数据可得性原则,我们选择经济含义明确并具有较好完整性和可比较性的数据(bothtwins data Excel 文件)作为数据指标。
Age:年龄;age2:年龄平方;Daded:父亲受教育年数;Momed:母亲受教育年数;Hrwage:工资时薪;lwage:时薪工资对数值;female:是否为女性;white:是否为白人;first:是否为家中长子;Educ:受教育年数(自报);Educ_t:双胞胎中另一个受教育年数(自报);Eductt:双胞胎中某个提供的另外一个的受教育年数(互报);Educt_t:此双胞胎的sibling提供的此双胞胎受教育年数(互报)。
数据来自于国家统计局公布的《中国统计年鉴》。
(3)、数据来源表1 数据(bothtwins data Excel文件)(部分数据)(4)、数据分析1、描述性分析①运用Eviews画出时薪工资与受教育程度的散点图,观察两者的相关性。
如图1时薪工资与受教育程度的散点图6810121416182004080120160HRWAGEE D U C由图1可以看出时薪工资与受教育程度呈正相关关系。
②运用Eviews 画出时薪工资与年龄的散点图,观察两者的相关性图2时薪工资与年龄的散点图102030405060708004080120160HRWAGEA G E由图1可以看出时薪工资与年龄大致呈正相关关系。
2、建立模型模型一:在不考虑双胞胎的情况下,建立分析模型如下:Dependent Variable: LWAGE Method: Least Squares Date: 11/17/14 Time: 20:09 Sample: 1 680Included observations: 680Variable Coefficient Std. Error t-Statistic Prob. EDUC 0.117638 0.009939 11.83604 0.0000 AGE 0.096256 0.010931 8.805826 0.0000 AGE2 -0.000960 0.000131 -7.318658 0.0000 C-1.3547690.261802 -5.1747870.0000R-squared 0.275097 Mean dependent var 2.440960 Adjusted R-squared 0.271880 S.D. dependent var 0.620855 S.E. of regression 0.529775 Akaike info criterion 1.573136 Sum squared resid 189.7271 Schwarz criterion 1.599736 Log likelihood -530.8662 Hannan-Quinn criter. 1.583432 F-statistic 85.51294 Durbin-Watson stat 1.522542Prob(F-statistic) 0.000000模型为:t-Statistic -5.175 11.836 8.806 -7.319 Prob 0.000 0.000 0.000 0.000 R-squared 0.275 Adjusted R-squared 0.272 从模型可以看出,在年龄和年龄的平方不变的情况下,受教育程度每增加一年,时薪工资相对增加0.118%:同样的,在受教育程度和年龄的平方不变的情况下,年龄每增加一年,时薪工资相对增加μββββ++++=23210ln age age educ wage 2001.0-096.0118.0355.1-ln age age educ wage ++=0.096%。
R-squared 不高,此模型有待检验。
对模型一作残差图进行分析: 图3-2-10123012345100200300400500600ResidualActualFitted由图3残差图我们可以看得出来,其残差并没有均匀的分布在条形框中,拟合程度较差,即可能存在遗漏变量(个人能力和家庭背景等)。
模型二:根据已知数据,为了研究教育的工资回报率问题,将其他变量统计为,建立模型如下:Dependent Variable: LWAGE Method: Least Squares Date: 11/17/14 Time: 20:46 Sample: 1 680Included observations: 655Variable Coefficient Std. Error t-Statistic Prob. EDUC0.1052410.010398 10.120820.0000μλββββ+++++=∑jj23210ln Xage age educ wage j ∑jj j X λAGE 0.106682 0.010880 9.805046 0.0000 AGE2 -0.001086 0.000131 -8.258934 0.0000 DADED 0.015630 0.008646 1.807761 0.0711 MOMED -0.003422 0.010335 -0.331055 0.7407 FEMALE -0.325313 0.041298 -7.877194 0.0000 WHITE -0.120867 0.075957 -1.591258 0.1120 C-1.2243410.276200-4.4327980.0000R-squared 0.346011 Mean dependent var 2.445188 Adjusted R-squared 0.338935 S.D. dependent var 0.627684 S.E. of regression 0.510344 Akaike info criterion 1.504676 Sum squared resid 168.5119 Schwarz criterion 1.559450 Log likelihood -484.7812 Hannan-Quinn criter. 1.525914 F-statistic 48.90189 Durbin-Watson stat 1.552372 Prob(F-statistic) 0.000000模型二为:从模型的结果可以看出,R-squared 提高为0.346,比模型一高。
但是其中变量daded 、momed 、white 三个变量t 检验不通过,p 值过大。
猜测可能是测量误差引起的内生性问题,所以运用差分法建立模型三对数据进行分析。
模型三:为了解决由遗漏变量和测量误差引起的内生性问题,这里运用已提供的双胞胎数据进行差分方程建立模型三,模型如下:①② 方程①—②得模型三:white female momed age age educ wage 121.0325.0003.0daded 016.0001.0-107.0105.0224.1-ln 2---+++=jj Xage age educ wage 1jj23210ln μλββββ+++++=∑jj Xage age t educ t wage 2jj23210__ln μλββββ+++++=∑)()_(_ln ln 211j j t educ educ t wage wage μμβ-+-=-Dependent Variable: LWAGE-LWAGE_T Method: Least Squares Date: 11/17/14 Time: 21:11 Sample: 1 680Included observations: 680Variable Coefficient Std. Error t-Statistic Prob. C0.000000 0.019460 0.000000 1.0000 EDUC-EDUC_T 0.0617010.013227 4.6646880.0000R-squared 0.031095 Mean dependent var 0.000000 Adjusted R-squared 0.029666 S.D. dependent var 0.515162 S.E. of regression 0.507463 Akaike info criterion 1.484150 Sum squared resid 174.5975 Schwarz criterion 1.497450 Log likelihood -502.6111 Hannan-Quinn criter. 1.489298 F-statistic 21.75931 Durbin-Watson stat 2.962756Prob(F-statistic) 0.000004模型三的方程为:消除了已知数据中相同的变量以及不可观察的能力和家庭背景等遗漏变量的影响。
只考虑双胞胎的受教育程度对时薪工资的影响。
在其他变量消除的情况下,双胞胎的受教育程度差距每增加一年,时薪工资的差距相对增加0.062%。
(5)模型检验 模型一:1、模型经济意义检验从斜率项的值看,0< 0.118<1,0<0.096<1,符合经济理论。
在年龄和年龄的平方不变的情况下,受教育程度每增加一年,时薪工资相对增加0.118%:同样的,在受教育程度和年龄的平方不变的情况下,年龄每)_(062.0_ln lnt educ educ t wage wage -=-增加一年,时薪工资相对增加0.096%。
2、模型统计检验 T 检验假设:H 0 : = 0 ;H 1 : 0: t 为11.836,该模型自由度为n-k-1>120。