当前位置:文档之家› 多元线性回归模型案例(DOC)

多元线性回归模型案例(DOC)

多元线性回归模型案例分析
——中国人口自然增长分析一·研究目的要求
中国从1971年开始全面开展了计划生育,使中国总和生育率很快从1970年的5.8降到1980年2.24,接近世代更替水平。

此后,人口自然增长率(即人口的生育率)很大程度上与经济的发展等各方面的因素相联系,与经济生活息息相关,为了研究此后影响中国人口自然增长的主要原因,分析全国人口增长规律,与猜测中国未来的增长趋势,需要建立计量经济学模型。

影响中国人口自然增长率的因素有很多,但据分析主要因素可能有:(1)从宏观经济上看,经济整体增长是人口自然增长的基本源泉;(2)居民消费水平,它的高低可能会间接影响人口增长率。

(3)文化程度,由于教育年限的高低,相应会转变人的传统观念,可能会间接影响人口自然增长率(4)人口分布,非农业与农业人口的比率也会对人口增长率有相应的影响。

二·模型设定
为了全面反映中国“人口自然增长率”的全貌,选择人口增长率作为被解释变量,以反映中国人口的增长;选择“国名收入”及“人均GDP”作为经济整体增长的代表;选择“居民消费价格指数增长率”作为居民消费水平的代表。

暂不考虑文化程度及人口分布的影响。

从《中国统计年鉴》收集到以下数据(见表1):
表1 中国人口增长率及相关数据
设定的线性回归模型为:
1222334t t t t t Y X X X u ββββ=++++
三、估计参数
利用EViews 估计模型的参数,方法是:
1、建立工作文件:启动EViews ,点击File\New\Workfile ,在对
话框“Workfile Range ”。

在“Workfile frequency ”中选择“Annual ” (年度),并在“Start date ”中输入开始时间“1988”,在“end date ”中输入最后时间“2005”,点击“ok ”,出现“Workfile UNTITLED ”工作框。

其中已有变量:“c ”—截距项 “resid ”—剩余项。

在“Objects ”菜单中点击“New Objects”,在“New Objects”对话框中选“Group”,并在“Name for Objects”上定义文件名,点击“OK ”出现数据编辑窗口。

年份 人口自然增长率
(%。

) 国民总收入(亿元) 居民消费价格指数增长
率(CPI )% 人均GDP (元) 1988 15.73 15037 18.8 1366 1989 15.04 17001 18 1519 1990 14.39 18718 3.1 1644 1991 12.98 21826 3.4 1893 1992 11.6 26937 6.4 2311 1993 11.45 35260 14.7 2998 1994 11.21 48108 24.1 4044 1995 10.55 59811 17.1 5046 1996 10.42 70142 8.3 5846 1997 10.06 78061 2.8 6420 1998 9.14 83024 -0.8 6796 1999 8.18 88479 -1.4 7159 2000 7.58 98000 0.4 7858 2001 6.95 108068 0.7 8622 2002 6.45 119096 -0.8 9398 2003 6.01 135174 1.2 10542 2004 5.87 159587 3.9 12336 2005 5.89 184089 1.8 14040 2006
5.38 213132 1.5 16024
2、输入数据:点击“Quik ”下拉菜单中的“Empty Group ”,出现“Group”窗口数据编辑框,点第一列与“obs ”对应的格,在命令栏输入“Y ”,点下行键“↓”,即将该序列命名为Y ,并依此输入Y 的数据。

用同样方法在对应的列命名X 2、X
3、X 4,并输入相应的数据。

或者在EViews 命令框直接键入“data Y 2X X 3 X 4 … ”,回车出现“Group”窗口数据编辑框,在对应的Y 、X 2、X 3、X 4下输入响应的数据。

3、估计参数:点击“Procs “下拉菜单中的“Make Equation ”,在出现的对话框的“Equation Specification ”栏中键入“Y C X 2 X 3 X 4”,在“Estimation Settings ”栏中选择“Least Sqares ”(最小二乘法),点“ok ”,即出现回归结果: 表3.4
根据表3.4中数据,模型估计的结果为:
432005109.0047918.0000332.060851.15X X X Y t -++=Λ
(0.913842) (0.000134) (0.033919) (0.001771)
t= (17.08010) (2.482857) (1.412721) (-2.884953) 930526.02
=R 915638.02
=R F=62.50441 四、模型检验
1、经济意义检验
模型估计结果说明,在假定其它变量不变的情况下,当年国民总收入每增长1亿元,人口增长率增长0.000332%;在假定其它变量不变的情况下,当年居民消费价格指数增长率每增长 1%,人口增长率增长0.047918%;在假定其它变量不变的情况下,当年人均GDP 没增加一元,人口增长率就会降低0.005109%。

这与理论分析和经验判断相一致。

2、统计检验
(1)拟合优度:由表3.4中数据可以得到:930526.02
=R ,修正
的可决系数为915638
.02
=R
,这说明模型对样本的拟合很好。

(2)F 检验:针对0234:0H βββ===,给定显著性水平0.05α=,在F 分布表中查出自由度为k-1=3和n-k=14的临界值34.3)14,3(=αF 。

由表3.4中得到F=62.50441 ,由于F=62.50441 >(3,21) 3.075F α=,应拒绝原假设0234:0H βββ===,说明回归方程显著,即“国民总收入”、“居民消费价格指数增长率”、“人均GDP ”等变量联合起来确实对“人口自然增长率”有显著影响。

(3)t 检验:分别针对0H :0(1,2,3,4)j j β==,给定显著性水平0.05α=,
查t 分布表得自由度为n-k=14临界值145.2)(2/=-k n t α。

由表3.4中数据可得,与^
1β、^
2β、^
3β、^
4β对应的t 统计量分别为17.08010、2.482857 、1.412721、-2.884953
除^
3β,其绝对值均大于145.2)(2/=-k n t α,这说明分别都应当拒
绝0H :)4,2,1(0==j j β,也就是说,当在其它解释变量不变的情况下,
解释变量“国民总收入”、“人均GDP ”分别对被解释变量“人口自
然增长率”Y 都有显著的影响。

^
3β的绝对值小于145.2)(2/=-k n t α,:这说明接受0H :03=β,X3系数对t 检验不显著,这表明很可能存在多重共线性。

所以计算各解释变量的相关系数,选择X2、X3、X4数据,
点”view/correlations ”得相关系数矩阵(如表4.4):
表4.4
由相关系数矩阵可以看出:各解释变量相互之间的相关系数较高,证实确实存在严重多重共线性。

五、消除多重共线性
采用逐步回归的办法,去检验和解决多重共线性问题。

分别作Y 对X2、X3、X4的一元回归,结果如表4.5所示:
表4.5
变量 X2
X3 X4 参数估计值 0.000134 0.033919 0.001771 t 统计量
2.482857
1.412721 -
2.88495
0.873915
0.388495
0.886412
按2R 的大小排序为:X4、X2、X3
以X2为基础,顺次加入其他变量逐步回归。

首先加入X2回归结果为:
40005397.02000350.035540.16ˆX X Y
-+= t=(2.542529) (-2.970874) 920622.02
=R
当取05.0=α时,131
.2)318(025
.0)(2
/=-=-t
t k n α,X2参数的t 检验显
著,加入X3回归得
432005109.0047918.0000332.060851.15X X X Y t -++=Λ
t= (17.08010) (2.482857) (1.412721) (-2.884953)
930526.02
=R 915638.02
=R F=62.50441
当取05.0=α时, 145.2)418(2/=-αt ,X3参数的t 检验不显著,予以剔除
即40005397.02000350.035540.16ˆX X Y
-+=,这是最后消除多重共线性的结果。

在假定其它变量不变的情况下,当年国民总收入每增长1亿元,人口增长率增长0.000332%;在假定其它变量不变的情况下,在假定其它变量不变的情况下,当年人均GDP 没增加一元,人口增长率就会降低0.005109%。

金服131 王亚平
13019122。

相关主题