当前位置:文档之家› 多元线性回归模型案例分析

多元线性回归模型案例分析

多元线性回归模型案例分

This manuscript was revised by the office on December 10, 2020.
多元线性回归模型案例分析
——中国人口自然增长分析
一·研究目的要求
中国从1971年开始全面开展了计划生育,使中国总和生育率很快从1970年的5.8降到1980年2.24,接近世代更替水平。

此后,人口自然增长率(即人口的生育率)很大程度上与经济的发展等各方面的因素相联系,与经济生活息息相关,为了研究此后影响中国人口自然增长的主要原因,分析全国人口增长规律,与猜测中国未来的增长趋势,需要建立计量经济学模型。

影响中国人口自然增长率的因素有很多,但据分析主要因素可能有:(1)从宏观经济上看,经济整体增长是人口自然增长的基本源泉;(2)居民消费水平,它的高低可能会间接影响人口增长率。

(3)文化程度,由于教育年限的高低,相应会转变人的传统观念,可能会间接影响人口自然增长率(4)人口分布,非农业与农业人口的比率也会对人口增长率有相应的影响。

二·模型设定
为了全面反映中国“人口自然增长率”的全貌,选择人口增长率作为被解释变量,以反映中国人口的增长;选择“国名收入”及“人均GDP”作为经济整体增长的代表;选择“居民消费价格指数增长率”作为居民消费水平的代表。

暂不考虑文化程度及人口分布的影响。

从《中国统计年鉴》收集到以下数据(见表1):
表1中国人口增长率及相关数据
年份人口自然增长率
(%。


国民总收入
(亿元)
居民消费价格指数增长
率(CPI)%
人均GDP
(元)
198815.731503718.81366 198915.0417001181519 199014.3918718 3.11644 199112.9821826 3.41893 199211.626937 6.42311 199311.453526014.72998 199411.214810824.14044 199510.555981117.15046 199610.42701428.35846 199710.0678061 2.86420 19989.1483024-0.86796 19998.1888479-1.47159 20007.58980000.47858 2001 6.951080680.78622 2002 6.45119096-0.89398 2003 6.01135174 1.210542 2004 5.87159587 3.912336
设定的线性回归模型为: 三、估计参数
利用EViews 估计模型的参数,方法是:
1、建立工作文件:启动EViews ,点击File\New\Workfile ,在对话框“WorkfileRange ”。

在“Workfilefrequency ”中选择“Annual ”(年度),并在“Startdate ”中输入开始时间“1988”,在“enddate ”中输入最后时间“2005”,点击“ok ”,出现“WorkfileUNTITLED ”工作框。

其中已有变量:“c ”—截距项“resid ”—剩余项。

在“Objects ”菜单中点击“NewObjects”,在“New Objects”对话框中选“Group”,并在“NameforObjects”上定义文件名,点击“OK ”出现数据编辑窗口。

2、输入数据:点击“Quik ”下拉菜单中的“EmptyGroup ”,出现“Group”窗口数据编辑框,点第一列与“obs ”对应的格,在命令栏输入“Y ”,点下行键“↓”,即将该序列命名为Y ,并依此输入Y 的数据。

用同样方法在对应的列命名X 2、X
3、X 4,并输入相应的数据。

或者在EViews 命令框直接键入“dataY 2X X 3 X 4…”,回车出现“Group”窗口数据编辑框,在对应的Y 、X 2、X 3、X 4下输入响应的数据。

3、估计参数:点击“Procs “下拉菜单中的“MakeEquation ”,在出现的对话框的“EquationSpecification ”栏中键入“YCX 2X 3X 4”,在
“EstimationSettings ”栏中选择“LeastSqares ”(最小二乘法),点“ok ”,即出现回归结果: 表3.4
根据表3.4中数据,模型估计的结果为:
(0.913842)(0.000134)(0.033919)(0.001771)
t=(17.08010)(2.482857)(1.412721)(-2.884953)
930526.02=R 915638.02
=R F=62.50441
四、模型检验
1、经济意义检验
2005 5.89 184089 1.8 14040 2006 5.38
213132 1.5 16024
模型估计结果说明,在假定其它变量不变的情况下,当年国民总收入每增长1亿元,人口增长率增长0.000332%;在假定其它变量不变的情况下,当年居民消费价格指数增长率每增长1%,人口增长率增长0.047918%;在假定其它变量不变的情况下,当年人均GDP 没增加一元,人口增长率就会降低0.005109%。

这与理论分析和经验判断相一致。

2、统计检验
(1)拟合优度:由表3.4中数据可以得到:930526.02
=R ,修正的可决
系数为915638
.02
=R
,这说明模型对样本的拟合很好。

(2)F 检验:针对0234:0H βββ===,给定显着性水平0.05α=,在F 分布表中查出自由度为k-1=3和n-k=14的临界值34.3)14,3(=αF 。

由表3.4中得到F=62.50441,由于F=62.50441>(3,21) 3.075F α=,应拒绝原假设
0234:0H βββ===,说明回归方程显着,即“国民总收入”、“居民消费价格
指数增长率”、“人均GDP ”等变量联合起来确实对“人口自然增长率”有显着影响。

(3)t 检验:分别针对0H :
0(1,2,3,4)
j j β==,给定显着性水平0.05α=,
查t 分布表得自由度为n-k=14临界值145.2)(2/=-k n t α。

由表3.4中数据可得,与^1β、^2β、^3β、^
4β对应的t 统计量分别为17.08010、2.482857、1.412721、-2.884953
除^
3β,其绝对值均大于145.2)(2/=-k n t α,这说明分别都应当拒绝0H :
)4,2,1(0==j j β,也就是说,当在其它解释变量不变的情况下,解释变量“国民总收入”、“人均GDP ”分别对被解释变量“人口自然增长率”Y 都有显着的影响。

^
3β的绝对值小于145.2)(2/=-k n t α,:这说明接受0H :03=β,X3系数
对t 检验不显着,这表明很可能存在多重共线性。

所以计算各解释变量的相关系数,选择X2、X3、X4数据,点”
view/correlations ”得相关系数矩阵(如表4.4):
表4.4
由相关系数矩阵可以看出:各解释变量相互之间的相关系数较高,证实确实存在严重多重共线性。

五、消除多重共线性
采用逐步回归的办法,去检验和解决多重共线性问题。

分别作Y 对X2、X3、X4的一元回归,结果如表4.5所示:
表4.5
按2
R 的大小排序为:X4、X2、X3
以X2为基础,顺次加入其他变量逐步回归。

首先加入X2回归结果为:
t=(2.542529)(-2.970874)920622.02
=R
当取05.0=α时,131
.2)318(025
.0)(2/=-=-t
t k n α,X2参数的t 检验显着,加
入X3回归得
t=(17.08010)(2.482857)(1.412721)(-2.884953)
930526.02=R 915638.02
=R F=62.50441
当取05.0=α时,145.2)418(2
/=-αt ,X3参数的t 检验不显着,予以剔除
即40005397.02000350.035540.16ˆ
X X Y -+=,这是最后消除多重共线性的结果。

在假定其它变量不变的情况下,当年国民总收入每增长1亿元,人口增长率增长0.000332%;在假定其它变量不变的情况下,在假定其它变量不变的情况下,当年人均GDP 没增加一元,人口增长率就会降低0.005109%。

相关主题