当前位置:文档之家› 实验一一元线性回归

实验一一元线性回归

实验一一元线性回归一实验目的:掌握一元线性回归的估计与应用,熟悉EViews的基本操作。

二实验要求:应用教材P59第12题做一元线性回归分析并做预测。

三实验原理:普通最小二乘法。

四预备知识:最小二乘法的原理、t检验、拟合优度检验、点预测和区间预测。

五实验容:第2章练习12下表是中国2007年各地区税收Y和国生产总值GDP的统计资料。

单位:亿元(1)作出散点图,建立税收随国生产总值GDP变化的一元线性回归方程,并解释斜率的经济意义;(2)对所建立的回归方程进行检验;(3)若2008年某地区国生产总值为8500亿元,求该地区税收收入的预测值及预测区间。

六实验步骤1.建立工作文件并录入数据:(1)双击桌面快速启动图标,启动Microsoft Office Excel, 如图1,将题目的数据输入到excel表格中并保存。

(2)双击桌面快速启动图标,启动EViews6程序。

(3)点击File/New/ Workfile…,弹出Workfile Create对话框。

在Workfile Create对话框左侧Workfile structure type栏中选择Unstructured/Undated 选项,在右侧Data Range中填入样本个数31.在右下方输入Workfile的名称P53.如图2所示。

图 1 图 2(4)下面录入数据,点击File/Import/Read Text-Lotus-Excel...选中第(1)步保存的excel表格,弹出Excel Spreadsheet Import对话框,在Upper-left data cell栏输入数据的起始单元格B2,在Excel 5+sheet name栏中输入数据所在的工作表sheet1,在Names for series or Number if named in file栏中输入变量名Y GDP,如图3所示,点击OK,得到如图4所示界面。

图 3 图 4(5)按住Ctrl键同时选中Workfile界面的gdp表跟y表,点击鼠标右键选Open/as Group得到完整表格如图5,并点击Group表格上菜单命令Name,在弹出的对话框中命名为group01.图 5 图 62.数据的描述性统计和图形统计:以上建立的序列GDP和Y之后,可对其做描述统计和统计以把握该数据的一些统计属性。

(1)描述属性:点View/Descriptive Stats\Common Sample,得描述统计结果,如图6所示,其中:Mean为均值,Std.Dev为标准差。

(2)图形统计:双击序列GDP,打开GDP的表格形式,点击表格左边View/Graph,可得图7。

同样可查看序列Y的线形图。

很多时候需要把两个序列放在一个图形中来查看两者的相互关系,用线图或散点图都可以。

在命令栏键入:scat GDP Y,然后回车,就可以得到用散点图来查看GDP 和Y的关系,如图8所示。

图 7 图 83.设定模型,用最小二乘法估计参数:设定模型为12i i i Y X u ββ=++。

按住Ctrl 键,同时选中序列Y 和序列GDP ,点击右键,在所出现的右键菜单中,选择Open/as Equation …后弹出一对话框,在框中一次输入“y c gdp ”,(注意被解释变量在最前,变量间要空格,如图9)点击其下的确定,即可得到回归结果(如图10)。

图 9 图 10由图10数据结果,可得到回归分析模型为:10.629630.071047i i Y X =-+(0.123500)- (9.591245)20.760315R =, 9199198F =, .. 1.570523DW =其中,括号的数为相应的t 检验值。

2R 是可决系数,F 与..DW 是有关的两个检验统计量。

4.模型检验:(1)经济意义检验。

斜率2ˆ0.071047β=为边际可支国生产总值GDP ,表明2007年,中国地各省区GDP 每增加1亿元时,税收平均增加0.071047亿元。

(2)t 检验和拟合优度检验。

在显著性水平下,自由度为31-2=29的t 分布的临界值0.025(29) 2.05t =。

因此,从参数的t 检验值看,斜率项显然不为零,但不拒绝截距项为零的假设。

另外,拟合优度20.760315R =表明,税收的76%的变化也以由GDP 的变化来解释,因此拟合情况较好。

在Eqution 界面点击菜单命令View/Actual,Fitted,Residual/Actual,Fitted.Residual Graph 可得到图11,可直观看到实际观测站和拟合值非常接近。

图 11 图 125.应用:回归预测:(1)被解释变量Y 的个别值和平均值的点预测:由第二章第五节知道,个别值和平均值点预测的预测公式均为12ˆˆF FY X ββ=+ 插预测:在Equation 框中,点击“Forecast ”,在Forecast name 框中可以为所预测的预测值序列命名,计算机默认为yf ,点击“OK ”,得到样本期被解释变量的预测值序列yf (也称拟合值序列)的图形形式(图12)。

同时在Workfile 中出现一个新序列对象yf 。

外推预测:① 录入2008年某地区国生产总值GDP 为8500亿元的数据。

双击Workfile 菜单下的Range 所在行,出现将Workfile structured 对话框,讲右侧Observation 旁边的数值改为32,然后点击OK ,即可用将Workfile的Range以及Sample的Range改为32;双击打开GDP序列表格形式,将编辑状态切换为“可编辑”,在GDP序列中补充输入GDP=8500(如图13所示)。

图13 图 14②进行预测在Equation框中,点击“Forecast”,弹出一对话框,在其中为预测的序列命名,如yf2。

点击OK即可用得到预测结果的图形形式(如图14所示)。

点击Workfile中新出现的序列yf2,可以看到预测值为593.2667(图15)(注意:因为没有对默认预测区间1-32做改变,这时候得到的是所有插预测与外插预测的值,若将区间改为32 32,则只会得到外推预测结果)。

图 15 图 16③ 结果查看按住Ctrl 键,同时选中y 、yf 、resid ,点击右键,在右键菜单中选Open/as Group 可打开实际值、预测值、残差序列,在view 菜单选择Graph...,画折线图(如图16所示)。

(2)区间预测原理:当2007年中国某省区GDP 为8500亿元时,预测的税收为()ˆ10.630.0718500593.2667Y=-+⨯=亿元 被解释变量Y 的个别值区间预测公式为:/2ˆˆ1fY t ασ⋅∑ 被解释变量Y 的均值区间预测公式为:/2ˆˆ1/fY t ασ⋅∑。

具体地说,ˆfY 可以在前面点预测序列2593.2667yf =中找到;/2=2.045t α可以查t 分布表得到;样本数n=31为已知;f GDP GDP -中的=8500f GDP 为已知,8891.126GDP =,255957878.6i gdp =∑可以在序列GDP 的描述统计中找到,22()=391.126=152979.5f GDP GDP --();22760310ieRSS ==∑,从而222760310ˆ95183.113111ien k σ===----∑;由X 总体方差的无偏估计式222/(1)619.5803383879.74814809GDP i gdp n σ=-==∑,可以计算2n 111900272.19259079igdp=-=∑() (GDP σ可在序列X 的描述统计中找到)。

(3)区间预测的Eviews 操作: ①个别值置信区间的计算:在命令栏输入:(yfu 为个别值的置信上界,yfl 为个别值的置信下界) “scalaryfu=593.2667+2.045*sqrt(95183.1*(1+1/31+152979.5/55957878.6))” “scalaryfl=593.2667-2.045*sqrt(95183.1*(1+1/31+152979.5/55957878.6))” 得到:yfu=1235.12876632 yfl=-48.5953663235于是95%的置信度下预测的2008年某省区税收入个值的置信区间为:(-48.5953663235,1235.12876632)。

②均值的置信区间的计算:在命令栏输入:(eyfu为均值的置信上界,eyfl为均值的置信下界)“scalare yfu=593.2667+2.045*sqrt(95183.1*(1/31+152979.5/55957878.6))”“scalareyfl=593.2667-2.045*sqrt(95183.1*(1/31+152979.5/55957878.6))”得到:eyfu=711.287072849 eyfl=475.246327151于是在95%的置信度下,预测省区的2008年的税收收入均值的置信区间为:(475.246327151,711.287072849)。

实验二多元线性回归一实验目的:(1) 掌握多元线性回归模型的估计方法(2) 模型方程的F检验,参数的t检验(3) 模型的外推预测与置信区间预测二实验要求:应用教材P107习题14做多元线性回归模型估计,对回归方程和回归参数进行检验并做出单点预测与置信区间预测三实验原理:最小二乘法四预备知识:最小二乘法估计原理、t检验、F检验、点预测和置信区间预测五实验容:在一项对某社区家庭对某种消费品的消费需要调查中,得到书中的表所示的归分析。

,计算2R及2R。

(1)估计回归方程的参数及及随机干扰项的方差2(2)对方程进行F检验,对参数进行t检验,并构造参数95%的置信区间.(3)如果商品单价变为35元,则某一月收入为20000元的家庭的消费支出估计是多少?构造该估计值的95%的置信区间。

六实验步骤:6.1 建立工作文件并录入全部数据如图1所示:图 16.2 建立二元线性回归模型01122Y X X βββ=++点击主界面菜单Quick\Estimate Equation 选项,在弹出的对话框中输入:Y C X1 X2点击确定即可得到回归结果,如图2所示图 2根据图2的信息,得到回归模型的估计结果为:626.51939.790610.02862(15.61)( 3.06)(4.90)Y X X =-+-20.902218R = 20.874281R = .. 1.650804DW =22116.847ie=∑ 32.29408F = (2,7)df =随机干扰项的方差估计值为22116.847302.40677σ∧== 6.3 结果的分析与检验6.3.1 方程的F 检验回归模型的F 值为: 32.29408F =因为在5%的显著性水平下,F 统计量的临界值为0.05(2,7) 4.74F =所以有 0.05(2,7)F F >所以回归方程通过F 检验,方程显著成立。

相关主题