当前位置:文档之家› 计量经济学讲义-3--第一章 线性回归基础

计量经济学讲义-3--第一章 线性回归基础

4 最小二乘原理计量经济学最关心的理论模型是类似于y x αβ=+ 表示变量之间的关系。

1. 散点图为了弄清楚变量之间的关系,我们从画出他们的散点图开始比较好。

从画的图中我们可以大体上判断以下变量之间是呈直线关系,还是二次曲线关系。

这对准确建立模型很有帮助。

模型y x αβ=+代表只要我们知道x ,我们就可以完全知道y 。

但是现实中不是这样。

这时除了系统因素x 之外,还有其他别的因素影响y 。

此时我们用确率模型 ,1,2,,t t t Y X u t n αβ=++=来表示。

其中,y 是被说明变量,或从属变量;x 是说明变量,或独立变量;u 是误差项,也可以叫做搅乱项。

2. 函数的设定与参数的意义不同的模型定义,它所定义的参数的意义不同。

为简单起见,在本节中,我们先省去误差项。

我们讨论一下参数的意义。

在y x αβ=+中,dy dxβ=,β意味着x 发生一单位的变化时,y 相应地变化几个单位,也就是我们所熟悉的限界消费性向。

但是对于y x βα=来说,我们先两边取自然对数,log log log y x αβ=+,这时,log log d y d xβ=,其中,log ,log dy dx d y d x yx==,结果log log d y x dy d xy dxβ==。

β代表x 变化1%时,y 变化β%单位。

也就是弹力性。

3. 最小二乘法3-1. 基本符号样本平均 1111,nnt tt t X X Y Ynn====∑∑偏离样本平均的平方和 ()22222111nnnxttt t t t S xXXX nX=====-=-∑∑∑;()22222111nnnytttt t t S y YYYnY =====-=-∑∑∑()()111nnnxy tt ttt t t t t S xy XXYYX Y nX Y =====--=-∑∑∑其中,,t t t t x X X y Y Y =-=-,小写代表偏离样本平均的程度,即偏差。

偏差有以下重要性质:()110nnttt t xXX===-=∑∑; ()110nnt tt t y YY===-=∑∑证明:()121nt n t X X X X X X X X =-=-+-++-∑1nt t X nX ==-∑111nnt t t t X n X n==⎛⎫=-⎪⎝⎭∑∑=0 我们可以同样证明10nt t y ==∑。

下面我们再看看()222211nnxtt t t S XXX nX ===-=-∑∑。

()()2222112nnxttt t t S XXXX X X===-=-+∑∑22112nntt t t XXX nX ===-+∑∑()2212ntt XX nX nX==-+∑221nt t X nX ==-∑我们用同样的方法可以求出2,y xy S S 。

3-2. 最小二乘原理我们定义Y X αβ=+的推定线为ˆˆˆYX αβ=+,其中ˆY 和ˆˆ,αβ分别代表Y 和,αβ的推定值,∧读为ha.to 。

当t X X =时,ˆˆˆt t Y X αβ=+。

观察值t Y 与推定值ˆt Y 之间的差,我们称之为残差(residual)。

在图中,用垂直于横轴的线段t e 来表示。

即,ˆˆˆt t t t t e Y Y Y X αβ=-=--,te 代表观察时点t 时,观察值与推定值的不一致的程度。

为了评价所有的观察时点1,2,,t n = ,的不一致程度,我们用()2211ˆˆnntttt t e YX αβ===--∑∑作为衡量的尺度。

()2211ˆˆnntt tt t e Y X αβ===--∑∑我们把21nt t e =∑称为残差平方和(residual sum ofsquares,RSS)。

但是我们不能用1n t t e =∑,31ntt e =∑和51nt t e =∑作为衡量不一致程度的工具。

因为与观察值无关,只要给出足够大的ˆˆ,αβ,1nt t e =∑,31nt t e =∑和51ntt e =∑可以任意地变小。

也就是说它们没有最小值。

但是,21ntt e =∑ 确不一样。

21ntt e =∑的值与ˆˆ,αβ有关。

所以我们只要找到使得21nt t e =∑最小的ˆˆ,αβ最为,αβ的推定值。

这就是最小二乘法。

3-3. 最小二乘推定量的导出对于模型,1,2,,t t t Y X u t n αβ=++= 来说,,αβ的最小二乘推定量为ˆˆ,αβ,它们是使得残差平方和()2211ˆˆnnt ttt t e YX αβ===--∑∑最小的,αβ的推定值。

()()垐 垐t t t t Y X Y Y X X Y X αββαβ--=---+--()垐ˆtt yx Y X βαβ=-+-- 两边平方 2ˆˆ()t tY X αβ-- ()()()2222垐垐垐垐 222tt t t t t y x Y Xx y y Y x Y X βαββαββαβ=++---+----- ()21ˆˆnttt YX αβ=--∑()()()222211111垐垐垐垐 222nnnnntt t tt tt t t t t y x n Y Xx y Y y Y X xβαββαββαβ======++---+-----∑∑∑∑∑前面我们曾经提到10nt t e ==∑,进一步我们可以得到110,0nnt t t t x y ====∑∑,()21ˆˆnt tt Y X αβ=--∑()2222111垐 ˆ2nnntt t t t t t y x n Y X x y βαββ====++---∑∑∑我们用偏差平方和的写法把上面的残差平方和再重新改写一下,()21ˆˆnt tt Y X αβ=--∑()2222垐 ˆ2yx xyS S n Y X S βαββ=++--- ()2222垐 ˆ2y x xyS S n Y X S βαββ=++--- ()22222垐ˆxy xy x yx x S S n Y X S S S S αββ⎛⎫⎛⎫=--+-+- ⎪ ⎪ ⎪⎝⎭⎝⎭上式的右侧第三项中不含有ˆˆ,αβ,所以第三项不会随着ˆˆ,αβ的变化而变化。

第一项和第二项由都是平方的形式,因此只要第一项和第二项同时为0的是时候,残差平方和就为最小,也就是残差平方和为0。

()2ˆˆ0Y X αβ--= 2ˆ0xy x x S S S β⎛⎫-= ⎪⎝⎭这种求最小二乘推定量方法的优点是,不需要使用偏微分方法,也不需要讨论为使残差平方和最小而必须满足的二次条件。

4. 最小二乘回归线我们把ˆˆˆt tY X αβ=+称为最小二乘回归线或样本回归线。

我们把ˆˆY X αβ=-代入样本回归线中,我们发现 ()垐 ˆt t tY Y X X Y X X βββ=-+=+-,由此我们可以判断样本回归线经过样本平均点(),X Y 。

5. 练习题1). 使用下面的数据,用最小二乘法估计模型Y X u αβ=++。

X 6 11 17 8 13 Y13524。

第一种方法: x 6 11 17 8 13 55 sum(x) y1 352415 sum(y)xy 633 85 16 52 192 sum(xy)xx 36 121 289 64 169 679 sum(xx) ()2251925515135ˆ0.36556795555370n XY X Yn XX β-⨯-⨯====⨯-⨯-∑∑∑∑∑;ˆˆY Xnβα-=∑∑=-1.01另外一种求法:先求出均值,X Y ;求出small x,y;再求出2,,,x y x y x ∑∑∑∑;2垐ˆ;xy YX xβαβ==-∑∑;。

相关主题