当前位置：文档之家› 计量经济学讲义-3--第一章线性回归基础

计量经济学讲义-3--第一章线性回归基础

4 最小二乘原理计量经济学最关心的理论模型是类似于y x αβ=+ 表示变量之间的关系。

1. 散点图为了弄清楚变量之间的关系，我们从画出他们的散点图开始比较好。

从画的图中我们可以大体上判断以下变量之间是呈直线关系，还是二次曲线关系。

这对准确建立模型很有帮助。

模型y x αβ=+代表只要我们知道x ，我们就可以完全知道y 。

但是现实中不是这样。

这时除了系统因素x 之外，还有其他别的因素影响y 。

此时我们用确率模型 ,1,2,,t t t Y X u t n αβ=++=来表示。

其中，y 是被说明变量，或从属变量；x 是说明变量，或独立变量；u 是误差项，也可以叫做搅乱项。

2. 函数的设定与参数的意义不同的模型定义，它所定义的参数的意义不同。

为简单起见，在本节中，我们先省去误差项。

我们讨论一下参数的意义。

在y x αβ=+中，dy dxβ=，β意味着x 发生一单位的变化时，y 相应地变化几个单位，也就是我们所熟悉的限界消费性向。

但是对于y x βα=来说，我们先两边取自然对数，log log log y x αβ=+，这时，log log d y d xβ=，其中，log ,log dy dx d y d x yx==，结果log log d y x dy d xy dxβ==。

β代表x 变化1%时，y 变化β%单位。

也就是弹力性。

3. 最小二乘法3-1．基本符号样本平均 1111,nnt tt t X X Y Ynn====∑∑偏离样本平均的平方和 ()22222111nnnxttt t t t S xXXX nX=====-=-∑∑∑；()22222111nnnytttt t t S y YYYnY =====-=-∑∑∑()()111nnnxy tt ttt t t t t S xy XXYYX Y nX Y =====--=-∑∑∑其中，,t t t t x X X y Y Y =-=-，小写代表偏离样本平均的程度，即偏差。

偏差有以下重要性质：()110nnttt t xXX===-=∑∑； ()110nnt tt t y YY===-=∑∑证明：()121nt n t X X X X X X X X =-=-+-++-∑1nt t X nX ==-∑111nnt t t t X n X n==⎛⎫=-⎪⎝⎭∑∑=0 我们可以同样证明10nt t y ==∑。

下面我们再看看()222211nnxtt t t S XXX nX ===-=-∑∑。

()()2222112nnxttt t t S XXXX X X===-=-+∑∑22112nntt t t XXX nX ===-+∑∑()2212ntt XX nX nX==-+∑221nt t X nX ==-∑我们用同样的方法可以求出2,y xy S S 。

3-2．最小二乘原理我们定义Y X αβ=+的推定线为ˆˆˆYX αβ=+，其中ˆY 和ˆˆ,αβ分别代表Y 和,αβ的推定值，∧读为ha.to 。

当t X X =时，ˆˆˆt t Y X αβ=+。

观察值t Y 与推定值ˆt Y 之间的差，我们称之为残差(residual)。

在图中，用垂直于横轴的线段t e 来表示。

即，ˆˆˆt t t t t e Y Y Y X αβ=-=--，te 代表观察时点t 时，观察值与推定值的不一致的程度。

为了评价所有的观察时点1,2,,t n = ，的不一致程度，我们用()2211ˆˆnntttt t e YX αβ===--∑∑作为衡量的尺度。

()2211ˆˆnntt tt t e Y X αβ===--∑∑我们把21nt t e =∑称为残差平方和(residual sum ofsquares,RSS)。

但是我们不能用1n t t e =∑，31ntt e =∑和51nt t e =∑作为衡量不一致程度的工具。

因为与观察值无关，只要给出足够大的ˆˆ,αβ，1nt t e =∑，31nt t e =∑和51ntt e =∑可以任意地变小。

也就是说它们没有最小值。

但是，21ntt e =∑ 确不一样。

21ntt e =∑的值与ˆˆ,αβ有关。

所以我们只要找到使得21nt t e =∑最小的ˆˆ,αβ最为,αβ的推定值。

这就是最小二乘法。

3-3．最小二乘推定量的导出对于模型,1,2,,t t t Y X u t n αβ=++= 来说，,αβ的最小二乘推定量为ˆˆ,αβ，它们是使得残差平方和()2211ˆˆnnt ttt t e YX αβ===--∑∑最小的,αβ的推定值。

()()垐垐t t t t Y X Y Y X X Y X αββαβ--=---+--()垐ˆtt yx Y X βαβ=-+-- 两边平方 2ˆˆ()t tY X αβ-- ()()()2222垐垐垐垐 222tt t t t t y x Y Xx y y Y x Y X βαββαββαβ=++---+----- ()21ˆˆnttt YX αβ=--∑()()()222211111垐垐垐垐 222nnnnntt t tt tt t t t t y x n Y Xx y Y y Y X xβαββαββαβ======++---+-----∑∑∑∑∑前面我们曾经提到10nt t e ==∑，进一步我们可以得到110,0nnt t t t x y ====∑∑，()21ˆˆnt tt Y X αβ=--∑()2222111垐 ˆ2nnntt t t t t t y x n Y X x y βαββ====++---∑∑∑我们用偏差平方和的写法把上面的残差平方和再重新改写一下，()21ˆˆnt tt Y X αβ=--∑()2222垐 ˆ2yx xyS S n Y X S βαββ=++--- ()2222垐 ˆ2y x xyS S n Y X S βαββ=++--- ()22222垐ˆxy xy x yx x S S n Y X S S S S αββ⎛⎫⎛⎫=--+-+- ⎪ ⎪ ⎪⎝⎭⎝⎭上式的右侧第三项中不含有ˆˆ,αβ，所以第三项不会随着ˆˆ,αβ的变化而变化。

第一项和第二项由都是平方的形式，因此只要第一项和第二项同时为0的是时候，残差平方和就为最小，也就是残差平方和为0。

()2ˆˆ0Y X αβ--= 2ˆ0xy x x S S S β⎛⎫-= ⎪⎝⎭这种求最小二乘推定量方法的优点是，不需要使用偏微分方法，也不需要讨论为使残差平方和最小而必须满足的二次条件。

4. 最小二乘回归线我们把ˆˆˆt tY X αβ=+称为最小二乘回归线或样本回归线。

我们把ˆˆY X αβ=-代入样本回归线中，我们发现 ()垐 ˆt t tY Y X X Y X X βββ=-+=+-，由此我们可以判断样本回归线经过样本平均点(),X Y 。

5. 练习题1). 使用下面的数据，用最小二乘法估计模型Y X u αβ=++。

X 6 11 17 8 13 Y13524。

第一种方法： x 6 11 17 8 13 55 sum(x) y1 352415 sum(y)xy 633 85 16 52 192 sum(xy)xx 36 121 289 64 169 679 sum(xx) ()2251925515135ˆ0.36556795555370n XY X Yn XX β-⨯-⨯====⨯-⨯-∑∑∑∑∑;ˆˆY Xnβα-=∑∑=-1.01另外一种求法：先求出均值,X Y ；求出small x,y;再求出2,,,x y x y x ∑∑∑∑；2垐ˆ;xy YX xβαβ==-∑∑；。

e商务文档

计量经济学讲义-3--第一章线性回归基础

相关文档推荐：

e商务文档

计量经济学讲义-3--第一章 线性回归基础

相关文档推荐：

计量经济学讲义-3--第一章线性回归基础