计量经济学第二章
计量
13
总体回归线和总体回归函数
E(y|x) = 0 + 1x
y
x
对于实际的经济问题,通常无法掌握所有总体单位的数值, 总体回归函数实际上是理论上存在,又称理论回归方程
计量
14
样本回归方程
• 通过对样本观测获得的信息去估计总体回归函数
• 如果变量x和y之间存在线性相关关系,对于任意
抽取的若干个观测(样本)点(
i 1
n
xi yi y ˆ1x ˆ1xi 0
i 1
n
n
xi yi y ˆ1 xi xi x
i 1
i 1
n
n
xi x yi y ˆ1 xi x 2
i 1
i 1
计量
23
易得:
n
xi x yi y ˆ1 i 1 n xi x 2
• 拟合值的样本均值与 yi 的均值相等
yˆi yi
• 拟合值与残差之间的样本协方差为0
cov(yˆi , uˆi ) 0
计量
29
拟合优度
• 定义
– 总平方和SST
•
yi y 2
– 解释平方和SSE
• yˆi y 2
– 残差平方和SSR
•
uˆi2
计量
30
拟合优度
yi ˆ0 ˆ1xi ei
xi, yi ), 有
称为样本回归模型
• 由两部分组成 :系统分量和随机分量
系统分量 yˆi ˆ0 ˆ1 xi
样本回归函数与总体回归函数的区别
• 总体回归函数虽然未知,但它是确定的 (PRF唯一) ;
• 样本回归线随抽样波动而变化,每次抽样都 能获得一个样本,就可以拟合一条样本回归 线,(SRF不唯一);
•x能否来解释y的变化?x和y存在着怎样的 相关关系 ? •既然两个变量间没有一个确切的依存关 系,应该如何考虑x以外的其他因素对y的 影响? •如何确定是在其他条件不变的情况下描 述x和y的关系形式?
计量
5
简单回归模型的定义——该公 式的不足
计量
6
简单回归模型的定义——该公式 的假设
要使得 1 固定,需要施加一个约束:
2000 1312 1340 1400
每 1548 月 1688 家 1738 庭 1800 消 1902 费 支 出 Y
1591 E(Y Xi )
每月家庭可支配收入X
2500 1530 1619 1713 1750 1814 1985 2041 2186 2200 2312
1915
3000
1631 1726 1786 1835 1885 1943 2037 2078 2179 2298 2316 2387 2498 2689 2092
E( y xi ) 0 1xi
yi 0 1xi ui
样本回归函数 yˆi ˆ 0 ˆ1 xi yi ˆ 0 ˆ1 xi ei
如果能够通过某种方式获得
ˆ
和
1
ˆ
0的数值,显然:
●ˆ1 和 ˆ 0是对总体回归函数参数 1和 0 的估计
● yˆ i 是对总体条件期望 E(y xi ) 的估计
• SST=SSE+SSR的证明
yi y 2 yi yˆi yˆi y 2 uˆi yˆi y 2
uˆi2 2 uˆi yˆi y yˆi y 2 SSR 2 uˆi yˆi y SSE 又因为 uˆi yˆi y 0,所以得证
E(u | xi ) E(u) 0
表明: •u中不包含系统性的影响因素,既没有变 量遗漏问题,解释变量也不存在系统的测 量误差,模型函数形式设定正确。 •u均值独立于解释变量
spring 2012
计量
7
随机变量x和u不相关的三个层次:
• “独立”:意味着对于x 、y和的任意可测函
f (x)数 g(u)和
ˆ0 y ˆ1x
•由此估计出的 (OLSE)
ˆ0
和
ˆ1
称为参数的最小二乘估计量
•除了OLS以外,参数估计的方法还有最大似然估计
(ML)方法、矩估计方法(MM)等
基于条件期望为0的普通最小二乘法的推导
• 由E(u)=0 得E(y – 0 – 1x) = 0
对于给定的数据样本,有
计量
34
在简单回归中加入非线性因素
• 非线性因素的必要性:线性关系并不适合 所有的经济学运用
• 通过对因变量和自变量进行恰当的定义, 我们可以在简单回归分析中非常容易地处 理许多y和x之间的非线性关系
– 例子:工资—教育模型,
计量
35
自然对数形式
计量
36
•变量非线性模型中的斜率:
线性模型
边际贡献
线性---对数模型
半弹性
对数---线性模型
半弹性
• 为正,则回归线低估了 yi ;为负则回归线高 估了 yi ;无数据点是必须在回归线上。
OLS统计量的代数性质
• OLS残差和及其样本均值均为零
n
– 代数表示
uˆi 0
i 1
– 由OLS的一阶条件得出
n
n1 yi ˆ0 ˆ1xi 0
i 1
计量
27
OLSE的代数性质
• 回归元和OLS残差的样本协方差为零– 代数表示 – 由OFra bibliotekS的一阶条件得出
n
xiuˆi 0
i 1
n
n 1 xi y i ˆ0 ˆ1xi 0
i 1
计量
28
OLSE的代数性质
• OLS回归线过样本几何中心 (x ,y )
– 代数表示 y ˆ0 ˆ1x
4500
2277 2388 2526 2681 2887 3050 3189 3353 3534 3710 3834
5000
2469 2889 3090 3156 3300 3321 3654 3842 4074 4165
3039 3396
5500
2924 3338 3650 3802 4087 4298 4312 4413
,c有ov[g(u), f (x)] = 0
• “均值独立”:意味着cov[u, f (x)] = 0
• “线性无关”:意味着cov(u, x) = 0
spring 2012
计量
9
简单回归模型的定义——该公式 的假设
y
f(y)
.
.
E(y|x) = 0 + 1x
x1
x2
计量
10
假如已知由100个家庭构成的总体的数据 (单位:元)
i 1
n
在假设前提 xi
x 2
0下
i 1
ˆ0 y ˆ1x
计量
24
2.3 OLS的操作技巧
•拟合值与残差 •OLSE的代数性质 •拟合优度
计量
25
拟合值和残差
• 拟合值:定义y在x= xi 的拟合值为
yˆi ˆ0 ˆ1xi
• 残差:观察值 yi 与其拟合值的差。 uˆi yi ˆ0 ˆ1xi
3500
1843 1974 2006 2265 2367 2485 2515 2689 2713 2898 2923 3053 3187 3286 2586
4000 2037 2210 2325 2419 2522 2665 2799 2887 2913 3038 3167 3310 3510
2754
• 改变度量单位对OLS统计量的影响 • 在简单回归中加入非线性因素 • “线性”回归的含义
计量
33
改变度量单位对OLS统计量的影响
• 0 、1 的计量单位 0 、 1 的经济含义是什么?
• X单位改变,y不变,影响 1 ,不影响 0 y单位改变,不管X是否变化,影响 0 、 1
• 如果定义roedec = roe/100,那么样本回归线将会从 (estimated salary)=963.191 + 18.501roe改变到 (estimated salary)=963.191 + 1850.1roedec
第二章 简单回归模型
• 简单回归模型的定义 • 普通最小二乘法的推导 • OLS的操作技巧 • 度量单位的函数形式 • OLS估计量的期望值和方差 • 过原点回归
计量
1
2.1 简单回归模型的定义
• 回归模型的基本形式:
y f (x) u
• 简单回归模型的基本形式:
y 0 1x u
可得
n
n1 yi ˆ0 ˆ1xi 0
i 1
y ˆ0 ˆ1x
ˆ0 y ˆ1x
• 由cov(x,u)=E(xu)=0 得E[x(y – 0 – 1x)] = 0
对于给定的数据样本,有
n
n1 xi yi ˆ0 ˆ1xi 0
称为一元线性总体回归模型。
简单回归模型的定义
• 简单回归模型定义的几个讨论
– 公式变量与参数的解释 – 用x解释y时面临的三个问题 – 该公式的不足 – 该公式的假设
计量
3
简单回归模型的定义——公式变 量与参数的解释
• Y:被称为因变量(dependent variable)、被解 释变量、被预测变量、回归子
( yi ˆ0 ˆ1xi ) 0 ( yi ˆ0 ˆ1xi )xi 0
即 ˆ0、 ˆ1应满足下列方程组:
( yi ˆ0 ˆ1xi ) 0