当前位置:文档之家› stata中级计量经济学多元线性模型设定和估计

stata中级计量经济学多元线性模型设定和估计

– 测量误差,如资本存量、受教育程度; – 经济理论有定义,现实无可观测的对应,如永
久收入。
•…
2019/12/27
4
例:工资与受教育程度
一个简单的回归模型可以表示为:
earnings 1 2education
earnings=2 education,2表示其他因素不变时 =0 教育对收
础设施等
– 我们假设样本中每一个观测值都是由如下过程生成的:
yi xi11 xi22 xiK K i
yi的观测值为一个确定性部分与一个随机性部分
之和。
i
扰动项(误差项)ε
• 随机扰动项因“扰动”了原本稳定的关系 而得名:
– 无法包含所有可能产生影响的因素,被忽略的 以误差项表示;
yi的观测值为一个确定性部分和一个随机性部分
之和。
i
经典线性模型的假定(CLM)
线性: y=Xβ+ ε ,或对某单个观测 yi xiβ i
满秩(可识别):不存在任何自变量之间的完全线性关系, 否则参数是不可识别的。
零条件期望(严格外生性):E[εi |X]=0。样本中第i次观 测到的干扰的期望值,不是任何一次观测到的自变量的函 数。也就是说自变量不能为预测干扰项提供信息。并且
超越对数函数通常认为是对未知函数的二阶近似。
首先,将函数写成y = g x1, , xK ,基于一个简单变换,xk exp ln xk 将原函数变化为ln y f ln x1, ln xK
将上述函数在点x 1,1,...,1 处进行二阶泰勒展开,于是:
ln y f 0
测不到的概念上进行试验。
2019/12/27
5
矩阵标注*
用矩阵形式可将线性回归表示为:
y = Xβ + ε
y1 x11 x12
y


y2



x21

x22

yn


xn1
xn 2
=x11 xK K ε
=Xβ ε
x1K 1 1
K
k 1 k
ln
xk

1 2
K k 1
K
l 1 kl
ln
xk
ln
xl

2019/12/27
9
例:工资方程
logWAGEi 0 1Si 2TENUREi 3EXPERi i
• 其中,WAGE=工资率;S=接受教育年限,TENURE=当前工 作岗位的持续年限,EXPER=劳动经验(即当前与以往的工 作总年限)。该方程满足线性形式,y=log(WAGE)。因变 量取对数形式,称为“半对数形式”,该方程是通过下述 的工资率水平与自变量的非线性关系得到的:
线性回归模型可以解释为对某种未知函数关系的一种近似。
根据泰勒级数近似方法,将y f x在x0处进行一阶泰勒展开: y f x f x0 f x0 x x0 f x0 x0 f x0 f x0 x x
E[εi ]=EX[E[εi |X]]=0.
球形干扰:同方差和无自相关 vari | X 2 ,cov i, j | X 0,i j 正态性:干扰项服从均值为0和方差为常数的正态分布,
ε | X ~ N 0, 2I
注:除非特殊情况确定不含截距,否则X的第一列都是1.
入的影响。
一般随着年纪的增加,收入提高。加入年纪的影响:
earnings 1 2education 3age 2和3表示什么意思呢? 许多事实表明,收入增长的速度在后期比初期要慢,再扩展为:
earnings 1 2education 3age 4age2 2、3和4表示什么意思呢? 多元线性回归的一个关键特点,是能够容许我们进行在数据中观
x2 K



2



2


xnK



K


n

注,约定的表示方法:
x : 表示一个变量;x : 表示一个 列向量;X : 表示一个矩阵
x k 表示第k 个变量; xi表示第i个观测形成的列向量,也就是说xi表示X的一行。
类似的,用yi xiβ i,i 1, 2, , n,表示模型对应的单独观测值。
2019/12/27
7
回归模型的线性形式
• 注意,线性是指 参数和干扰项进入方程的形式, 而 不是指变量之间的关系。
• E[y|x] = 1 f1(…) + 2 f2(…) + … + K fK(…). fk() 可以是数据的任何函数.例如:
简单线性模型:y = X 二次多项式模型:y 1x 2x2
经典线性模型:设定和估计
2019/12/27
1
主要内容
• 经典线性回归模型
– 假设 – 设定 – 估计
• 数据问题:多重共线性、缺失、异常值 • 线性估计的软件操作 • 主要基于鲍姆第四章内容和Greene第2,3,
4章的部分内容。
2019/12/27
2
பைடு நூலகம்
1.1 经典线性回归模型
• 多元线性回归可以表示“其他条件不变时,自变量对因变量的偏效
K
k 1
f
/ ln xk |ln x0 ln xk
+ 1 2
K k 1
K l 1
f
2

/ ln xk ln xl |ln x0 ln xk ln xl
这个函数及其导数在ln x 0处是常数,因此,可以整理成
ln y=0
对数线性常弹性模型:lny 0 kk lnxk
半对数模型:lny 0 1x t ; y 0 1 lnx
超越对数模型:lny kk lnxk 1 / 2 k lkl lnxk lnxl
*例:超越对数模型
应”,通用形式为:
y f x1, x2 , , xK x11 x22 xK K
i 是未知待估参数, 是无法观测的满足一定限制条件的误差项。
• 例如:
– 对某商品的需求和收入、价格有关; – 工资方程里年龄和教育效应 – 影响经济增长的因素:资本、劳动力、人力资本、区位因素、基
相关主题