第5章多元回归分析:OLS 的渐近性5.1复习笔记考点一:一致性★★★★1.定理5.1:OLS 的一致性(1)一致性的证明当假定MLR.1~MLR.4成立时,对所有的j=0,1,2,…,k,OLS 估计量∧βj 是βj 的一致估计。
证明过程如下:将y i =β0+β1x i1+u i 代入∧β1的表达式中,便可以得到:()()()()11111111122111111ˆnni ii i i i n ni i i i xx y n x x u xxnxx ββ-==-==--==+--∑∑∑∑根据大数定律可知上式等式右边第二项中的分子和分母分别依概率收敛于总体值Cov (x 1,u)和Var(x 1)。
假定Var(x 1)≠0,因为Cov(x 1,u)=0,利用概率极限的性质可得:plim ∧β1=β1+Cov(x 1,u)/Var(x 1)=β1。
这就说明了OLS 估计量∧βj 具有一致性。
前面的论证表明,如果假定只有零相关,那么OLS 在简单回归情形中就是一致的。
在一般情形中也是这样,可以将这一点表述成一个假定。
即假定MLR.4′(零均值与零相关):对所有的j=1,2,…,k,都有E(u)=0和Cov(x j1,u)=0。
(2)MLR.4′与MLR.4的比较①MLR.4要求解释变量的任何函数都与u 无关,而MLR.4′仅要求每个x j 与u 无关(且u 在总体中均值为0)。
②在MLR.4假定下,有E(y|x 1,x 2,…,x k )=β0+β1x 1+β2x 2+…+βk x k ,可以得到解释变量对y 的平均值或期望值的偏效应;而在假定MLR.4′下,β0+β1x 1+β2x 2+…+βk x k 不一定能够代表总体回归函数,存在x j 的某些非线性函数与误差项相关的可能性。
2.推导OLS 的不一致性当误差项和x 1,x 2,…,x k 中的任何一个相关时,通常会导致所有的OLS 估计量都失去一致性,即使样本量增加也不会改善。
此时,∧β1的不一致性为:plim ∧β1-β1=Cov(x 1,u)/Var(x 1)。
因为Var(x 1)>0,所以,当x 1和u 存在正相关关系时,∧β1的不一致性就为正;而当x 1和u 负相关时,∧β1的不一致性就为负。
考点二:渐近正态和大样本推断★★★★★1.定理5.2:OLS 的渐近正态性当高斯-马尔可夫假定MLR.1~MLR.5成立时:(1)存在:)()22ˆNormal 0 aj j j a ββσ-~/,其中,σ2/a j 2>0是n 1/2(∧βj -βj )的渐近方差;斜率系数为:121ˆlim n ij i p n r -=⎛⎫⎪⎝⎭∑其中∧r ij 是x j 对其余自变量进行回归所得到的残差。
此时,称∧βj 服从渐近正态分布。
(2)∧σ2是σ2=Var(u)的一个一致估计量。
(3)对每个j,都存在:()()()ˆˆ/0,1ajjjsd Normal βββ- ()()()ˆˆ/0,1aj j jse Normal βββ- 其中,se(∧βj )是通常的OLS 标准误。
利用定理5.2,在进行假设检验时就不再必须满足正态性假定。
误差分布的唯一限制是有限方差,且误差项满足零均值和同方差。
实际上,随着自由度的变大,t n-k-1会趋近于标准正态分布,所以也可以进行t 检验。
但一般来讲,当样本量很大时,直接用正态分布检验即可。
2.其他大样本检验:拉格朗日乘数统计量包含k 个自变量的多元回归模型的形式为:y=β0+β1x 1+…+βk x k +u。
下面利用拉格朗日乘数统计量(简称LM 统计量或n-R 2统计量)检验最后q 个变量是否都具有零总体参数。
虚拟假设为:H 0:βk-q+1=0,…,βk =0,即对模型施加了q 个排除性约束。
对立假设为:这些参数中至少有一个异于零。
拉格朗日乘数检验步骤为:(1)将y 对施加限制后的自变量集进行回归,并保留残差。
即进行以下回归:011--k q k qy x x u βββ=++⋯++ (2)将上一步中所得到的残差对所有自变量进行回归,并得到R 2,记为R u 2。
(3)计算LM=nR u 2。
(4)将LM 与χq 2分布中适当的临界值c 相比较,如果LM>c,就拒绝虚拟假设。
考点三:OLS 的渐近有效性★★★★1.简单回归模型简单回归模型的形式为:y=β0+β1x 1+u。
令g(x)为x 的任意一个函数,可知u 与g(x)无关。
对所有的观测i,令z i =g(x i )。
假定g(x)和x 相关,则β1的估计量就是β1的一致估计,表达式为:()()111niii niii z z y z z xβ==-=-∑∑ 证明:将y i =β0+β1x i +u i 代入1β 表达式,得到:()()111111niii n i ii nz z un z z x ββ-=-=-=+-∑∑ 根据大数定律,分子和分母分别收敛于Cov (z,u)和Cov (z,x)。
因为当假定MLR.4成立时,Cov(z,u)=0,所以有:111(,)/(,)plim Cov z u Cov z x βββ=+= 2.含有k 个回归元的情形在k 个回归元的情形中,推广OLS 的一阶条件,可以得到一类一致估计量:()()01110,0,1,,njiii k iki g x yx x j k βββ=----==∑ 其中,g j (x i )表示第i 次观测的所有自变量的任意函数。
当g 0(x i )=1和j=1,2,…,k,g j (x i )=x ij 时,可以得到OLS 估计量。
由于使用的是x ij 的任意函数,所以估计量的种类是无限的。
3.定理5.3:OLS 的渐近有效性在高斯-马尔可夫假定下,令j β 表示形如上式方程的估计量,而∧βj 表示OLS 估计量。
则对于j=0,1,2,…,k,OLS 估计量具有最小的渐近方差,即满足:))ˆvar varj j j jββββA -≤A - 5.2课后习题详解一、习题1.在满足假定MLR.1到MLR.4的简单回归中,我们证明了斜率估计量∧β1是β1的一致估计。
利用∧β0=_y-∧β1_x 1证明:plim ∧β0=β0。
[你在使用β0=E(y)-β1E(x 1)的同时,还需要使用∧β1的一致性和大数定律。
]证明:简单模型为:y=β0+β1x 1+u 期望值是E(y)=β0+β1E(x 1)+E(u)记μy =E(y),μx =E(x 1),因为E(u)=0,故μy =β0+β1μx 移项可得β0=μy-β1μx则有∧β0=_y-∧β1_x1根据大数定律plim(_y)=μyplim(_x1)=μx又plim∧β1=β1则对∧β0=_y-∧β1_x1等式两边同时取概率极限得:plim(∧β0)=plim(_y-∧β1_x1)=plim(_y)-plim(∧β1)·plim(_x1)=μy-β1μx=β0 2.假设模型pctstck=β0+β1funds+β2risktol+u满足前四个高斯-马尔科夫假定,其中pctstck表示工人养老金投资于股票市场的百分比,funds表示工人可以选择的共同基金的个数,而risktol表示对风险承受能力的某种度量(risktol越大,则表明这个人对风险的承受能力越强)。
如果funds和risktol正相关,pctstck对funds简单回归的斜率系数1β 有怎样的不一致性?答:对风险的承受能力越强意味着在资本市场上投资的意愿更强,因此β2>0。
假定可供选择的共同基金的个数(funds)与个人承受风险的能力(ridktol)是正相关的,使用教材公式5.5可以得到δ1>0:plim(β1)=β1+β2δ1>β1因此1β 存在正的不一致性(渐进偏误)。
这个结论是合乎情理的,如果在回归中省略个人对风险的承受能力(risktol)这一变量,由于它与可选择的共同基金个数(funds)相关,因此估计出来的可选择的共同基金个数(funds)对工人养老金投资于股票市场的百分比(pctstck)的影响实际上包括了个人对风险的承受能力(risktol)对工人养老金投资于股票市场的百分比(pctstck)的影响。
3.数据集SMOKE 包含有美国成人个人随机样本在抽烟行为和其他变量方面的信息。
变量cigs 是(平均)每天抽烟的数量。
你是否认为在美国这个总体中,cigs 具有正态分布?试做解释。
答:在美国这个总体中,cigs 不具有正态分布。
大多数人不抽烟,因此对一半以上的美国人而言,cigs=0,故正态分布随机变量的概率大于零并没有特殊的意义。
另外,cigs 的分布是左偏的,而正态分布随机变量是对称的。
4.在简单回归模型(5.16)中,我们在前四个高斯-马尔科夫假定下证明了形如教材(5.17)的估计量是斜率β1的一致估计量。
给定这样一个估计量,定义β0的一个估计量为01y x ββ=- 证明00plim ββ= 证明:简单回归模型为:y=β0+β1x+u 则其期望值是:E(y)=β0+β1E(x)+E(u)记μy =E(y),μx =E(x),因为E(u)=0,故μy =β0+β1μx 移项可得β0=μy -β1μx 则01y x ββ=- 根据大数定律可知:plim(_y)=μy plim(_x)=μx 并且11plim ββ= 可得:()()()()01110plim plim plim plim plim y x y x y x βββμβμβ=-=-⋅=-= 因此()00plim ββ= 5.下面的柱状图是使用ECONMATH 数据集中的变量score 作图的。
共使用30个柱形作出柱状图,每一格的高度是落入对应区间的观测的占比。
正态分布的最佳拟合(也就是使用样本均值和样本标准差)已添加入柱状图中。
课程分数(以百分数形式)(i)如果你使用正态分布去估计score超过100的可能性,答案会是0吗?为什么你的答案会与score服从正态分布的假设相违背?(ii)解释柱状图的左尾发生了什么。
在左尾部分正态分布拟合是否良好?答:(i)答案是0。
因为z=(x-u)/(σ/n0.5)=59.82,对应的p值为0。
一半学生的分数低于平均值72.60,同时没有学生的分数超过100,因此答案与score 服从正态分布的假设相违背。
(ii)通过观察柱状图,只有很少一部分学生的分数低于60。
左尾部的正态分布拟合不好,从柱状图中可以看出,左尾部的柱形图大多高于正态分布的曲线。
二、计算机练习C1.本题使用WAGE1中的数据。
(i)估计方程wage=β0+β1educ+β2exper+β3tenure+u。