当前位置:
文档之家› 对固定效应变面板变系数的直接半参估计
对固定效应变面板变系数的直接半参估计
这对这种情形,Henderson et al.(2008)基于轮廓似然逼近方法提出了一个迭代过程算法,Mammen等(2009)提出了通过一个平滑的后向拟合(Backfitting)算法以得到包含了时间与个体效应的可加面板模型非参数一致估计。更进一步,若 ,其中 以及 对于某些实值 和向量 ,式(1.2)的回归方程就变成了一个局部可加的半参模型:
为了能够得到这类模型中系数的一致估计量,一个可行的解决方法就是讲模型转换成一个不含有未知形式异质性的模型。具体而言,可以通过构建一个异质性变量 与d维解释变量 、q维解释变量 的协同变量有关(与其中之一或者两个变量同时相关)的线性面板模型来解决这一问题。一般形式为:
其中,函数 未知且需要估计, 为随机干扰项。显然,任何试图使用标准非参数估计方法对 进行直接估计都会得到基准曲线的非一致性估计量。造成这一结果的原因在于 。解决这类问题有一个标准的方法,就是将 通过一系列转换从式(1.1)中去除,然后通过一个非参数平滑过程来估计未知曲线。一般存在着多种去除这种非一致性效应的方法。最简单的就是一阶差分:
一、绪论
本篇论文关注于对面板模型变系数的估计。这种回归方法由一个线性回归模型组成,并基于理论,回归系数受到外生变量影响,从而被假定为变系数。例如,在所谓的教育回报问题中,针对教育水平对工资水平的影响弹性的估计问题,通过理论研究指出教育的边际回报可能会随着工作经验的不同而改变,详情可参阅Schultz(2003)。因此,在一定的教育水平条件下,工资-教育弹性可能就会随着工作经验的不同而发生变化。
在本文的实证研究中,针对可能存在的变系数函数形式误设问题,我们采用了非参数估计技术加以解决。但在大多数情况下,对于系数方程形式的估计是通过标准化手段得到的,例如样条平滑、序列估计或者局部多项式回归估计,详情可参阅Su and Ullah(2011)。尽管在绝大多数情况中,直接运用一个已有的技术就能够得到一个正确的推断结果,然而没有多少注意力被放在这些估计过程在非标准设定下的渐近特征也是事实。不幸的是,这些设定与面板数据模型的实证分析息息相关。这里有一个非常清晰的例子,在一个经济计量模型中,存在着一些无法观测的解释变量,这些变量虽然不随着时间变化,但是能够在统计角度上与模型中一些其他的解释变量存在着相关性(固定效应)。固定效应模型中存在的与一些解释变量相关的未知形式的组间异质性不是一个能够简单解决的问题。实际上,在这样的异质性问题下进行估计的计量方法都面临着所谓的附带参数问题(固定效应的可变截距项就是附带参数,会造成最大似然估计结果非一致性),详情可参阅Neyman and Scott(1948)。
三、渐近性质及有效估计量
这一章将对前文所介绍的估计结果的一些初步渐近性质进行分析。为此,设定如下假设:
假设3.1:设 为一组 随机变量,对每一个固定的t,服从独立同分布;对于每一个i,具有严格的平稳性。另,分别设 、 及 为 、 及 的概率密度函数。所有概率密度函数对于其包含的所有参数都是连续可微的且在其支撑集中任一点上都具有上下界。
假设3.2:随机扰动项 服从零均值同方差的独立同分布,且 。干扰项与任意i和t的 和 相互独立。另对于某些 , 。
为一个 维行向量。在这里,K为一个q元内核:
其中,H是一个q维正定对称的窗宽矩阵。通过式(2.9)的最小化得到一个 维列向量 。同样的,得到 和 的估计量,分别为 以及 。其中 为方程 对q维列向量z中所有元素求d阶偏导得到的 矩阵。
很容易就能够将式(2.9)最小化的解写成我们熟知的矩阵形式:
其中,
这个式子表明将通过 对 的内核(kernel?)加权回归得到 的估计量。那么,所感兴趣的量就可以通过局部加权线性回归得到。
(2.1)
这里,K为一个二元内核(kernel?),则有 ,其中对于任意u,v,有
h为一个窗宽。我们用 和 表示使式(2.1)最小化的系数的值。上述过程给出了 和 的估计量,分别为 及 。
为了将收敛速度保持在 ,我们在这里对回归方程进行变换,采用单步后向拟合算法进行估计。用 表示成如式(2.5)的形式:
将式(1.2)带入(2.5),得:
从式(2.6)中可以看出,对于 的估计是一维回归问题。因此我们可以再次使用一元内核权重的局部线性最小二乘估计方法。然而,仍存在着一些问题,由于式(2.5)中 未知,则我们需要将其替换为初试局部线性估计量,即 ,建立如下的回归模型:
到目前为止,对于 的直接非参估计都比较麻烦,具体可参阅Su and Ullah(2011)。其原因在于,对于每一组别(i),式(1.2)的条件期望值 都包含了不同期(t) 的线性组合。这可以被视为一个在不同期具有相同形式的可加性函数。
在一些特殊的情况下,本文也给出了相关问题的一致性估计方法。对于无约束模型形式 的情况,式(1.2)就能够改写为一个完全非参数可加性模型:
Qian and Wang(2012)对可加部分采用了基于一阶差分的边际积分非参估计,即 。
本文中我们所介绍的估计方法主要是将现有的估计结果推广至更为广义的变系数模型,在如式(1.1)所示的 但T保持不变的O型框架下进行研究。我们的方法是基于对可加函数 的局部近似实现的。这个思想由Yang(2002)在一篇完全不同的论文中提出。由于这个估计方法是基于局部近似特性的,所以我们在更为广义的条件下对偏差余项的特征进行研究。这个余项在标准的局部线性回归方法中被忽视(参照Fan and Gijbels 1995b),但当处理一阶差分估计时需要多加注意。实际上,正如已经由Lee and Mukherjee(2008)指出的,将对一阶差分的局部线性估计方法直接应用到面板数据模型会导致估计结果有偏,而且即使在大样本条件下,有偏性都无法去除。通过施加一个高纬度的内核权重,我们的估计方法能够克服无法消除的有偏性问题,但正如预期的,这样会增大估计方差。在Henderson等(2008)的研究中也存在着这样的现象,其最后的估计结果具有一个更大的方差。
其次,使用局部线性最小二乘内核估计的另一个重要优势在于其渐近偏差及方差的表达式比Naradaya-Watson或者其他的非参估计量的偏差与方差表达形式更为优越。特别是Fan(1993)指出的,局部线性最小二乘估计量具有非常重要的渐近大中取小性质。另外,与Naradaya-Watson或者其他非参估计量不同,(2.11)估计结果在Z的密度函数边界处的偏差与方差和在密度函数内部的具有相同的量级。这是一个非常有用的性质,因为在实际应用中,处于边界地带的样本数据可能占总样本数的较大比例。
那么, 的局部线性加权最小二乘估计量就如式(2.11)所示:
。这里 和 分别是 维和 维矩阵。
最后,对选择局部线性最小二乘估计方法做出几点说明。
首先,从式(2.11)的表达形式上可以看出,我们是通过加权最小二乘找到数据拟合平面的方式得到估计结果的,而权重的选择是基于内核及窗宽矩阵H得到的。正如Ruppert和Wand(1994)所讨论的,如果选择一个可能具有紧支撑的高斯内核,那么对 施加的权重就是一个均值为 ,具有 形式椭圆形轮廓的高斯密度函数的值。显然, 距离z越远,则被赋予的权重就越小。然而,在给定的概率密度条件下,由于H决定了这个椭圆形的大小和方向,那么也就决定了各权重的大小和符号。通常,我们用一个简化的形式替代矩阵H,即令 。对角矩阵形式的窗宽矩阵意味着前文所述的所有高斯分布的椭圆形轮廓的轴的方向均与坐标轴方向一致,而对于一般形式的矩阵H,则与H矩阵的特征向量有关。依据不同形式的 ,存在着完全窗宽矩阵更为有利的情况。
对固定效应变面板变系数的直接半参估计
摘要
在这篇论文中,我们介绍了一个用于面板模型中个体效应与解释变量之间存在着未知形式相关性情况下变系数估计的新方法。这个回归方法使用一个基于一阶差分后的局部回归对未知系数进行估计。为了避免无法忽视的渐近有偏性,我们需要引入一个更高维度的内核权重。这是我们能够以扩大变量规模,导致一个较低的收敛概率为代价去除有偏性。为了克服这个问题,我们采用了单步更新算法,这能够使得回归结果能够达到一个较高的收敛概率,同时也体现了所谓的oracle效率特征。我们还得到了渐近分布。由于回归过程是建立在对于窗宽矩阵(指除一定宽度对角线以外的元素全为0的矩阵?具体查阅非参估计)的选择上,我们还提供了一个计算计算这个矩阵的实证方法。蒙特卡洛模拟结果显示这个回归方法在有限样本情况下十分有效。
本文结构如下:第二章,我们建立计量模型并介绍估计过程;第三章,研究其渐近特征并基于此介绍一个转换过程,通过这个过程能够得到一个具有最优收敛率的有效估计量;第四章,介绍如何从实证角度估计带宽矩阵;第五章,给出了一些模拟结果;最后,第六章为结论。
二、统计模型及估计方法
为了更好的说明我们的估计方法,先从单变量模型开始,然后将估计结果扩展到多变量模型。那么,根据式(1.2)建立 的单变量模型。在这种情况下,对于任意 ,其中A为 内部一个非空闭集,将(1.2)泰勒展开:
为了能够在这种情况下保持标准的收敛率(即在不影响对有偏性约束的情况下降低估计方差),我们使用Fan and Zhang(1999)所提出的方法。其核心思想在于通过进一步的平滑处理降低方差,而且偏差余项不会因为任何平滑处理而降低。将这种思想运用到我们的估计问题中,提出一个单步后向拟合算法。由于采用可加模型,那么我们的方法能够得到一个有效估计结果。这意味着,任意一组的估计结果的协方差矩阵是渐近一致的,也就是说我们能够推断出其他组别的协方差矩阵。最后,我们还介绍了一个用来选择窗宽系数(bandwidth parameter非参估计内容,需补课)的数据驱动方法。
如前文所述,可以使用一些变换过程来去除面板模型中的异质性。据我们所知,对于模型(1.1),Sun等(2009)已经提出了一个通过所谓的虚拟变量最小二乘逼近方法得到 的估计量。他们通过如式(1.3)的替代形式对 进行估计。
其中,当i=j时 ,否则为0。基于这个模型,他们推导出一个包含了局部线性回归逼近的最小二乘方法,得到关于未知系数平滑曲线的一致估计量。与我们的方法相比,这个方法存在这一个极大的偏差余项。实际上,这个方法的有偏性来自于两处。其一,对 的局部近似,这种处理方式也存在于我们所讲要介绍的方法中;其二,未知的固定效应只能等于0,因为他们施加了一个可加性强约束—— 。这种形式的约束也被用在了Mammen(2009)中。