当前位置:文档之家› 计量经济学重点笔记第三讲样本

计量经济学重点笔记第三讲样本

第三讲 假设检验
一、 经典线性模型假定
对于模型01i i
i y x ββε=++, 利用OLS 有: 112()ˆ()
i i i x x x x εββ-=+-∑∑ 其证明可参见第二讲附录。

在高斯-马尔科夫假定下, OLS 估计量的抽样分布完全取决于误差项的分布。

在高斯-马尔科夫假定中, 我们要求误差项是序列无关与同方差的。

现在, 我们施加更强的假定, 即误差项服从正态分布, 即2(0,)i N δε。

应该注意到, 当误差项服从正态分布时, 序列无关与独立性是等价的。

因此, 我们能够把
上述分布假设写为: ..2(0,)i i d
i N δε, 即误差项服从独立同正态分布。

为什么
要施加更强的假定呢? 这是为了进行小样本下的假设检验。

2(0,)i N δε与高斯-马尔科夫假定一起, 被称为经典线性模型假定。

在经典线性模型假定下, 能够证明, OLS 估计量是方差最小的无偏估计量( 注意此时不需要把比较范围限制在线性估计量之中, 因此该结论比高斯-马尔科夫定理更强。

施加更多的假设而得到更强结论, 这非常自然! ) 。

笔记:
1、 假设误差项服从正态分布的合理性在于, 误差项是由很多因素构成的, 当这些因素是独立同分布时, 依照中心极限定理, 那么这些因素之和应该近似
服从正态分布。

当然, 这并不意味着用正态分布来近似误差项的分布总是恰当的, 例如, 各因素或许并不同分布。

另外, 如果y 是价格这样的变量, 那么假设误差项服从正态分布是不合理的, 因为价格不可能是负数, 不过我们能够进行变量变换, 例如对价格取自然对数或者考察价格的变化率, 那么经过变量变换之后, 或许再假设误差项服从正态分布就变得合理了。

2、 如果能够对误差项是否服从正态分布进行检验, 那最好不过了。

一种常见的检验方法是Jarqe-Bera 检验, 这能够参见相关的教科书。

问题是, 尽管我们能观察到解释变量、 被解释变量的取值, 然而, 由于对参数的真实取值无法确定, 因此误差是观测不到的, 我们或许不得不利用残差来代替误差以进行相关的检验。

当然, 一个前提是残差确实是对误差的良好近似, 这进而要求, 我们对参数的估计是合理的。

3、 根据公式:
111221()()1ˆ()()i i i i i i
N x x N x x x x x x εεβββ=•--=++--∑∑∑∑ 考虑x 非随机这种简单情况, 显然, 当样本容量很大时, 只要误差项是独立同分布的( 并不需要要假定误差项服从正态分布) , 那么根据中心极限定理, 1ˆβ应该近似服从正态分布。

当然, 为了保证误差项的独立性, 抽样的随机性十分关键。

二、 利用标准正态分布作假设检验
假定01i i
i y x ββε=++是真实模型, 当然我们并不知道各参数的真实值是多少。

如果某一经济经济理论预言1ωβ=, 而现在你手中正掌握一样本, 一个问题是, 你所掌握的样本支持这个预言吗?
笔记:
由于抽样误差的存在, 1ˆβ恰好等于ω的概率很小。

然而, 即使1
ˆωβ=, 我们也不能说理论被证实, 因为计量经济学方法本质上是属于归纳法, 而且由于其结论是基于某一样本而得到的, 因此它还是属于不完全归纳, 故, 计量经济学不能证实经济学理论。

当然, 计量经济学也不能推翻经济学理论。

经济学理论是逻辑推导, 其正确与否需要从逻辑入手。

总而言之, 我们能够说的是”样本
是否支持某个理论的预言”或者”样本与某个理论的预言是否一致”。

在经典线性模型假定下, 1121ˆˆ(,)N βββδ~或者
111ˆˆ()/()(0,1)sd N βββ-~①, 其中122ˆ2()i x x βδδ=
-∑
,
1
ˆ()sd β=。

练习: 确定0
ˆβ的分布。

现在, 假设经济理论的预言是正确的, 那么针对特定的样本你将得到标准正态分布图横坐标上的一个点: 11
ˆˆ()/()sd βωβ-②。

现在来考察标准正态分布。

在该分布上, 存在对称的两点: 0.025z 与0.025z -, 其中:
0.0250.025Pr()Pr()0.025Z z Z z ≥=≤-=
如果把概率为5%的事件称为小概率事件, 那么, 当
11ˆˆ()/()sd βωβ-的取
①定义111
ˆˆz ()/()sd βββ=-, 则z 就是所谓的z 统计量。

估计量是用来估计真实参数的, 而统计量是用来做统计推断(或者假设检验) 的; 统计量是随机的, 其分布也被称为抽样分布, 针对特定样本, 我们得到统计量值, 它是非随机的。

②在这里, 该式是非随机的, 而特别应该注意的是, 分子中的1
ˆβ是估计值, 而分母中的1
ˆβ是估计量。

估计值的标准差是零! 。

值大于0.025z 或者小于0.025z -时, 我们认为小概率事件发生了! 小概率事件一般是不容易发生的, 现在居然发生了, 因此, 我们应该怀疑上述经济理论所作出的预言。

笔记:
举一个生活中的例子。

我预先认为某一个同学十分优秀。

优秀学生某一次考试考砸了非常正常, 然而连续十次考试考砸了就应该是小概率事件了。

如果我预先所认为的那一个优秀同学确实连续十次考试都考砸了, 我是不是应该对我的先验判断产生怀疑? 当然, 如果我就此认为那一个同学并不优秀, 我也会犯错误, 此即”第一类错误”, 即”弃真”的错误。

但犯这个错误的概率是很小的。

如果优秀学生连续十次考试考砸了其概率是5%, 那么我犯”第一类错误”的概率就是5%。

问题是, 为什么我们取正态分布两端的区间作为小概率区间呢? 为什么我们不在正态分布密度曲线中随意取一小段作为小概率区间?
从直觉上看, 当1ωβ=这个假设为真时, 即使估计值1
ˆβ与ω完全相等不太可能, 但估计值1
ˆβ应该接近于ω。

然而我们也要注意到, 正确1β估计还存在精确性问题, 这经过
1ˆβ统计量的标准差体现出来。

也就是说, 在原假设为真时, 即使估计值1ˆβ与ω有一定的差异, 然而如果1
ˆ()sd β较大, 那么在1
ˆβ与ω间存在一定的可能是正常的。

不过总的来看, 当原假设为真时, z 统计量值是应该接近于0的, 这要么是因为11
ˆˆ()/()z sd βωβ=-中的分子确实接近于0, 要么是因为尽管1ˆβ与ω有一定的差异, 但主要是由1
ˆ()sd β较
大所引起的。

当z 统计量值与0具有较大差异时, 那么
1ωβ=这个假设的真实
性是值得怀疑的!
假设检验的正式步骤是:
( 1) 建立原假设与备择假设: 0111::H H βω
βω
=≠
笔记: 原假设与备择假设互斥; 假设体系应该是完备的, 即原假设与备择假设两者之一必为真, 但两者不能同时为真。

( 2) 确定小概率标准a 。

经常我们把1%、 5%或者10%作为小概率标准。

对a 更加正式的称呼是”显著水平”。

( 3) 考察统计量值11
ˆˆ()/()sd βωβ-是否落在拒绝域: /2/2(,][,)a a z z -∞-⋃+∞之内。

如果落在上述区间之内, 那么在a 显著水平上, 我们拒绝原假设, 接受备择假设; 反之, 我们不拒绝原假设, 拒绝备择假设。

笔记:
1、 为什么当统计量值落在拒绝域/2/2(,][,)a a z z -∞-⋃+∞之外时我们说”不拒绝原假设”而不是说”接受原假设”? 其解释是: 我们能够作出很多的原假设, 例如11βω=或者12βω=而我们所计算出来的一些统计量值恰
好都落在/2/2(,][,)a a z z -∞-⋃+∞之外, 难道我们既接受1
1βω=也接受12βω=? 显然更恰当的表示方式是, 即不拒绝11βω=也不拒绝12βω=。

相关主题