当前位置:文档之家› 计量经济学的三种检验

计量经济学的三种检验

• 用统计学语言,称为非共线性或非多重 共线性。
• 非完全共线性是指变量不能完全表示为 其他变量的完全线性函数。
• 违反假定:多重共线性
8
完全多重共线性
• 完全共线性(Perfect collinearity)的例子 :
– X1 X2 X3 – 10 50 52 – 15 75 75 – 18 90 97 – 24 120 129 – X1 和 X2 是完全线性相关的:
计量经济学检验
一、多重共线性 二、异方差 三、自相关
1
一:多重共线性 • 多重共线性的性质 • 多重共线性的原因 • 多重共线性的后果 • 多重共线性的诊断 • 多重共线性的补救措施
2
回顾多元线性回归模型的若干假定 • 零均值假定 • 同方差假定 • 无自相关假定 • 随机项与自变量不相关 • 非多重共线性
• X2 = 5X1
9
完全多重共线性
• 若X2 = 5X1 • 将其代入Y’=b0 ’ +b1 ’ X1+b2 ’ X2 +b3 ’ X3
Y’=b0 ’ +b1 ’ X1 +b2 ’ * 5X1 +b3 ’ X3 = b0 ’ +(b1 ’ + 5b2 ’ ) X1 +b3 ’
X3 = b0 ’ +A X1 +b3 ’ X3
• 三变量模型 • 无法从A值中得到b1 ’ 、b2’的值
10
接近完全多重共线性的情形 • 多重共线性是一个极端的情形 • 在实际中,很少遇到完全多重共线性的情
况,常常是接近或高度多重共线性。亦即 解释变量是接近线性相关的。 • 例:《widget》教科书
11
问题
• 多重共线性的性质是什么? • 多重共线性产生的原因是什么? • 多重共线性的理论后果是什么? • 多重共线性的实际后果是什么? • 在实际中,如何发现多重共线性? • 消除多重共线性的弥补措施有哪些?
• 置信区间变宽。 • t值不显著, R2较高。 • OLS估计量及其标准差对数据的微小变
化非常敏感,也就是说它们趋于不稳定。 • 回归系数符号有误。 • 难以衡量各个解释变量对回归平方和
(ESS)或R2的贡献。
21
例:消费函数
• 消费函数的结果:
– Y = 24.77 + 0.94X1 - 0.04X2 – t (3.67) (1.14) (-0.53) – R2=0.96, F = 92.40 – X1 是收入 – X2 是财富 – 高的 R2 表明收入和财富可以解释消费变化
的96%
22
结果分析
• 没有任何一个斜率系数是显著的。 • 财富变量的符号是错误的。 • 高的 F 值意味着系数都等于0的联合假设不
成立
– 两个变量是如此地高度相关,以至于不能将二 者的效应分离出来。
23
例:消费函数 • 如果将 X2 对 X1 回归,得到:
17
注意
• 无偏性是一个重复抽样的性质,即:保持X 不变,如果得到一些样本并用OLS计算这 些样本估计量,则其平均值收敛于估计量 的真实值。但这并不是某个样本估计值的 性质,在现实中,我们经常无法得到大量 的重复样本。
18
注意 • 接近共线性并未破坏最小二乘估计量的最
小方差性:在所有线性无偏估计量中, OLS估计量的方差最小。 • 最小方差并不意味着方差值本身也比较小。
5
假定3
• 无自相关假定: • Cov(ui, uj)=0, i ≠ j, i,j=1,2…..n • 表明任意两次观测的ui, uj是不相关的,
即u在某次的观测值与任何其它次观测中 的值互不影响,称为无序列相关性。 • 等方差性和无序列相关性称为高斯—马 尔柯夫(Gauss-Markov)假定。 • 违反假定:自相关
19
注意
• 即使变量总体之间不线性相关,但却可 能与某一样本线性相关
• 多重共线性本质上是一个样本(回归) 现象。
• 原因:大多数经济数据不是通过试验获 得。如:国民生产总值、价格、失业率、 利润、红利等,是以其实际发生值为依 据,而并非试验得到。
20
多重共线性的实际后果
• OLS估计量的方差和标准差较大。也就 是说,OLS估计量的精确度下降。
12
多重共线性的性质
• 可以获得原始系数的一个线性组合的估 计值。
• 当解释变量之间存在完全线性相关或完 全多重共线性时,不可能获得所有参数 的唯一估计值。
• 既然我们不能获得它们的唯一估计值, 也就不能根据某一样本做任何统计推论 (也即假设检验)
13
多重共线性的原因
• 例:消费函数 • Y = b0 + b1X1 + b2X2 • X1 = income ; X2 = wealth
6
假定4 • 随机项与自变量不相关: • Cov(ui, x1i)=0; Cov(ui, x2i)=0 • 区分随机项u与每个自变量各自对y的影响。 • 如果x是非随机变量,即x是在重复抽样中
取某固定值,该条件自然满足。
7
假定5
• 解释变量之间不存在线性相关关系,即 任意两个解释变量之间线性的原因
• 模型设定:
– 例: 在模型中加入多项式项,特别是当X的取 值范围很小的时候。
• 变量之间有共同的时间趋势 • 模型的过定( overdetermined)
– 解释变量的数目多于观测的数目。
16
多重共线性的理论后果 • 在存在高度多重共线性的情形下,即使多
元回归方程的一个或者多个偏回归系数是 统计不显著的,普通最小二乘估计量仍然 是最优线性无偏估计量。
3
假定1 • 零均值假定:E(ui)=0,i=1,2,….n • 对X1 ,X2的每个观测值,u可以取不同的值,
考虑u的所有可能值,它们的总体平均值 (期望值)等于0。
4
假定2 • 同方差假定:Var(ui)= σ u 2, i=1,2,…n • 上式表明,各次观测值中u具有相同的方差,
即各次观测所受到的随机影响的程度相同, 称为等方差性。 • 违反假定:异方差
X2 = 5X1 Y = b0 + b1X1 + b2 5X1 Y = b0 + (b1 + 5b2)X1
14
多重共线性的原因
• 所用的数据收集方法
– 例:在X的一个限定的范围内抽样
• 有关被抽样总体的约束:
– 例:具有高收入的人倾向于有更多的财富
• 也许有关低收入的富有的人和高收入的没钱人的 数据不够充足。
相关主题