当前位置:文档之家› 计量经济学4 多元回归分析:推断

计量经济学4 多元回归分析:推断


1.701
拒绝域
Example:小时工资方程
ˆ ) 0.284 0.092educ 0.0041exp er 0.022tenure log( wage (0.104) (0.007) n 526, R 0.316
2
(0.0017)
(0.003)
标准误
ˆ ? H0 : exp er 0 ? H 0 : 0.0041 0
4.2.3 双侧对立假设
H1 : j 0 (4.12)
当经济理论(或常识)没有很好的说明j的 符号时,这是一个恰当的对立假设。即便知 道j在对立假设中的符号,采取双侧检验也 是明智的——避免根据回归方程中参数估计 值来提出对立假设。
双尾检验的拒绝法则:
tˆ c
j
(4.13)
如果在5%的显著性水平上拒绝H0并支持H1,则称 xj是统计显著的,否则称xj是统计上不显著的。
随着t分布的自由度逐渐变大,t分布会 接近标准的正态分布——df大于120, 就可以使用标准正态分布的临界值。
例子:5%的显著性水平,df=n-k-1=28,临 界值c=1.701
面积 =0.05
0
在显著性水 平是1%时 统计上显著
在显著性水 平是5%时 统计上不显著
小结:t统计量检验显著性原理
如果H0成立, P{|t|>t /2}= {|t|>t /2}是小 概率事件,如果该事 件在一次抽样中就出 现,说明假设H0值得 怀疑,应当拒绝H0
/ 2
/ 2
0
-t/2
拒绝H0
是总体未知的特征, 而且永远不会确定的 知道它们。但可以做 出假设,然后通过统 计推断来检验假设
4.2.1 定理及概念
定理 4.2 标准化估计量的t分布
在经典线性模型假定下,有
式中,k+1为总体模型中未知参数的个数。
证明:
正态分布:Y~N(μ,σ2)
标准正态分布:Z=(Y-μ)/σ~N(0,1) χ2分布:X=∑Zi2~χn2
5%的显著性水平,df=25, c=2.06
面积 =0.025
面积 =0.025
拒绝域
-2.06
0
2.06
拒绝域
Example:大学GPA的决定因素
因变量:大学GPA (colGPA);自变量:高中GPA (hsGPA),大学能力测验分数(ACT),每周缺课次 数(skipped)
ˆ 1.39 0.412hsGPA 0.015 ACT 0.083skippped colGPA (0.33) (0.094)
0.954 (1) t 0.393 <c 0.117
如此小的t统计量,几乎不需要看t分布中的临界值: 即使在很大的显著性水平上,估计的弹性也不会显著的异于-1。
4.2.5 计算t检验的P值
使用经典方法进行假设检验,需要选择一个 显著性水平。给定t统计量的观测值,能拒 绝虚拟假设的最小显著性水平是多少——这 个水平被称为检验的p值
虚拟假设:
H0 : j 0 (4.6)
兴趣所在。又叫 原假设,零假设
意味着控制了其他自变量后, xj对y没有任何局部效应。
回顾统计学中给出的正态总体的均值的假设检验 t统计量(或t比率) ˆ j tˆ j ˆ ) se( j
软件会给出
(4.7)
备择假设
4.2.2对立假设:单侧对立假设
2
(0.011)
(0.026)
n 141, R 0.234
双尾检验:5%的显著性水平,c=1.96;1% 的显著性水平,c=2.58
t hsGPA 0.412 / 0.094 4.38 2.58 t ACT 0.015 / 0.011 1.36 1.96 t skipped 0.083 / 0.026 3.19 2.58
df=404,在5%的显著性水平上,临界值为-1.65
不能拒 绝H0

enroll
0.00020 / 0.00022 0.91 >-1.65
实际上在15%的显著性水平上,c=-1.04<-0.91 也不能拒绝虚拟假设
习题4.1
变化函数形式:自变量取log
ˆ 10 207.66 21.16log(inc) 3.98log( staff ) 1.29log(enroll ) math (48.70) (4.06) (4.19) (0.69)
log( price) 0 1 log(nox) 2 log(dist ) 3rooms 4 stratio u
H 0 : 1 1 H1 : 1 1
ˆ ) 11.08 0.954log( nox) 0.134log( dist ) 0.255rooms 0.052 stratio log( price (0.32) (0.117) (0.043) (0.019) (0.006) n 506, R 2 0.581
拒绝法则:
(4.10)
tˆ c
j
(4.11)
t分布只报告正值,c一定为 正值,故-c一定为负值。
例子 5%的显著性水平,df=18,临界值c=1.734
面积 =0.05
拒绝域
-1.734
0
Example:学生表现与学校规模
一种观点认为,在所有其它条件相同的情况下, 小学校的学生比大学校的学生的情况更好些。
其中,SSTj为xj的总样本变异 SST j ( xij x j ) 2 因此,
i 1 n
ˆ ) / sd ( ˆ ) ~ N (0,1) ( j j j
证明:(仅证明β 1)
ˆ 1
rˆ y
i 1 n 2 ˆ r i1 i 1
n
i1 i
ˆi1ui 1 r
t / 2
拒绝H0
bj
接受H0
检验步骤
(1)计算 | t | (2)查表求临界值 t/2(n-k-1) (3)比较,下结论
如果 | t | ≤t/2 ,则接受H0,认为在显著性水 平为的意义下, βj 不显著; 如果| t | >t/2 ,则拒绝 H0,认为在显著性水 平为的意义下, βj 显著。
t分布:
F分布:
~tn
~Fk1,k2
ˆ ) / sd ( ˆ ) ~ N (0,1) ( j j j
SSR
2
s ˆ 2 s
ˆ ˆ s
2
~
2 n2
SSR ~ tn2 2 s ( n 2)
SSTx ~ tn2
SSTx
所谓假设检验,就是事先对总体参数或总 体分布形式作出一个假设,然后利用样本信 息来判断原假设是否合理,即判断样本信息 与原假设是否有显著差异,从而决定是否接 受或否定原假设。 假设检验采用的逻辑推理方法是反证法。 先假定原假设正确,然后根据样本信息, 观察由此假设而导致的结果是否合理,从而 判断是否接受原假设。 判断结果合理与否,是基于“小概率事件 不易发生”这一原理的。
math10 0 1inc 2 staff 3enroll u
学生通同过 密歇根教学 评价委员会 标准化十分 制数学测验 的百分比, 用来衡量学 生表现
年均 教师 工资
每千名 学生拥 有的教 职工人 数
学生注册 人数,用 来衡量学 生规模
ˆ 10 2.274 0.00046inc 0.048 staff 0.00020enroll math (6.113) (0.00010) (0.040) (0.00022) n 408, R 2 0.0541
H1 : j 0 (4.8)
并不是不关心j<0 的情形——只是基 于经济理论,对于 该研究,排除了 j<0的可能
临界值——根据显著 性水平和自由度决定 (查表可得G.2)
拒绝法则: 在 t
ˆ j
c
(4.9)
时,H0在某一显著性水平上被拒绝并支持H1
在虚拟假设正确时,
错误拒绝它的概率
{ }中的任何一个子集也都具有联合正态 分布。
4.2 检验对单个总体参数的假设:t检验
对总体模型中的某个参数的假设进行检验 总体模型: 假设它满足经典
y 0 1 x1 2 x2 k xk u
线性模型假定
(4.4)
研究如何检验那些有关某个特定的j的假设。
u ~ N (0, s )
2
4.1.2 经典线性模型假定
高斯—马尔科夫假定与正态分布假定一起被 称为经典线性模型假定
对参数而言为线性; 随机抽样性;条件均 值为0;不存在完全 共线性;同方差性 经典线性模型
总结经典线性模型假定的一种简洁方法:
在实际应用中,误差不一定具有正态性
例子:考虑劳动力市场上,工资与教育、 工作经历、在现任工作的任职年限的关系ຫໍສະໝຸດ 4.1 OLS估计量的抽样分布
已经了解了OLS估计量的期望值和方差—— 有助描述OLS估计量的精密度 要进行统计推断,还需要知道估计量的抽样 分布
4.1.1 正态性假定
样本中自变量的值既定,因而OLS估计量 的抽样分布取决于误差分布 假定MLR.6 正态性 总体误差u独立于解释变量x1,x2,…,xk, 而且服从均值为零,方差为s2的正态分布:
H 0 : exp er 0 H 1 : exp er 0

exp er
0.0041/ 0.0017 2.41
df=522,使用标准正态分布的临界值:1%的显著性水 平,c=2.326
在1%的显著性水平上是统计显著大于0的
参数小于0的单侧对立假设
H1 : j 0
相关主题