多元回归分析:推断
线性性 无偏性 方差
ˆ j 服从正态分布
ˆ j 的期望为j
Var(ˆ j
)
=
σ2 SSTj (1-
R2j )
定理4.1:
CLM假定下,以自变量x为条件,有
ˆj N[ j , Var(ˆj )]
ˆ j j Var(ˆ j )
ˆ j j sd(ˆ j )
N (0,1)
检验单参数假设:t检验
➢ Z检验
第四章 多元回归分析:推断
受教育年限与每小时工资 yˆ 0.0144 0.7241x
如果受教育年限的单位为月
yˆ 0.0144 (0.7241/12)(12x) 0.0144 0.0603z
如果受教育年限的单位为日 yˆ 0.0144 (0.7241/ 365)(365x) 0.0144 0.0020w
)
备择假设双侧:
H1: j0两侧都是拒绝域。源自ˆ j j se(ˆ j )
t(n k 1)
双侧检验的步骤:
y=0+1x1+2x2+…+kxk+u
原假设和备择假设:
H0:j=0
H1: j0
计算t统计量的值:
tˆ j
ˆ j j se(ˆ j )
ˆ j se(ˆ j
)
给定显著水平(通常为0.05),确定临界值
若 tˆj t (n k 1) ,拒绝H0,xj对y的影响是统计显著的。
若 tˆj t (n k 1) ,不能拒绝H0,xj对y的影响统计上不显著。
单侧检验和双侧检验的比较:
t统计量的计算及其数值完全相同,临界值不同;
查临界值时,t分布自由度相同,但如果显著水平为, 双侧检验使用/2,单侧检验使用;
若 tˆj t/2(n k 1),拒绝H0,xj对y的影响是统计显著的。 若 tˆj t/2(n k 1),不能拒绝H0,xj对y的影响统计上不显著。
大学GPA的决定因素
其中,括号内为对应系数的标准差。
查临界值时,t分布的自由度是多少? 哪些变量是显著的?哪些是不显著的?
➢ 单侧检验
j
(1
-
R
2 j
)
定理4.2:标准化估计量的t分布
CLM假定下,以自变量x为条件,有
ˆ j j se(ˆ j )
t(n k 1)
se(ˆ j )=
σˆ SSTj (1- R2j )
➢ 显著性检验(t检验)
原假设(null hypothesis):
H0:j=0
例子:
原假设(H0: 3=0)意味着,教育水平和工作经验
ˆ j se(ˆ j
)
给定显著水平(通常为0.05),确定临界值
若 tˆj t (n k 1) ,拒绝H0,xj对y的影响是统计显著的。 若 tˆj t (n k 1) ,不能拒绝H0,xj对y的影响统计上不显著。
若原假设和备择假设为:
H0:j=0
H1: j<0
统计量的计算相同,判定规则不同:
同样的显著水平下,单侧检验更容易拒绝原假设,得出 自变量统计显著的结论。
小时工资方程
1%显著水平下,使用单侧检验,exper统计上显著吗? 1%显著水平下,使用双侧检验,exper统计上显著吗?
学生成绩与学校规模
enroll符号与预期相符吗,统计上显著吗?
➢ 其他假设的t检验
若原假设不是 而是 应如何检验?
OLS估计量的抽样分布
高斯-马尔科夫假定
假定1:关于参数线性
y=0 + 1 x1 + 2 x2 + …+ k xk + u
假定2:随机抽样 假定3:不存在完全共线性 假定4:零条件均值
E(u|x1, x2 , … , xk ) = 0 假定5:同方差性
Var(u|x1 , … , xk ) =2
受教育年限与每小时工资
yi 0 1xi ui
零假设与备择假设
ˆ j j sd(ˆ j )
H0:1=0
H1: 10
构造统计量
N (0,1)
Z ˆ1 1
ˆ1
~ N (0,1)
xi2
xi2
0
➢ Z检验与t检验
ˆ j j sd(ˆ j )
N (0,1)
sd(ˆ j ) =
σ
SST
OLS估计量是BULUE 线性性、无偏性、最小方差性
CLM假定
高斯-马尔科夫假定 假定6:正态性
u ~ N(0,2)
CLM假定下,y的条件分布:
y=0+1x1+2x2+…+kxk+u y|x ~ N(0+1x1+2x2+…+kxk,2)
在CLM假定下,OLS估计量 ˆ j的抽样分布是什么?
相同时,男性和女性的工资没有差异。
log(wage)= 0+1 educ+2exper+3female+u
对于一元回归,斜率系数的显著性检验:
y=0+1x +u 原假设(H0: 1=0)意味着什么?
原假设与备择假设(alternative hypothesis) 如原假设不成立,该如何:
双侧备择假设:
H0:j=0
H1: j0
相应的检验为双侧检验(two-tailed test) 单侧备择假设:
H0:j=0
或者
H1: j>0
H0:j=0
H1: j<0
相应的检验为单侧检验(one-tailed test)
➢ 双侧检验
若原假设成立:
j=0
tˆ j
ˆ j j se(ˆ j )
ˆ j se(ˆ
j
双
侧
检 验
-t0.025
p/2
p值>0.05,接受原假设
0t
t0.025 t(n-k-1)
-t0.025
p值<0.05,拒绝原假设
p/2
0
t0.025 t t(n-k-1)
H0:j=0
H1: j>0
p
单
p值>0.05,接受原假设
侧
t(n-k-1)
检
0 t t0.05
验
p值<0.05,拒绝原假设
H0:j=0 H0:j=1
t
ˆ j j se(ˆ j )
ˆ j 1 se(ˆ j )
t
估计值 假设值 标准误
具体的判断准则,与显著性检验完全相同
校园犯罪与注册人数
log(crime)= 0+1 log(eroll)+u
模型估计结果:
1统计上显著大于1吗?
➢ t检验的p值
给定t统计量的值,能拒绝原假设的最小显著水平是多少?
若原假设成立:
j=0
tˆ j
ˆ j j se(ˆ j )
ˆ j se(ˆ
j
)
备择假设:
H1: j>0
右侧是拒绝域。
备择假设:
H1: j<0
左侧是拒绝域。
检验步骤:
y=0+1x1+2x2+…+kxk+u
原假设和备择假设:
H0:j=0
H1: j>0
计算t统计量的值:
tˆ j
ˆ j j se(ˆ j )