当前位置：文档之家› 多元回归分析：推断

多元回归分析：推断

线性性无偏性方差
ˆ j 服从正态分布
ˆ j 的期望为j
Var(ˆ j
)
=
σ2 SSTj (1-
R2j )
定理4.1：
CLM假定下，以自变量x为条件，有
ˆj N[ j , Var(ˆj )]
ˆ j j Var(ˆ j )
ˆ j j sd(ˆ j )
N (0,1)
检验单参数假设：t检验
➢ Z检验
第四章多元回归分析：推断
受教育年限与每小时工资 yˆ 0.0144 0.7241x
如果受教育年限的单位为月
yˆ 0.0144 (0.7241/12)(12x) 0.0144 0.0603z
如果受教育年限的单位为日 yˆ 0.0144 (0.7241/ 365)(365x) 0.0144 0.0020w
)
备择假设双侧：
H1： j0两侧都是拒绝域。源自ˆ j j se(ˆ j )
t(n k 1)
双侧检验的步骤：
y=0+1x1+2x2+…+kxk+u
原假设和备择假设：
H0：j=0
H1： j0
计算t统计量的值：
tˆ j
ˆ j j se(ˆ j )
ˆ j se(ˆ j
)
给定显著水平（通常为0.05），确定临界值
若 tˆj t (n k 1) ，拒绝H0，xj对y的影响是统计显著的。
若 tˆj t (n k 1) ，不能拒绝H0，xj对y的影响统计上不显著。
单侧检验和双侧检验的比较：
t统计量的计算及其数值完全相同，临界值不同；
查临界值时，t分布自由度相同，但如果显著水平为，双侧检验使用/2，单侧检验使用；
若 tˆj t/2(n k 1)，拒绝H0，xj对y的影响是统计显著的。若 tˆj t/2(n k 1)，不能拒绝H0，xj对y的影响统计上不显著。
大学GPA的决定因素
其中，括号内为对应系数的标准差。
查临界值时，t分布的自由度是多少？哪些变量是显著的？哪些是不显著的？
➢ 单侧检验
j
(1
-
R
2 j
)
定理4.2：标准化估计量的t分布
CLM假定下，以自变量x为条件，有
ˆ j j se(ˆ j )
t(n k 1)
se(ˆ j )=
σˆ SSTj (1- R2j )
➢ 显著性检验（t检验）
原假设（null hypothesis）：
H0：j=0
例子：
原假设（H0: 3=0）意味着，教育水平和工作经验
ˆ j se(ˆ j
)
给定显著水平（通常为0.05），确定临界值
若 tˆj t (n k 1) ，拒绝H0，xj对y的影响是统计显著的。若 tˆj t (n k 1) ，不能拒绝H0，xj对y的影响统计上不显著。
若原假设和备择假设为：
H0：j=0
H1： j<0
统计量的计算相同，判定规则不同：
同样的显著水平下，单侧检验更容易拒绝原假设，得出自变量统计显著的结论。
小时工资方程
1%显著水平下，使用单侧检验，exper统计上显著吗？ 1%显著水平下，使用双侧检验，exper统计上显著吗？
学生成绩与学校规模
enroll符号与预期相符吗，统计上显著吗？
➢ 其他假设的t检验
若原假设不是而是应如何检验？
OLS估计量的抽样分布
高斯-马尔科夫假定
假定1：关于参数线性
y=0 + 1 x1 + 2 x2 + …+ k xk + u
假定2：随机抽样假定3：不存在完全共线性假定4：零条件均值
E(u|x1, x2 , … , xk ) = 0 假定5：同方差性
Var(u|x1 , … , xk ) =2
受教育年限与每小时工资
yi 0 1xi ui
零假设与备择假设
ˆ j j sd(ˆ j )
H0：1=0
H1： 10
构造统计量
N (0,1)
Z ˆ1 1
ˆ1
~ N (0,1)
xi2
xi2
0
➢ Z检验与t检验
ˆ j j sd(ˆ j )
N (0,1)
sd(ˆ j ) =
σ
SST
OLS估计量是BULUE 线性性、无偏性、最小方差性
CLM假定
高斯-马尔科夫假定假定6：正态性
u ~ N(0,2)
CLM假定下，y的条件分布：
y=0+1x1+2x2+…+kxk+u y|x ~ N(0+1x1+2x2+…+kxk,2)
在CLM假定下，OLS估计量 ˆ j的抽样分布是什么？
相同时，男性和女性的工资没有差异。
log(wage)= 0+1 educ+2exper+3female+u
对于一元回归，斜率系数的显著性检验：
y=0+1x +u 原假设（H0: 1=0）意味着什么？
原假设与备择假设（alternative hypothesis）如原假设不成立，该如何：
双侧备择假设：
H0：j=0
H1： j0
相应的检验为双侧检验（two-tailed test) 单侧备择假设：
H0：j=0
或者
H1： j>0
H0：j=0
H1： j<0
相应的检验为单侧检验（one-tailed test)
➢ 双侧检验
若原假设成立：
j=0
tˆ j
ˆ j j se(ˆ j )
ˆ j se(ˆ
j
双
侧
检验
-t0.025
p/2
p值>0.05，接受原假设
0t
t0.025 t(n-k-1)
-t0.025
p值<0.05，拒绝原假设
p/2
0
t0.025 t t(n-k-1)
H0：j=0
H1： j>0
p
单
p值>0.05，接受原假设
侧
t(n-k-1)
检
0 t t0.05
验
p值<0.05，拒绝原假设
H0：j=0 H0：j=1
t
ˆ j j se(ˆ j )
ˆ j 1 se(ˆ j )
t
估计值假设值标准误
具体的判断准则，与显著性检验完全相同
校园犯罪与注册人数
log(crime)= 0+1 log(eroll)+u
模型估计结果：
1统计上显著大于1吗？
➢ t检验的p值
给定t统计量的值，能拒绝原假设的最小显著水平是多少？
若原假设成立：
j=0
tˆ j
ˆ j j se(ˆ j )
ˆ j se(ˆ
j
)
备择假设：
H1： j>0
右侧是拒绝域。
备择假设：
H1： j<0
左侧是拒绝域。
检验步骤：
y=0+1x1+2x2+…+kxk+u
原假设和备择假设：
H0：j=0
H1： j>0
计算t统计量的值：
tˆ j
ˆ j j se(ˆ j )

e商务文档

多元回归分析：推断

相关文档推荐：