当前位置:文档之家› 非参数半参数模型

非参数半参数模型


Min. 1st Qu. Median 4.605 5.958 6.261 男性(对数工资)
Min. 1st Qu. Median 5.017 6.458 6.745
Mean 6.255
Mean 6.730
3rd Qu. Max. 6.562 7.279
3rd Qu. Max. 6.976 8.537
1.0
0.8
0.6
density
0.4
0.2
0.0
abline(h=) 6.22059
4.5
5.0
5.5
6.0
6.5
7.0
fw
Part 2: Projection and Regression
直方图vs核密度估计
直方图密度估计的两大局限
最优带宽h不易解决 原点的影响
即使解决了原点问题,直方图仍然有缺点
核密度估计 局部方法
核回归 局部线性回归 变系数回归 半变系数回归 部分变系数回归
全局方法
样条回归
多元非参数模型
主要内容
Part 2: Projection and Regression
Cornwell与Rupert数据
如何刻画随机变量的特征?
女性(对数)工资
1 jh f (u)du f (x) 1 jh f (u) f (x)du
h ( j1)h
h ( j1)h
f (u) f (x)在m j ( j 1 2)h处的一阶泰勒近似展开为f (u) f (x) f (m j )(u x)
从而有:E fˆh (x) f (x) f (mj )(mj x)
核函数
K(u)
1 I u 1
2
1 u I u 1
3 1 u2 I u 1
4
15 1 u2 2 I u 1
16
35 1 u2 3 I u 1
32
1 2
exp

u2 2

cos u I u 1
4 2
j
1)h,
jh],直方图的密度估计为:fˆh (x)

1 nh
n i 1
I
( xi

B
j
)
E
fˆh (x)
1 nh
nE
i 1
I (xi Bj )

1 nE nh
I (xi Bj )

1E h
I (xi Bj )
jh
E
I (xi Bj )
0.6
Density
0.4
0.4
0.2
0.2
0.0
0.0
4.5
5.0
5.5
6.0
6.5
7.0
7.5
5.0
5.5
6.0
6.5
7.0
7.5
8.0
8.5
fw
mw
核函数对核密度估计的影响是什么?
Part 2: Projection and Regression
核密度估计的统计性质
可以证明,对于对称核函数,有:
Part 2: Projection and Regression
直方图
随机样本:x1,x2,…,xn 直方图的构造
确定原点x0,将数轴分割为宽度为h的区间(bin)
Bj [x0 ( j 1)h, x0 jh], j
数出落在每个区间的观察值个数,记为nj
用nj除以n,再除以h,得到
区间内每个点有相同的密度 估计的密度函数不连续
解决方法:核密度估计
没有原点问题 最优带宽得到了较好的解决 收敛速度更快
Part 2: Projection and Regression
ห้องสมุดไป่ตู้
由直方图到核密度估计
直方图
n
1 区间长度
#{落入某个包含x的小区间内的观察值}
核密度
guassian epanechnikov triangular rectangular
1.0
Kernel Density With Different Kernel Function
guassian epanechnikov triangular rectangular
1.0
0.8
0.8
0.6
Density
4.5
5.0
5.5
6.0
6.5
7.0
7.5
fw
x0= 4.54
4.5
5.0
5.5
6.0
6.5
7.0
7.5
fw
x0= 4.55
4.5
5.0
5.5
6.0
6.5
7.0
7.5
fw
x0= 4.56
Density 0.0 0.2 0.4 0.6 0.8 1.0
Density 0.0 0.2 0.4 0.6 0.8
Histogram of mw
Density 0.0 1.0
Density 0.0 1.0 2.0




4.5 5.0 5.5 6.0 6.5 7.0
5.0 5.5 6.0 6.5 7.0 7.5 8.0 8.5
fw
mw
Histogram of fw
Histogram of mw
Density 0 40 80

fˆh (x) dx
1 f (x)dx nh
j
I(x
Bj
)
j

1 2
h

2 x

f

j

1 2
h2 dx
1 h2 f (x)2 dx 1 h2 f 2
nh 12
nh 12 2
h
LWAGE的直方图
Histogram of fw
Histogram of mw
Density 0.0 0.4 0.8
Density 0.0 0.6


方 图 的
4.5 5.0 5.5 6.0 6.5 7.0 7.5 fw
5.0 5.5 6.0 6.5 7.0 7.5 8.0 8.5 mw


Histogram of fw
Part 2: Projection and Regression
最优带宽
AMISE(
fˆh )

1 nh

h2 12
f 2 2
N o
AMISE( fˆh ) h

1 nh2

1 6
h
f2 0 2
1/ 3
Image h0


n
6 f
2 2

~ n1/3
对于标准正态分布,
Bias{
fˆh (x)}

h2 2
f (x)2 (K ) o(h2 )
其中,2 (K ) s2K (s)ds
Var{
fˆh
( x)}

1 nh
K
2 2
f
(x)

o
1 nh

其中,K 2 K 2 (s)ds 2
nh
Part 2: Projection and Regression
非参数与半参数模型
The basic idea of nonparametric inference is to use data to infer an unknown quantity while making as few assumptions as possible.
Part 2: Projection and Regression
f
j

nj nh
对每个区间,绘制高为fj ,宽为h的柱形图
Part 2: Projection and Regression
直方图中密度的一般表示
fh
(x)

1 nh
n i 1
j I (xi Bj )I (x Bj )
如何理解这个密度估计? 有什么问题? 如何改进?
Part 2: Projection and Regression
Density 0.0 0.2 0.4 0.6 0.8 1.0
4.5
5.0
5.5
6.0
6.5
7.0
7.5
fw
4.5
5.0
5.5
6.0
6.5
7.0
7.5
fw
4.5
5.0
5.5
6.0
6.5
7.0
7.5
fw
Part 2: Projection and Regression
不同原点的平均直方图
Average shifted histogram for female lnwage
0.6
Density
0.4
0.4
0.2
0.2
0.0
0.0
4.5
5.0
5.5
6.0
6.5
7.0
7.5
5.0
5.5
6.0
6.5
7.0
7.5
8.0
8.5
fw
mw
h对核密度估计的影响是什么?
Part 2: Projection and Regression
LWAGE的核密度估计(续)
Kernel Density With Different Kernel Function
相关主题