描述性统计量及检验
对任意概率P:Pi <P< Pi+1,有P=Pi +a( Pi+1-Pi),
那么
Q(P)=(1-a)Q(Pi) +aQ(Pi+1)
第二节 描述性统计量及检验
第二节 描述性统计量及检验
偏度和峰度都是用来测定收益率分布的形状,且 都以正态分布为基准的。
正态分布:偏度=0,峰度=3。
第二节 描述性统计量及检验
偏度的符号反映了分布偏斜的方向: 当偏度S 值=0时,序列分布是对称的。 当偏度S >0时,称为正偏,意味着序列分布有长的
右拖尾。 当偏度S <0时,称为负偏,意味着序列分布有长的
6
4
其中n是样本个数,S是偏度,K是峰度
由于正态分布的偏度S=0,峰度K=3,所以 JB 统计量 是用来衡量偏度和峰度偏离0和3的程度。
JB 统计量是用来检验时间序列是否服从正态分布的。
第二节 描述性统计量及检验
检验步骤: 原假设:时间序列服从正态分布。
计算S、K,并计算JB统计量。 在原假设下,JB 统计量服从自由度为2的X^2分布,
80
Skewness 0.783449
Kurtosis
2.267514
40
0 1000
2000
3000
4000
5000
6000
Jarque-Bera 124.6544 Probability 0.000000
上证综合指数收益率曲线
.100 .075 .050 .025 .000 -.025 -.050 -.075 -.100
0.000550 0.000353 0.088875 -0.092562 0.018805 -0.460843 6.365833
Jarque-Bera 506.9232 Probability 0.000000
第二节 描述性统计量及检验
Quantile—Quantile图 Q-Q图是借助分位数来比较两个分布的一种简单而
重要的工具(比JB统计量的用途更加广泛)。
分位数(Quantile):对于介于0,1之间的数 q,满 足如下条件的数 x(q) 称为 q 的分位数: P( x< x(q) ) < q
第二节 描述性统计量及检验
分位数的计算:
对于一组观察值,取概率:Pi=(i-0.5)/n ,i=1,…,n。
与Pi对应的分位数是把数据从小到大排列后的第i个 数,记为Q(Pi)。
主菜单:File/New/Filework 工作窗口: Unstructured/Deservation/OK 主菜单窗口: Data/空格/变量名/回车 工作窗口: 导入数据/view/Descriptive Ststistics(描述统计量)
/Histogram and Stats(直方图和统计量)
500
750
1000
上证综合指数收盘价曲线统计量
240
Series: SH
Sample 1 1000
200
Observations 1000
160
Mean
2501.364
Median
1743.640
Maximum 6092.060
120
imum
1011.500
Std. Dev.
1460.333
第二节 描述性统计量及检验
例2.1 右表是我国1992-2003 年的实际GDP增长率(可比价 格),对其进行描述性统计分 析。
1992 14.2 1993 13.5 1994 12.6 1995 10.5
1996 9.6 1997 8.8 1998 7.8 1999 7.1 2000 8.0 2001 7.5 2002 8.0 2003 9.1
比正态分布更大的概率。 用公式表示为:P{ <c}>p{X<c},c是一个比较小的
数。 服从尖峰分布随机变量,X服从正态分布。
第二节 描述性统计量及检验
在实际中,意味着来自于尖峰分布的随机样本会有 更多的极端值。
如果小概率事件发生的可能性大于正态分布所描述 的情形,那该变量的分布应当用尖峰分布来描述。
即 JB ~ X^2(2)。以检验水平5%为例,对应的临界值 =5.99,即P(X>5.99)=0.05。
若计算的JB >5.99,则拒绝原假设,分布不是正态
分布。否则接受原假设。
上证综合指数收盘价曲线
7,000 6,000 5,000 4,000 3,000 2,000 1,000
0
SH
250
分布,即相对于正态分布更平坦。
正态分布的峰度K=3。
第二节 描述性统计量及检验
K=3
K>3
K<3
正态分布的峰度=3
第二节 描述性统计量及检验
峰度也反映了分布尾部的厚薄。
正态分布的峰度K=3。K-3称为超出峰度。
具有正的超出峰度的分布称为尖峰分布。 尖峰分布具有厚尾性,即该分布在其支撑的尾部有
例2.1中GDP增长率的统计量:
第二节 描述性统计量及检验
例2.1中GDP增长率的偏度是0.78,峰度K为2.14 ,
说明GDP增长率的分布是不对称的,相对于正态分 布也是平坦的。
第二节 描述性统计量及检验
2.2. 统计量的检验
Jarque-Bera检验
统计量
JB n [S 2 (K 3)2 ]
SHR
250
500
750
1000
上证综合指数收益率统计量
240
200
160
120
80
40
0
-0.05
0.00
0.05
Series: SHR Sample 1 1000 Observations 999
Mean Median Maximum Minimum Std. Dev. Skewness Kurtosis
这在金融市场风险研究中有着重要的意义。
第二节 描述性统计量及检验
样本均值
E(r)
1 T
T
rt
t 1
样本方差
var(r)
2
1 T 1
T t 1
(rt
)2
样本偏度
s
1 T 1
T t 1
(rt
)3
3
样本峰度
k
T
1 1
T t 1
(rt
)4
4
第二节 描述性统计量及检验
Eviews操作:
左拖尾。
偏度的大小反映了分布偏斜的程度。
第二节 描述性统计量及检验
S=0 均值=中位数
S>0 均值>中位数
S<0 均值<中位数
第二节 描述性统计量及检验
峰度反应分布隆起的程度: 当峰度K>3时,序列分布曲线的凸起程度大于正态
分布,即相对于正态分布更隆起; 当峰度K<3时,序列分布曲线的凸起程度小于正态