金融中的基本统计方法
26/1 26/1 26/1 72/12 46/2 86/4 86/11
(a)月对数收益率(%) 864 0.83 5.48 -0.53 7.31 -34.25 32.41 864 1.04 7.24 0.34 8.91 -37.44 50.38 864 1.19 6.63 -0.22 2.05 -30.37 30.10 300 2.03 12.63 -0.32 3.20 -59.54 48.55 623 1.15 6.39 -0.14 1.32 -32.61 22.92 141 3.64 10.29 0.29 1.32 -28.64 41.58 134 2.11 9.11 -0.50 1.14 -30.73 23.18
1.2 资产收益率分布的参数模型
1. 正态分布: 预先假定收益率rt有共同的分布密度函数
f (x)=Fra bibliotek√1 2πσ
exp{
x−µ 2σ2
},
−∞ < x < ∞
其中µ, σ2 > 0 是参数。可以根据实际数据来估计µ, σ2 > 0。
3
韩元 港元 台币 新加坡元 日元
表1 正态分布的χ2−检验
数据频率
数据个数
2331 487 111 2377 487 111 2250 483 111 2330 487 111 2626 487 111
韩元 港元 台币 新加坡元 日元
表2 正态分布的Kolmogorov-检验
数据频率
天
周 月 天
周 月 天
周 月 天
周 月 天 周 月
统计量Dn 0.2936 0.2937 0.3040 0.1114 0.1449 0.1550 0.1594 0.1888 0.1318 0.1479 0.1079 0.0974 0.0813 0.0652 0.0842
(1)
⇔
FT (log(1
−
θ W
))
=
p
⇔
log(1
−
θ W
)
=
FT−1(p)
⇔ θ = W [1 − exp{FT−1(p)}]
其中
FT−1(p) = inf{x : FT (x) > p}. 注释. 1. FT−1(p) 通常是负的并且绝对值很小,故θ ≈ −FT−1(p)W . |FT−1(p)| 可以称之为“资本
损失系数”。
2. 这里有三个要素: (1)置信水平; (2)持有期长度; (3)T周期对数收益率的分布。 前两个要素是根据投资者的风险厌恶程度和所持头寸的性质事先给定的,关键的、也 是最复杂的是第三个因素。
1.1 资产收益率数字特征:描述性统计量
设r1, · · · , rn 是收益率的n个观察值,样本均值为
µˆn
=
1 n
n
rt
t=1
样本方差为
σˆn2
=
n
1 −
1
n
(rt − µˆn)2
t=1
样本偏度为
Sˆn
=
(n
1 − 1)σˆn3
n
(xt
t=1
−
µˆn)3
样本峰度为
Kˆ n
=
1 (n − 1)σˆn4
n
(xt
t=1
− µˆn)4
它们分别描述数据分布的中心、关于中心的离散程度、关于中心的对称性和分布尾巴的薄 厚程度。
数据个数 2331 487 111 2377 487 111 2250 483 111 2330 487 111 2626 487 111
韩元 港元 台币 新加坡元 日元
表4 t(m)的Kolmogorov-检验
数据频率
天
周 月 天
周 月 天
周 月 天
周 月 天 周 月
自由度m 6 6 6 7 7 6 6 6 8 7 7 9 10 11 17
数据个数 均值 标准差 偏度 (a)日简单收益率(%)
8938 0.049 0.798 -1.23 8938 0.083 0.674 -1.09 8938 0.050 1.479 0.01 6329 0.138 2.880 -017 8938 0.051 1.395 -0.55 2985 0.201 2.422 -0.47 2825 0.125 2.124 -0.06
金融中的基本统计方法
潘家柱∗
北京大学数学科学学院 2005年9月
关键字: 概率分布;收益率;时间序列;回归分析; 协整;因子模型;误差校正模型
1 收益率的概率分布
先从两个问题出发。
问题1 某公司准备投资1000万元的金融资产(股票、外汇等),一个月后损失超过10万的 可能性有多大?能以百分之九十的把握保证损失不会超过多少?
方程(1)变为
XT (W )
=
P0
− PT P0
W
= [1 − exp{log PT − log P0}]W
T
= [1 − exp{ rt}]W.
t=1
T
P{
t=1
rt
<
log(1
−
θ W
)}
=
p.
∗E-mail: jzpan@
1
记FT 为
T t=1
rt
的分布函数.那么
假定W 是t = 0时刻的资产额, XT (W ) 表示T 时刻的损失额, p为一个非常小的概率. 考 虑方程
P {XT (W ) > θ} = p.
(1)
那么, 上述两个问题的解为
1. 给定W, T 和θ, 求p; 给定W, T 和p, 求θ.
2. 给定θ, T 和p, 决定W ;
先来研究一下方程(1). 记Pt为t时刻资产的价格, t = 0, 1, · · · , {rt = log Pt − log Pt−1, t = 1, 2, · · · } 为对数收益率序列, 则我们有
其中0 ≤ w ≤ 1, Φ 是标准正态分布的分布函数, 且σ1 = σ2.
以上几种分布的分布密度函数图如图1。 4. 稳定分布, 其特征函数为
φα(t) = exp{−c|t|α}, 0 ≤ α < 2.
5
0.45 0.4
0.35 0.3
N(0,1) t(2) mixture:µ=0,σ1=1,σ2=2
62/7/3 62/7/3 62/7/3 72/12/15 62/7/3 86/3/14 86/10/30
8938 8938 8938 6329 8938 2985 2825
(b)日对数收益率(%) 0.046 0.803 -1.66 0.080 0.676 -1.29 0.039 1.481 - 0.33 0.096 2.894 -0.59 0.041 1.403 -1.05 0.171 2.443 -1.10 0.102 2.128 -0.44
8.13 15.24 1.94 3.29 0.89 2.32 0.47
-29.00 -31.23 -26.19 -44.87 -27.83 -24.91 -26.46
38.28 65.51 35.12 62.50 25.77 51.55 26.08
VW EW I.B.M Intel 3M Microsoft Citi-Grp
¸ÅÂÊÃܶÈp
0.25 0.2
Cauchy
0.15 0.1
0.05
0
−6
−4
−2
0
2
4
6
x
Figure 1: 概率密度函数的比较:正态分布、t-分布、两个正态分布的混合、Cauchy 分布。
120
100
80
60
40
20
0
−0.025 −0.02 −0.015 −0.01 −0.005
0
0.005
问题2 如果要求限定一个月后的损失超过10万的可能性不大于百分之一,那么初始投 资额最多应为多少?
这两个问题的一般化即为
1. 风险的预测:判断在持有期末因资产价格的变化造成的损失超出限定额度的概率,并 且以给定的置信度确定持有期末可能损失的最大额度。
2. 投资决策:限定能承受的损失额度,并使得在持有期末的可能损失超过限定额度的概率 低于某个非常低的水平, 然后在这样的要求下决定初始投资额度.
2
股票指数和个股价格的简单收益率和对数收益率的描述性统计量。 收益率的值是百分比,样本的终止时间为1997年12月31日.
VW和EW 分别表示Value-Weighted和Equal-Weighted两个指数。
证券 VW EW I.B.M Intel 3M Microsoft Citi-Grp
起始日期 62/7/3 62/7/3 62/7/3 72/12/15 62/7/3 86/3/14 86/10/30
数据个数 2331 487 111 2377 487 111 2250 483 111 2330 487 111 2626 487 111
其中“*”表示超过了显著水平0.05的临界值,从而要拒绝服从t-分布的假设
3. 两个正态分布的混合: 分布函数为
wΦ(
x
− σ1
a
)
+
(1
−
w)Φ(
x
− σ2
a
)
√nDn 14.1744* 6.4814* 3.2031* 5.4319* 3.1969* 1.6335* 7.5618* 4.1492* 1.3884* 7.1400* 2.3808*
1.0265 4.1637* 1.4378* 0.8875
数据个数
2331 487 111 2377 487 111 2250 483 111 2330 487 111 2626 487 111
其中“*”表示超过了显著水平0.05的临界值,从而要拒绝服从正态分布的假设