当前位置:
文档之家› 第二章 数据描述和描述性统计
第二章 数据描述和描述性统计
i =1 i
m
i
− X )2
n −1 i:第i个等级区间;X i :第i个等级区间的中点; X所有观测值的平均值;f i : 第i个等级区间的频率; n是全部观测的样本数
19
20
(修正)样本标准差
负半方差
非组数据计算公式
σ=
∑(X
i =1
n
i
− X )2
方差、标准差在度量风险时的局限
方差和标准差将偏离于均值的所有波动,都算作风险。
2 i 2 i i =1 j >i n
= ∑ wi2σ i2 + 2∑∑ wi w j ρ ijσ iσ j
i =1 j >i
36
投资多样化的风险减少效应
投资多样化的风险减少效应
一个特例:两种风险资产(A和B)
2 投资组合P的方差σ P : 2 2 2 2 2 σP = wA σ A + wB σ B + 2wi w j ρ ABσ Aσ B
n +1 2 −F L + i f
14
算术平均值
非组数据:
几何平均值
X=
∑X
i =1
n
i
n
例子:股票指数5年中按以下比例增长: 10%,20%,15%,-30%,20%。5年前开始的指数为100 点,因此,5年中指数分别为:110, 132, 151.80, 106.26, 127.51。 三种计算收益率计算方法
∑(X
i =1
n
如何理解偏度系数? 对称分布的偏度系数为0
收益率 正偏度
收益率 无偏度(对称)
25
∑(X
i =1
n
i
2 − X ) 3=∑ ( X i − X )( X i − X) i =1
n
26
相对频率
峰度
峰度:随机变量分布的尖端程度
随机变量分布的尖端程度
收益率 常峰态
∑(X
i =1
n
i
− X )4
17
组数据高四分位数的计算
3(n + 1) −F Q3 = L + i 4 f
18
离散性度量
方差、标准差 半方差、半标准差 方差系数
(修正)样本方差
非组数据计算公式
σ2 =
∑(X
i =1
n
i
− X )2
n −1
组数据计算公式
σ =
2
∑ f (X
Corr ( X , Y ) = ρ XY =
Cov ( X , Y )
σ Xσ Y
Corr ( X , X ), Corr ( X , Y ), Corr ( X , Z ) 相关系数矩阵 = Corr (Y , X ), Corr (Y , Y ), Corr (Y , Z ) Corr ( Z , X ), Corr ( Z , Y ), Corr ( Z , Z ) ρ XX , ρ XY , ρ XZ 1, σ XY , σ XZ = ρYX , ρYY , ρYZ = σ YX ,1, σ YZ ρ , ρ , ρ σ , σ ,1 ZX ZY ZZ ZX ZY
σ A +σ B
2 2
38
σ A题:随着资产组合P的投资范围不断扩大,组合 的风险会如何?
2 : 投资组合P的方差σ P 2 ?σ P →0 2 ?σ P →∞ 2 ?σ P → 其他
假定: (1)风险资产组合P有N种风险资产, 为等权组合(w i = (2)∃K ∈ R + , ∀i, j, σi < K, σ ij < K
非系统风险 系统风险
40
39
2.1 引言
统计学
第二章 数据描述和描述性统 计
暨南大学金融系 朱滔
统计学是应用数学的一个分支,是一门关于数 据资料的收集、整理、分析和推断的科学。 统计学的主要内容
描述性统计学 描述收集的数据(手段:图、表、数) 推断统计学 在样本数据基础上,对有关总体作出推断。
1
2
2.2 数据类型
4
3
2.3 数据描述
数据描述-图
频率分布图 相对频率分布图 累积频率分布图 直方图
(相对)频率分布图
纵轴—用高度表示(相对)频率 横轴—用宽度表示等级区间
相对频率
频率
2 1 -8
5
2/51 1/51 -7 -6 收益率 -8 -7 -6 收益率
6
累积频率分布图
累积频率 3 2 1 -8 -7 -6 收益率
33 34
协方差和相关性的应用
投资组合P : n项风险资产,资产i的收益率Ri, 投资权重为wi。 投资组合P的收益率RP : RP = ∑ wi Ri
2 投资组合P的方差σ P : 2 σP = E ( RP − E ( RP )) 2
单项资产的风险
资产收益率的方差或标准差来度量 投资组合收益率的方差或标准差来度量
28
2.5 相关的度量
相关的度量:度量两个变量之间的线性关 系关系的方法
协方差 相关系数
(修正样本)协方差
Cov( X , Y ) = σ XY =
∑(X
i =1
n
i
− X )(Yi − Y ) n −1
注意:这些方法只能度量线性相关
如何理解协方差? P58 图2.7
29
30
方差-协方差矩阵
2 = σ NSV Ri ≤ R
∑ (R − R )
i Ri ≤ R
∑1 − 1
23 24
相对频率
偏度
偏度:随机变量分布的对称性
随机变量分布的对称性
收益率 负偏度
∑(X
i =1
n
i
− X )3
3
偏度系数 =
n −1 − X )2 n −1
i
相对频率
相对频率
绘制(相对)频率、累积频率图的过程
构建频率分布表(表2.4) 划分等级区间 统计(相对)频率、累积频率 绘制图形
7
8
2.4 描述统计学
直方图(Histogram)-估计的密度函数
纵轴—用面积表示相对频率 横轴—用宽度表示等级区间
矩的公式
∑(X
i =1
n
i
− A) k
n
(−0.8 + 0.2) 2 + (0.2) 2 + (0.2 + 0.2) 2 3 −1 (−0.2 − 0.2) 2 + (0.2) 2 + (0.8 − 0.2) 2 2 σB = 3 −1 2 2 σA =σB
2 σA =
n −1
一个例子(非正式):
收益率 平均 0.2 0.8 -0.2 0.2 -0.8 -0.2 0 0
相关系数
例子:三种风险资产X,Y,Z
协方差由于量纲的影响,并不具有可比性
Cov( X , X ), Cov( X , Y ), Cov( X , Z ) V = Ω = Cov(Y , X ), Cov(Y , Y ), Cov(Y , Z ) Cov( Z , X ), Cov( Z , Y ), Cov( Z , Z )
组数据:
X=
∑fX
i =1 i
m
i
n
5
算术平均:35%/5=7% 平均收益率:(127.51-100/100)/5=5.5% 几何平均:
i:第i个等级区间;X i :第i个等级区间的中点; f i : 第i个等级区间的频率; n是全部观测的样本数
15
(1 + 10%)(1 + 20%)(1 + 15%)(1 − 30%)(1 + 20%) − 1 = 4.98%
31 32
相关系数
随机变量
1、 − 1 ≤ ρ XY ≤ 1 2、相关系数度量的是线性相关关系 3、相关关系 不等于 因果关系
随机变量的期望与方差
E (ξ ), E (aξ ) = aE (ξ )
D(ξ ) = Var (ξ ) = E (ξ − E (ξ )) 2 D(aξ ) = a 2 D(ξ ) Cov (ξ ,η ) = E (ξ − E (ξ ))(η − E (η ))
投资组合风险
投资组合P : n项风险资产,资产 i的收益率Ri, 投资权重为wi。 问题:投资组合 P的收益率和方差如何计 算? (? wi )
35
= ∑ wi2σ i2 + 2∑∑ wi w j Cov ( Ri , R j )
i =1 j >i n
n
= ∑ w σ + 2∑∑ wi w jσ ij
11
区间:9
12
组数据中位数的计算
组数据中位数的计算
例子:P45-表2.6 中位数位置:52/2=26,利用插值法将中位数计算出来。
宽度:1% 中位数:
一般化公式(P45)
0% 0 23 1 24 2 25 频率:3 区间:3
1% 3 26
51 + 1 − 24 + 1 0% + 1% * ( 2 ) = 1% 3
问:哪种方法是正确的?为什么?
16
P48-50
P49