当前位置:文档之家› 多元统计分析随机向量

多元统计分析随机向量


马拉松 (分)
137.72 128.3 135.9 129.95 146.62 133.13 139.95 130.15 134.03 133.53 131.35

一、欧氏距离
向量的各分量如果单位不全相同,则上述欧氏距离一
般就没有意义。即使单位全相同,但如果各分量的变异
性差异很大,则变异性大的分量在欧氏距离的平方和中
F x P X a
随机向量 X X1,X2,L,Xp 的分布函数:
F x 1 , x 2 , L , x p P X 1 x 1 , X 2 x 2 , L , X p x p
二、多元概率密度函数
一元的情形:
F (x )xftd t,
fx d F x
d x
多元的情形:
称协差阵)定义为:
Cov
X 1 ,Y1
Cov X1,Y2 L
Cov
X
,Y
Cov
X
2
,Y1
Cov X 2,Y2
L
M
M
Cov X p ,Y1 Cov X p ,Y2 L
Cov
X 1 ,Yq
Cov
X 2 ,Yq
M
Cov X p ,Yq
X1 E X1
E
M Y1 E Y1 ,L ,Yq E Yq
20.81 20.06 20.81 20.68 20.58 20.43 21.52 20.22 20.8 21.04 21.05

400米 (秒)
46.84 44.84 46.82 45.04 45.91 45.21 48.3 45.68 46.2 47.3 46.1

800米 (分)
1.81 1.74 1.79 1.73 1.8 1.73 1.8 1.76 1.79 1.81 1.82
平方欧氏距离为:
d2x,yx1y12x2y22Lxpyp2
xyxy
一、欧氏距离
X X1,X2,L,Xp 到总体π的平方欧氏距离定义为:
d2X,XμXμ
X112 X2 22 L
2
Xp p
平均大小 EX112 EX2 22 K
2
E Xp p
等于 VX1
VX2 K VXp
不适合直接使用欧氏距离的例子
即 VX EXEXXEX
V X1
Covx1,x2 L
Cov
X2,
X1
Vx2
L
M
M
Cov Xp, X1 Cov xp, x2 L
Cov
X1, Xp
Cov
X2, Xp
M
V Xp
V(X)亦记作Σ=(σij),其中σij=Cov(Xi,Xj)。
协差阵Σ既包含了X各分量的方差,也包含了每两个分 量之间的协方差。显然,Σ是一个对称矩阵。
n
m nm
C o v A iX i, B jY j A iC o vX i,Y j B j
i 1
j 1
i 1j 1
n m n m
推论 C ov X i, Y j C ovX i,Y j
i 1 j 1
i 1j 1
证明
n
m
CovXi,Yj
i1
j1
n
n m
设X是p维随机向量,由它的q(<p) 个分量组成的 向量X(1)的分布称为X的关于X(1)的边缘分布。
不妨设 X1 X1,L,Xq ,则对连续型的分布,有
f 1 ( x 1 , L ,x q ) L f ( x 1 , L ,x p ) d x q 1 L d x p
四、条件分布
R
21
M
1L M
p1 p 2 L
1p
ቤተ መጻሕፍቲ ባይዱ
2
p
M 1
R=(ρij)和Σ =(σij)之间有关系式:R=D−1ΣD−1
其中 D d ia g ( 1 1, 2 2,L , p p)。
R和Σ的相应元素之间的关系式为:
ij
ij ii jj
前述关系式即为:
1
11
0
R
M
0
477
V
(Y
)
AV
(X
)A/
126 256
126 40 91
256
91 219
.
三、相关矩阵
随机变量X和Y的相关系数定义为:
X,Y CovX,Y VXVY
X ( X 1 , X 2 , L , X p ) 和 Y ( Y 1 , Y 2 , L , Y q ) 的相关阵定
义为:
X1,Y1
阵分别为
5 4 1 2
72和12
9 3
253
令y1=2x1−x2+4x3,y2=x2−x3,y3=x1+3x2−2x3,试求y=(y1,y2,y3)′的
数学期望和协方差矩阵。
2 1 4 X1
Y
0 1
1 3
1 2
X2 X3
AX
,
E (Y ) AE ( X ) (40, 9, 15)/ ,
ki2VXi
i1
i1
证明
n
n
n
V ki Xi cov( ki Xi , ki Xi )
i1
i1
i1
nn
kikj cov Xi , X j
i1 j1
n
n
由独立性可得, ki2 cov Xi , Xi ki2V (xi )
j1
i1
例3 设随机向量 X(X1,X2,X3)/的数学期望和协方差矩
E X1q
E X2q
M
E Xpq
随机矩阵X的数学期望的性质
(1)设a为常数,则 E(aX)=aE(X)
(2)设A,B,C为常数矩阵,则 E(AXB+C)=AE(X)B+C
特别地,对于随机向量X,有 E(AX)=AE(X)
(3)设X1,X2,⋯,Xn为n个同阶的随机矩阵,则 E(X1+X2+⋯+ Xn)=E(X1)+E(X2)+⋯+E(Xn)
0L
1 L
22
M 0L
0
0
1211
12 22
L L
1MM p1
M
p2
L
pp
1
12pp
11
0
M
pp
M 0
0L
1 L
22
M 0L
0
0
M
1
pp
标准化变换
在数据处理时,常常因各变量的单位不完全相同而需要对 每个变量作标准化变换,最常用的标准化变换是令
Xi*Xiiii , i1,2,L,p
记 X *(X 1 *,X 2 *,L,X * p), 于是
一、数学期望(均值)
随机向量 X (X 1 ,X 2,L,X p)的数学期望
E X E X 1 ,E X 2 ,L ,E X p
记为μ=(μ1,μ2,⋯,μp)′。 随机矩阵X=(Xij)的数学期望
EX11
EX E Xij
EX21
M
E Xp1
EX12 L EX22 L
M
E Xp2 L
F(x1,L,xp)
L x1
xp
f(t1,L,tp)dt1Ldtp
p f(x1,L,xp)x1LxpF(x1,L,xp)
多元概率密度函数f (x1, ⋯,xp) : (1)f(x1,L,xp)0, 对 一 切 实 数 x1,L,xp;
(2) L f(x1,L,xp)dx1Ldxp1。
三、边缘分布
m
E Xi E Xi Yj E Yj
i1
i1 j1
j1
n
m
EXi E Xi
Yj E Yj
n
m
Cov Xi ,Yj
i1 j1
i1 j1
协差阵的性质
(5)设k1,k2, ⋯,kn是n个常数,X1,X2, ⋯,Xn是n个相互独 立的p维随机向量,则
V
n
n kiXi
一、欧氏距离
由于 E X i * 2 V X i * 1 ,i 1 ,2 , L ,p ,
故平方和 X 1 1 2 LX p p2 中各项的平均取值均
为1,从而各分量所起的平均作用都一样。 欧氏距离经变量的标准化之后能够消除各变量的
单位或方差差异的影响,但不能消除变量之间相关性 的影响,以致有时用欧氏距离显得不太合适。为此, 我们引入一个由印度著名统计学家马哈拉诺比斯 (Mahalanobis,1936年)提出的“马氏距离”的概念。
V A X b A V X A
当p=1时,上述等式就是我们熟知的如下等式:
V a X b a 2 V X
(3)设A和B为常数矩阵,则
C o v A X ,B Y A C o v X , Y B
例2 Σ0X的各分量间存在线性关系(依概率1)。
协差阵的性质
(4)设 A 1 ,A 2 ,L ,A n 和 B 1 ,B 2 ,L ,B m 为常数矩阵,则
附2 随机向量
§2.1 一元分布 §2.2 多元分布 §2.3 数字特征 §2.4 欧氏距离和马氏距离 §2.5 随机向量的变换 §2.6 特征函数(不讲)
§2.2 多元分布
一、多元概率分布 二、多元概率密度函数 三、边缘分布 四、条件分布 五、独立性
一、多元概率分布
随机向量:元素为随机变量的向量。 随机矩阵:元素为随机变量的矩阵。 随机变量X的分布函数:
f
x1 | x2
f2
x2
五、独立性
两个连续型随机向量的独立
fx ,y fX x g f Y y
相关主题