当前位置:
文档之家› 应用多元统计分析第六章习题解答
应用多元统计分析第六章习题解答
故d*=ad是一个距离. (3) 设d为一个距离,c>0为常数,显然有
①
di*j
dij dij c
0,且仅当 X(i)
X( j)时di*j
0;
②
di*j
dij dij c
dji dji c
d*ji,对一切 i, j;
4
第六章 聚类分析
③
d
* ij
d ij dij c
1 1 c / dij
(4)设d(1)和d(2)是距离 ,令d* d(1) •d(2).
d*虽满足2前 个条件 ,但不一定满足三式 角. 不
下面用反例来d说 *不明 一定是距 . 离
设di(j1)
di(j2)
X(i)
X(j)
(m1),则di*j
X(i)
X(j)
2
.
当X(i) 0,X(j) 1,X(k) 0.5时,di*j 1,di*k14,dk*j14. 显然不d满 i*j d足 i*kdk*.j
D(0) D(1) 604
0 9
0
16
7 3
10 5
0 8
0
① 合并{X(1),X(4)}=CL4,并类距离 D1=1.
0
D(2)
92 32
65
2
0 52 136
2
0 100
2பைடு நூலகம்
X(2) X(3) 0CX(L54)
14
第六章 聚类分析
② 合并{X(2),X(5)}=CL3,并类距离 D2=3.
t1
xi)2
n
t1
xt2i
nxi2
abnab2 n
(ab)[n(ab)]1(ab)(cd)
n
n
8
第六章 聚类分析
n
(xtj
t1
xj)2
n
t1
xt2j
nx2j
acnac2 n
(ac)[n(ac)]1(ac)(bd)
n
n
故二值变量的相关系数为:
n
Cij(7)
(xtixi)x(tjxj)
t1
应用多元统计分析
第六章部分习题解答
第六章 聚类分析
6-1 证明下列结论:
(1) 两个距离的和所组成的函数仍是距离;
(2) 一个正常数乘上一个距离所组成的函数
仍是距离;
(3)设d为一个距离,c>0为常数,则 d * d
仍是一个距离;
d c
(4) 两个距离的乘积所组成的函数不一定是
距离;
证明 :(1)设d(1)和d(2)为距,离 令dd(1) d(2).
X1
X4
X2
X5
X3
0
1
2
3
4
5
6
n
(xti xi)(xtj xj )
rij
t1 n
n
(xti xi)2
(xtj xj )2
t1
t1
7
第六章 聚类分析
n
(xti
t1
xi)(xtj
n
xj)
t1
xtixtj
nxixj
anabac nn
1[an(ab)(ac)]1[a(abcd)(ab)(ac)]
n
n
adbc n
n (xti
并类距离 D1=1.
D(2)
7903
0 5 10
0 8
X X
(2) (3)
0
X (5) CL4
11
第六章 聚类分析
② 合并{X(2),X(5)}=CL3,并类距离 D2=3.
D(3) 100 9
0 8
0CCXL(L334)
③ 合并{CL3,CL4}=CL2,并类距离 D3=8.
D(4) 100 0CX(3L2)
6
第六章 聚类分析
6-2 试证明二值变量的相关系数为(6.2.2)式,夹角余
弦为(6.2.3)式.
证明:设变量Xi和Xj是二值变量,它们的n次观测值记 为xti, xtj (t=1,…,n). xti, xtj 的值或为0,或为1.由二值变 量的列联表(表6.5)可知:变量Xi取值1的观测次数 为a+b,取值0的观测次数为c+d;变量Xi和Xj取值均为1的 观测次数为a,取值均为0的观测次数为d 等等。利用两 定量变量相关系数的公式:
以下来验 d满证足作为距离所 3个要条求 .件
2
第六章 聚类分析
① dij di(j1) di(j2) 0,且仅X当(i) X(j)时dij 0; ② dij di(j1) di(j2) d(j1i) d(j2i) dji,对一i切 , j; ③ dij di(j1) di(j2) di(k1) dk(1j) di(k2) dk(2j)
D(3)
110306622
0 1654
0C CX(3LL34)
③ 合并{CL3,CL4}=CL2,并类距离 D3=(165/4)1/2.
D(4) 10221 0C X(3L2)
④ 所有样品合并为一类CL1,并类距离 D4=(121/2)1/2.
15
第六章 聚类分析
类平均法的谱系聚类图如下:
Name of Observation or Cluster
1
1 c /(dik
dkj)
dik d kj
d ik
dkj
dik d kj c dik d kj c dik d kj c
dik d kj dik c d kj c
(因dik 0, d kj 0)
d
* ik
d
* kj
对一切 i, k, j.
故d*是一个距离.
5
第六章 聚类分析
t1
t1
故有 ci(j9)co ijs(ab a )a (c) (6.2.3)
10
第六章 聚类分析
6-3 下面是5个样品两两间的距离阵
0
D(0) D(1) 64
0 9
0
16
7 3
10 5
0 8
0
试用最长距离法、类平均法作系统聚类,并画出谱系
聚类图.
解:用最长距离法:
① 合并{X(1),X(4)}=CL4,
dik dkj,对一i切 ,k, j.
(2) 设d是距离,a >0为正常数.令d*=ad,显然有
① di*jcidj0,且仅 X(i)当 X(j)时 di*j0; ② di*jcidjcdjid*ji,对一 i,j;切
3
第六章 聚类分析
③ di*jcdijc(dikdk)j cdikcdk j
di*kdk*,j对一i,k切 , j.
④ 所有样品合并为一类CL1,并类距离 D4=10.
12
第六章 聚类分析
最长距离法的谱系聚类图如下:
Name of Observation or Cluster
X1
X4
X2
X5
X3
0
1
2
3
4
5
6
7
8
9
10
Maximum Distance Between Clusters
13
第六章 聚类分析
用类平均法:
a dbc
n
n
(xtixi)2 (xtjxj)2
(ab)c(d) (ac)b(d)
t1
t1
(6.2.2)
9
第六章 聚类分析
利用两定量变量夹角余弦的公式:
n
xti xtj
其中
cosij
t 1
n
xt2i
t 1
n
xt2j
t 1
n
n
n
xti xtj a, xt2iab, xt2jac
t 1