当前位置:文档之家› 判别分析-距离判别法ppt课件

判别分析-距离判别法ppt课件

COV (G) E[(G )(G )T ]
设X,Y是从总体G中抽取的两个样本,则X与Y之间的平方马 氏距离为:
d 2 ( X ,Y ) ( X Y )T 1( X Y ) 样本X与总体G的马氏距离的平方定义为:
d 2 ( X ,G) ( X )T 1( X )
两个总体的距离判别法
判别分析
—距离判别法
目录 / CONTENTS
01/引 言 02/距离判别法 03/距离判别法例题 04/距离判别法应用
2
资料来源
[1]彭力.冶金工业 出版社
[2]刘庆军,陈坤,刘晓光.煤与瓦斯突出预测PCA- 距离 判别法研究.煤矿安全,2016,42(10):97-101 [3]姜喜春.数据挖掘中的距离判别分析法.科技资讯,2015,新样品X到G1的距离与到G2的距 离之差,如果其值为正,X属于G2;否则X属于G1。
假设均值µ1,µ2以及协方差矩阵Σ已知,Σ相等,我们计算:
D2 (X, G1) D2 (X, G2 )
(X μ1)Σ1(X μ1) (X μ2 )Σ1(X μ2 )
判别分析的基本原理
♦判别分析是在已知研究对象分成了若干类型(组别),并已取 得各种类型的一批样品观测数据,在此基础上根据某些规则建立 判别式(判别量),然后对未知类型的样品进行判别分类。
♦已知n个总体,其分布函数分别为: F1(x),F2(x), …,Fk(x),
每一个总体都是一个p维函数,对于给定的样品x,我们应该通过 判别函数(判别准则),来决定该样品应属于这n个总体中的哪 一个总体。
首先根据已知分类的数据,分别计算各类的重心即分组(类)的均值, 判别准则是对任给的一次观测,若它与第i类的重心距离最近,就 认为它来自第i类。
计算新样品X到两个总体的马氏距离D2(X,G1)和D2(X,G2),
并按照如下的判别规则进行判断:
X∈G1,当 D2(X,G1)≤D2(X,G2) (1.1) X∈G2,当 D2(X,G1)> D2(X,G2)
(27):155-157 [4]罗磊,曹平.深部巷道岩爆破加权距离判别法模型的分 析和应用.中南大学学报,2012,43(10):71-75 [5]王吉亮,陈建平,杨静.距离判别法在公路隧道岩分类 中的应用.吉林大学学报.2008,38(6):999-1004
引言
判别分析基本原理 判别函数 判别方法分类
两个总体的距离判别法
其中µ=(µ1+µ2)/2是两个总体均值的平均值,α=Σ-1(µ1-µ2),记
W(X)=αꞌ(X-µ)
(1.2)
则判别规则(1.1)式可表示为
X∈G1,当 W(X)≥0
(1.3)
X∈G2,当 W(X)<0
这里称W(X)为两总体距离判别的判别函数,由于它是X的线性
函数,故又称为线性判别函数,α称为判别系数。
Σ 的一个联合无偏估计为
Σˆ
n1
1 n2
2
(S1
S2 )
这里
n
S (Xi( ) X( ) )(Xi( ) X( ) ), i 1
1, 2
判别分析可以从不同角度提出问题,因此有不同的判别准则, 如马氏距离最小准则、Fisher准则、平均损失最小准则、最小 平方准则、最大似然准则、最大概率准则等等,按判别准则的 不同又提出多种判别方法。判别分析中主要有四种常用的判别 方法,即距离判别法、Fisher(费希尔)判别法、贝叶斯判别 法和逐步判别法。
距离判别法
马氏距离 两个总体的距离判别法 多个总体的距离判别法
9
马氏距离
设总体 G {X1, X 2,..., X m}T 为m维总体(考察m个指标),样本 X i {x1, x2 ,..., xm}T。令μ=E( X i)(i=1,2, …,m),则总体均值向量为 {1, 2 ,m}T。总体G的协方差矩阵为:
在实际应用中,总体的均值和协方差矩阵一般是未知的,可 由样本均值和样本协方差矩阵分别进行估计。设 X1(i),X2(i),…,Xn1(i)来自总体的样本,i=1,2。则µ1和µ2的无 偏估计为:
两个总体的距离判别法
X(1)
1 n1
n1
X (1) i
i1

X(2) 1 n2
n2
X(2) i
i 1
引言
信息融合中的分析方法有三种,分别是:判别分析、聚类分 析、主成成分分析。
判例别如分,析某产医生院于有2部0世分纪患3有0年肺炎代、。肝近炎年、来冠,心在病自、然糖科尿学病、等社病会 学人的及资经料济,管记理录学了科每中个都患有者广若泛干的项应症用状。指标判数别据分。析现的在特想点利是用根现据 已有的掌这握些的资、料历找史出上一每种个方类法别,的使若得干对样于本一的个数新据的信病息人,,总当结测出得客这观 事些症物状分指类标的数规据律时性,,能建够立判判定别其公患式有和哪判种别病准。则这。个然问后题,可当以遇应到用新 的判别样分品析时方,法只予要以根解据决总。结出来的判别公式和判别准则,就能判别 该样品所属的类别。
判别函数
决定某一样品所属的类别,其实质是决定判别函数。根据样 品给定的多变量数据,由判别函数来决定该样品所属的类别。
例:设某班的学生经过八门课的考试,现需要根据考试的结果对学
生的学习情况进行分类。根据学生的成绩,可将学生分为四类:优
秀(A)、良好(B)、及格(C)、不及格(D)。为了决定每一位
学生的成绩类别,拟以八门课的平均成绩为准,且按:
100≥A类≥85
85>B类≥75 75>C类≥60
判别函数
D类<60
进行分类。
判别方法分类
判别分析内容很丰富,方法很多。
●按判别的组数来区分,有 两组判别分析 和 多组判别分析; ●按区分不同总体所用的数学模型来分,有 线性判别 和 非线 性判别; ●按判别时所处理的变量方法不同,有 逐步判别 和 序贯判别。
XΣ1X 2XΣ1μ1 μ1Σ1μ1 (XΣ1X 2XΣ1μ2 μ2Σ1μ2 )
2XΣ1(μ2 μ1) μ1Σ1μ1 μ2Σ1μ2 2XΣ1(μ2 μ1) (μ1 μ2 )Σ1(μ1 μ2 )
2
X
μ1
2
μ2
Σ 1 (μ1
μ2
)
2(X μ)α 2α(X μ)
相关主题