当前位置:
文档之家› 数学地质第六章 判别分析:线性-逐步解析
数学地质第六章 判别分析:线性-逐步解析
一、费歇准则的基本含义
一、费歇准则的基本含义
假定判别函数已经建立,显然每个样品的p个变量值代 入式(6-4)中就可求得一个y值,则此值称为样品的 判别计量(或判别值)。 n个样品有n个判别值,记为
p
y Ai c j xAij , j 1
p
yBi
c j xBij
j 1
一、费歇准则的基本含义
三、判别分析的类型
1)根据母体(总体)个数 可分为两类(两组)判别 分析和多类(多组)判别分析。 2)根据判别函数类型 可分为线性判别和非线性判别 分析。 3)按判别方法 可分为判别分析、逐步判别和序贯判 别分析等
四、建立判别函数的准则
判别函数是在一定的规则下建立起来的。因此,判别 函数的建立,就须依照一定的准则。最常用的有以下 准则:
每类样品判别值的平均值,称为类平均值,记为
1 nA
1 nA p
p
yA
nA
i1
y Ai
nA
i 1
c j xAij
j 1
c j x Aj
j 1
1 nB
1 nB p
p
yB
nB
y Bi
i1
nB
i1
c j xBij
j 1
c j x Bj
j 1
一、费歇准则的基本含义
如果A、B两母体客观上存在着差别,则它们的类平均 值 与 也会有一定的差别。使两个母体分开的综合指标 值(y0),称为两母体的分界线,或称临界值(图62)。
二、判别函数
若有两类物体,在统计学上称为总体(或母体)。 它们的分布状态均可以利用p个变量,在p维空间中用 两个椭球状点集表示出来。
设有A、B两个总体,从中抽取两组样品,每个样 品有两个变量,现以变量为轴,将A、B两组样品在二 维空间中表示出来(图6-1)。
二、判别函数
差图 别 函 数两
个 二 元 总 体 间 的
一、判别分析的概念
判别分析主要解决两个问题: 1)根据什么指标来判别(分辨)已知的类型,即建立 判别函数; 2)对于可能来自已知类型的某些未知样品,如何判定 它们归属已知类型中的哪一类。
判别分析就是借助于已知类型的若干变量,建立 起一个或多个判别函数,从而决定未知对象归属问题 的一种多元统计方法。
从式(6-11)中解出c1, c2 ,,c p的数值,判别函数即建 立。
二、两类线性判别函数的建立
二、两类线性判别函数的建立
二、两类线性判别函数的建立
H
c j
nA
p
2[ c j (xAij
i1 j1
x Aj )]2 (x Aij
xAj )
nb
p
2[ c j (xbij
i1 j1
xbj )]2 (xbij
在自然界中,经常遇到对研究对象进行分类的问题。 分类包括两个方面的内容:其一,是研究对象存在着 几种类型,即能分为多少类;其二,在研究对象类型 数目已知的情况下,某一研究个体应该属于哪一类。 后者,属于判别分析研究的范畴。
地质学中遇到的分类问题很多。例如,根据岩矿鉴 定,分辨某一砂岩属于海相砂岩或陆相砂岩;在油田 开发中,根据钻井的点测或化验数据,判别是否遇到 油层、水层或干层;在地球化学中,根据岩体的化验 数据,分辨岩体是否是含矿岩体;在煤田勘探中,根 据煤层煤质的数据,判别某一勘探区的某一煤层,属 于相近勘探区同一煤系诸煤层的哪一层等。
第六章判别分析
杨永国 中国矿业大学 资源与地球科学学院
内容提要
第一节 判别分析概述 第二节 费歇准则下的两类线性判别模型 第四节 逐步判别分析 第五节 判别分析在地质上的应用
第一节 判别分析概述
主要内容: 一、判别分析的概念 二、判别函数 三、判别分析的类型 四、建立判别函数的准则
一、判别分析的概念
二、两类线性判别函数的建立I (c1, c ,,cp ) G H
nA
(yA yB)2
nB
( yAi yA )2 ( yBi yB )2
i 1
i 1
根据多元函数求极值的方法,诸c j 应满足下列方程组
I 0 c1
I 0 c2 I 0 c3
(6-11)
----
二、两类线性判别函数的建立
1)费歇准则(主要适用于二类判别); 2)贝叶斯准则(适用于多类判别); 3)最小二乘法准则; 4)库巴克准则; 5)不稳定性准则等。
第二节 费歇准则下的两类线性判别模型
主要内容: 一、费歇准则的基本含义 二、两类线性判别函数的建立 三、分界值计算和判别法则 四.判别函数的显著性检验及判别率 五.变量的选择 六、两类判别应用举例与小结
6-1
二、判别函数
由图可以看出,两类总体以任何一个变量为基础都 不能将其明显地区分开。两类同一变量之间,总有些 重叠部分。
如果能设法利用两个或多个变量的线性组合构成一 个合适的综合判别指标,并使其能最大限度地缩小不 易判别的重叠部分,从而提高正确判别的概率,则称 变量的线性组合这个综合指标
p
y c1x1 c2 x2 c p x p c j x j j 1
布图 图
判 别 计 量 分
6-2
一、费歇准则的基本含义
显然,判别分析要求找到的判别函数y=f(x1,x2,…, xp)使两类(组)间差别愈大愈好,即
G | y A yB |2 max
并使两类组内离差平方和(或组内变差)愈小愈好, 即
nA
nB
H ( y Ai y A )2 ( yBi yB )2 min
xbj )
nA
2 [c1 (xAi1 xA1 ) c2 (xAi2 xA2 ) c p (xAip xAp )](xAij xAj ) i 1
i 1
i 1
一、费歇准则的基本含义
将上述两个条件结合起来,要求
I G H
(yA yB )2
nA
nB
( yAi yA )2 ( yBi yB )2
max
(6-10)
i 1
i 1
p
建立判别函数 y cj xj 时,遵循使I值最大的原则是 j 1
由费歇(1936)最早提出的,故称其为费歇准则。有 时称费歇准则为“最大分离”准则。
为判别函数(图6-1中直线Ⅰ)
二、判别函数
二维空间中,在两点集之间垂直于y轴且把两个点集分 开的直线(图6-1中直线Ⅱ)称为判别直线。其直线方 程为
c1 x1 c2 x2 y0 0
在多维情况下,判别直线将是一个平面(p=3)或(p1)维超平面(p>3),其方程如下:
c1 x1 c2 x2 c p x p y0 0 由此看出,判别分析的特点是能够大大缩减向量的维 数,而不致损失很多信息。