当前位置:文档之家› 粗糙集

粗糙集



对于上表来说,U中有四个对象(概念),而现 在条件集合中只有一个属性,对于U1和U2来说, 它们的p不同所以可以通过p来区分,即u1,u2在p 下可区分;而U2和U3虽然是不同的对象但是在P 下却是相同的,即在p下不可区分,就成为不可 区分
粗糙集:
一个集合若恰好等于基本集的任意并集称为一个清晰 (crisp)集(精确集),否则称为粗糙(rough)集(不 精确集)。 解释:都可区分的是清晰集,有不可区分的对象为粗糙 集 主要特点:以不完全信息或知识去处理一些不分明现象的 能力,或依据观察、度量到的某些不精确的结果而进行分 类数据的能力. 粗糙集体现了集合中元素间的不可区分性. 主要优势:它不需要提供问题所需处理的数据集合之外的 任何先验知识,而且与处理其它不确定性问题的理论有很 强的互补性.
粗糙集理论所处理的问题
•不确定或不精确知识的表达; •经验学习并从经验中获取知识; •不一致信息的分析; •根据不确定,不完整的知识进行推理; •在保留信息的前提下进行数据化简; •近似模式分类; •识别并评估数据之间的依赖关系
三、粗糙集的应用
粗糙集理论在许多领域得到了应用: ①临床医疗诊断;
②电力系统和其他工业过程故障诊断;
3. 如果P中的任何一条属性都是不 可简约的,那么就称P是独立的 解释:P是独立的说明P中的任何一个属性都是必 不可少的,它独立的表达一个系统分类的特征。
属性约简的算法分析:
初始状态:所有数据已存入数据库(以下为模拟数据)
u 1 2 3 4 5 6
a 1 1 0 1 1 2
b 0 0 0 1 1 1
集合O 的下逼近(即正区) 为 I 3 (O ) = PO S (O ) = {刘保,赵 凯} 集合O 的负区为 N EG (O ) = {李得} 集合O 的边界区为 BND (O ) = {王治, 马丽} 集合O 的上逼近为 I 3 (O ) = PO S (O ) + BND (O ) = {刘保,赵凯,王治,马 丽} 根据表1, 可以归纳出下面几条规则, 揭示了教育程度与 是否能找到好工作之间的关 RUL E 1: IF (教育程度= 大学) OR (教育程度= 博士) THEN (可以找到好工作) RUL E 2: IF (教育程度= 小学) THEN (找不到好工作) RUL E 3: IF (教育程度= 高中) THEN (可能找到好工作)
特别是和模糊理论结合,取得许多丰硕的成果,粗糙理 论理论和模糊理论虽然两者都是描述集合的不确定性的 理论,但是模糊理论侧重的是描述集合内部元素的不确 定性,而粗糙集理论侧重描述的是集合之间的不确定性 两者互不矛盾,互补性很强,是当前国内外研究的一个 热点之一。
粗糙集展望
粗糙集是一种较有前途的处理不确定性的方法, 相信今 后将会在更多的领域中得到应用. 但是, 粗糙集理论还处在继续发展之中, 尚有一些理 论上的问题需要解决, 诸如用于不精确推理的粗糙逻辑 (Rough logic) 方法, 粗糙集理论与非标准分析(Non standard analysis) 和非参数化统计(Nonparam et ric stat ist ics) 等之间的 关系等等. 将粗糙集与其它软计算方法(如模糊集,人工神经网 络,遗传算法等) 相综合, 发挥出各自 的优点, 可望设计出 具有较高的机器智商(M IQ ) 的混合智能系统(Hyb rid In telligen t System ) , 这是一个值得努力的方向.
粗糙集理论建立在这样一个前提上:即所考虑的 论域中的每一个对象都包含某种信息(数据和知 识)。
条件属性集:
数学定义是:P={P1,P2,…,Pm} 解释:就是对象的各种属性总和(也就是数据库中 的字段) Pm 就是这个对象的一个属性
基本集(基本粒度):
定义:所有不可区分的对象形成的集合 解释:可区分(可分辨):如果Ui ≠Uj 就称这两个 对象在其条件P下是可区分的(对于两个不同的对 象至少有一个属性是不同的)否则即为不可区分
3)不完全性:
例:在炒股票中.
4)不一致性:
相同原因产生不一样的结果
5)时变性:
随着时间会改变的事物
一些基本术语
论域:
数学定义是:U={U1,U2,…,Um} 解释:所要处理的所有对象(在数据库中即是所有数据)的总和 例:例如,对于货票集合来说,其任意子集称为一个概念。根据 运输距离对货票 进行分类,可以形成不同的概念: 概念1:运距在500公里(含500公里)以下的货票; 概念2:运距在500公里-1500公里(含1500公里)间的货票; 概念3:运距在1500公里以上的货票。 对于上例来说U就是货票集合,它由价格分成了3个概念即类 (U1,U2,U3)
c 0 0 0 0 0 0
d 1 0 0 1 2 2
E 1 1 0 0 2 2
现在设e为决策属性,其他为条件属性,即对于不同 的对象,不同的条件属性的组合会对决策属性有怎么 样的影响? 算法思路: 基本假设是能影响属性e的只有a,b,c,d四个(即系统 在a,b,c,d,e下可区分) 基本原则是如果所有的条件属性都是一样的两个对象 其决策属性也应该是一样的(因为否则说明这个对象 还有能影响其决策属性的条件属性未被列入表内) 那么如果去掉某个条件属性,对于任意两个不同的决 策属性其他属性都不同,那么这个属性冗余,否则这 个属性必需(即前面的概念2)
所有的这些能够用交、并表示的概念以及 加上上面的三个基本知识(A/R1,A/R2.A/R3) 一起就构成了一个知识系统记为 R=R1∩R2∩R3,它所决定的所有知识是 A/R={{x1,x2},{x3},{x4},{x5},{x6},{x7},{x8}} 以及A/R中集合的并。
近似
下近似集是在那些所有的包含于X的知识 库中的集合中求并得到的,而上近似则 是将那些包含X的知识库中的集合求并得 到的。
除了红的{x1,x2,x6}、大的{x1,x2,x5}、三角形的 {x1,x2}这样的概念以外还可以表达例如 大的且是三角形的{x1,x2,x5}∩{x1,x2}={x1,x2}, 大三角{x1,x2,x5}∩{x1,x2}={x1,x2}, 兰色的小的圆形 ({x5,x7,x8}∩{x3,x4,x7}∩{x3,x4,x6,x7}={x7}, 兰色的或者中的积木 {x5,x7,x8}∪{x6,x8}={x5,x6,x7,x8}。 而类似这样的概念可以通过求交运算得到,比如X1 与Y1的交就表示红色的三角形。
粗糙集 Rough set
制作人:闵玉玲(06) 江丽萍 (12) 吴佳(14)
一、粗糙集的概念 二、粗糙集的特点
三、粗糙集的应用
面对日益增长的数据库,将如何从 这些浩瀚的数据中找出有用的知识? 我们如何将所学到的知识去粗取精? 什么是对事物的粗线条描述什么是 细线条描述?
一、粗糙集的概念
(一)粗糙集概述
一般的,我们可以用 右面的图来表示 上、下近似的概念。
这其中蓝色曲线围的区域是
X的区域,紫色曲线围的部分是内部参考消息,是 下近似,红色曲线围的内部部分就是上近似集。 其中各个小方块可以被看成是论域上的知识系统 所构成的所有划分。 整个粗集理论的核心就是上面说的有关知识、集 合的划分、近似集合等等概念。
③预测与控制;
④模式识别与分类;
⑤机器学习和数据挖掘; ⑥图像处理; ⑦其他。
关于粗糙集算法

研究了粗糙集理论属性约简算法和规则提取启发式算法 例如基于属性重要性、基于信息度量的启发式算法,另 一方面研究和其他智能算法的结合,
如:和神经网络的结合,利用粗糙集理论进行数据预处 理,以提高神经网络收敛速度;和支持向量机SVM结合 和遗传算法结合;
在很多实际系统中均不同程度地存在着不确定性因素, 采集到的数据常常包含着噪声,不精确甚至不完整. 粗 糙集理论是继概率论,模糊集,证据理论之后的又一个 处理不确定性的数学工具 。
(二)相关概念 知识: (举例说明)
A={x1,x2,x3,x4,x5,x6,x7,x8},每个积木块都有颜色 属性,按照颜色的不同,我们能够把这堆积木分成 R1={红,黄,兰}三个大类,那么所有 红颜色的积木构成集合X1={x1,x2,x6}, 黄颜色的积木构成集合X2={x3,x4}, 兰颜色的积木构成集合 X3={x5,x7,x8}。 在这个例子中我们不
从这个简单的例子中, 我们还可以体会到粗糙集 理论在数据分析,寻找规律方面的作用
二、粗糙集的特点
粗糙集方法的简单实用性是令人惊奇的, 它能在创立后的 不长时间内得到迅速应用是因 为具有以下特点:
(1) 它能处理各种数据, 包括不完整( incomp lete) 的数 据以及拥有众多变量的数据; (2) 它能处理数据的不精确性和模棱两可(ambiguity) , 包括确定性和非确定性的情况; (3) 它能求得知识的最小表达( reduct) 和知识的各种不 同颗粒(granu larity) 层次; (4) 它能从数据中揭示出概念简单, 易于操作的模式(pat tern) ;
难看到,一种对集合A 按照颜色这个属性我们就把积木集合 A进行了一个划 的划分就对应着关于A 分(所谓A的划分就是指对于 A中的任意一个元素必然 中元素的一个知识
属于且仅属于一个分类),那么我们就说颜色属性就 是一种 知识
假如还有其他的属性,比如还有形状R2={三角,方 块,圆形},大小R3={大,中,小},这样加上R1属性 对A构成的划分分别为: A/R1={X1,X2,X3}={{x1,x2,x6},{x3,x4},{x5,x7,x 8}} (颜色分类) A/R2={Y1,Y2,Y3}={{x1,x2},{x5,x8},{x3,x4,x6,x 7}} (形状分类) A/R3={Z1,Z2,Z3}={{x1,x2,x5},{x6,x8},{x3,x4,x 7}} (大小分类) 上面这些所有的分类合在一起就形成了一个基 本的知识库。
(5) 它能产生精确而又易于检查和证实的规则, 特别适于智能控制中规则的自动生成. 特点综述:粗糙集理论作为一种处理不精确(imprecise)、不一
相关主题