当前位置:
文档之家› 粗糙集的不确定性度量准则_胡军
粗糙集的不确定性度量准则_胡军
可以证明, / M0 是一个偏序关系. 知识的偏序 关系从知识粒度的角度为比较知识 的含量提供方
法, 即知识越细, 知识含量越丰富, 知识的不确定性
越小. 并且, 若 R 为恒等关系 X, 即
U / X = {X X = { u }, u I U },
知 识 最 细; 若 R 为 全 域 关 系 D, 即
U / D= {X X = U}, 知识最粗. 定义 2[ 2 ] 设 ( U, R ) 为 Paw lak近似空间, 对于
任 意 集合X A U, 也称 为 U中 的一 个概 念, 有 下列
定义:
R (X ) = { x I U [ x ] R H X X ª } = G { [ x ] R I U R [ x ] R H X X ª }, ( 1)
上述研究为粗糙集的不确定性度量提供方法, 但是这些不确定性的度量方法中有些定义在某种情 况下并不合理, 即不符合认知规律. 比如, 王国胤等 指出粗糙集的不确定性度量在正域或负域的知识粒 进行细分时, 其值应该不变, 但粗糙熵却严格递减; 另外, 随着知识粒度的减小, 可能存在粗糙集的线性 模糊度不变或者二次模糊度反而增加的问题 . [ 15] 除 此之外, 我们还发现当粗糙集的下近似为空时, 粗糙 集的粗糙度与粗糙集的上近似无关. 那么, 不确定性 度量必须满足哪些条件. 满足什么条件的不确定性 度量是合理有效的. 如何设计合理有效的不确定性 度量方法. 针对这些问题, 本文从直观的认知角度, 给出粗糙集不确定性度量的基本准则和扩展准则, 并基于此对已有的不确定性度量进行分析, 为已有 的不确定性度量的合理性 ( 或不合理性 ) 提供理论 说明, 也为设计新的不确定性度量方法提供依据.
K ey W ords Uncertainty, Roughness, Rough Entropy, Fuzziness, Fuzzy Entropy, Rough Set
* 国家自然科学基金项目 ( N o. 60573068, 60773113)、重庆市自 然科学 基金重 点项目 ( N o. 2008BA 2017) 和重庆 市杰出 青年科
粗糙集理论是由波兰科学家 P aw lak在 1982年 提出的一种处理不确定性的有效工具 [ 8] . 该理论基于 等价关系, 将论域中的对象分割成一些不相交的等价 类, 并且这些等价类构成论域上的一个划分. 论域中 的子集若能够表示为这些等价类的并, 则称该子集是 确定的 ( 同时该子集也称为论域中的可定义集 ) , 否则 称该子集是粗糙的. 若某个子集是粗糙的, 则可用两 个可定义集来近似描述它, 即上、下近似. 其中, 下近 似是包含于该子集的最大可定义集, 上近似是包含该 子集的最小可定义集. 粗糙集理论由于具有不依赖于 领域先验知识的优点, 现已被广泛应用到知识获取、 机器学习和模式识别等多个领域.
2 Paw lak粗糙集基本概念
有序对 (U, R ) 称为 P aw lak 近似空间, 其中, U 是有限非空论域, R 为 U 上的一个等价关系 (即自 反, 对称, 传递 ). 根据 R 可将 U分割成一些不相交的
60 8
模式识别与人工智能
23 卷
等价类, 这些等价类构成论域上的知识, 记为 U /R.
人们分别用概率论、模糊集理论和粗糙集理论
去研究随机性、模糊性和粗糙性, 是从不同的角度去 认识不确定性. 在实际问题中, 有可能同时存在多种 形式的不确定性, 这就要求将几种不同的理论工具 进行结合, 比如模糊粗糙集或粗糙模糊集就是模糊 集理论与粗糙 集理论的结合 [ 3] . 并且, 这些不同形 式的不确定性还可以相互转化, 从而可用处理某种 不确定性的理论工具对其它的不确定性进行处理, 比如粗糙集的模糊性就是用模糊集的方法来研究粗 糙集的不确定性 [ 4- 5] , 而模糊集的粗糙性则是用粗 糙集的方法来研究模糊集的不确定性 [ 6- 7] .
求属性重要性、属性核和属性约简是粗糙集理 论中的几个主要问题, 而不确定性度量又是这些问 题的关键. 在粗糙集理论中, 根据度量的对象, 不确 定性度量可分为, 知识的不确定性度量、粗糙集 ( 概 念 ) 的不确定性度量和 决策规则的不确定性度量. 知识的不确定性度量从数量上反映近似空间的知识 含量, 比如知识的信息熵 [ 9 - 10] 、粗糙熵 [ 11- 12] 等即是 对知识不确定性的度量. 粗糙集的不确定性度量反
第 23卷 第 5 期 2010年 10月
模式识别与人工智能 PR & A I
V o.l 23 N o. 5 O ct 2010
粗糙集的不确定性度量准则*
胡 军 1, 2
王国胤 1
1 (重庆邮电大学 计算机科学与技术研究所 重庆 400065) 2 (西安电子科技大学 电子工程学院 西安 710071)
Chongqing 400065) 2 ( School of E lectronic Engineering, X id ian University, X ia'n 710071)
ABSTRACT
S ince som e uncertainty m easures o f rough sets are unreasonab le under som e circum stances, a basic rule set o f uncerta inty m easure o f rough set is proposed from the perspective of intuition. A ll the uncertain ty m easures ex cept the quadratic fuzziness satisfy the basic rule se.t T he uncerta inty m easures satisfy ing the basic rule set st ill have unreasonab ility, and thus an ex tended rule set is further developed. The fuzzy entropy and rev ised fuzziness are the uncertainty m easures satisfy ing the ex tended ru le se,t w hile the roughness, rough entropy and linear fuzziness are no.t T he results prov ide theo retica l basis o f the reasonab ility or unreasonab ility for the ex isting uncerta inty m easures, and it is a foundat ion for design ing new uncertainty m easures.
[ x ] R 表示包含对象 x 的等价类, 称为知识粒. 定义 1[ 19] 设 R 1 和 R2 是论域 U 上的两个等价
关系, 若 P x I U ( [ x ] R 1 A [ x ] R2 ), 则称知识 U /R 1 较 U /R 2 细, 记为 U /R 1 M U /R2, 简记 为 R 1 M R 2. 若 P xI U ( [ x ] R1 = [ x ] R 2 ), 则称知识 U /R 1 与 U /R 2 相 等, 记为 U /R 1 U U /R2, 简记为 R1 U R2. 若 U /R1 M U /R 2 且 U /R1 X U /R 2, 则称知识 U /R 1 较 U /R2 严格 细, 记为 U /R 1 ; U /R 2, 简记为 R1 ; R 2.
映给定近似空间对概念的近似能力, 对此研究者提 出粗糙度 [ 2] 、粗 糙熵 [ 13- 14] 、模 糊度 [ 4 ] 、模糊熵 [ 5] 和 修正模糊度 [ 15] 等. 决策规则的不确定性度量有近似 分类精度 [ 16] 、近似分类质量 [ 16] 和条件信息熵 [ 17 - 18] 等, 它反映近似空间对决策的分类能力. 可见, 知识 的不确定性对概念的不确定性和决策规则的不确定 性有决定作用. 反之, 粗糙集的不确定性和决策规则 的不确定性也一定程度反映知识的不确定性.
关键词 不确定性, 粗糙度, 粗糙 熵, 模糊度, 模糊熵, 粗糙集 中图法分类号 T P 181
Uncertainty M easure R ule Sets of R ough Sets
HU Jun1, 2, WANG G uo-Y in1 1 ( Institute of Com puter Science and T echnology, Chongqing University of Posts and T elecomm unications,
关于粗糙集的不确定性度量, 目前主要有粗糙 度、粗糙 熵、模 糊度 ( 包括 线性模糊 度和二次 模糊 度 ) 、模糊熵和修正模糊度. 其中, 粗糙度基 于粗糙 集的代数特征, 它在数量上等于边界域与上近似中 元素个数的比值 [ 2 ] . 粱吉业等借 用熵的称谓, 将粗 糙熵定义为知识粗糙熵与粗糙度的乘积 [ 13] , 该定义 和 Beaubouef 等 所 提 出 的 粗 糙 熵 本 质 上 是 一 致 的 [ 14] . Chakrabarty等通过量化论域中对象与目标集 合的隶属关系, 基于模糊性与粗糙性在反映不确定 性上的一致性, 提出粗糙集的模糊度, 从而用模糊集 的方法间接对粗糙集的不确定性进行量化分析, 为 粗糙集的不确定性度量 提供新思路 [ 4] . 此后, 基于 和 Chakrabarty 同样的思路, L iang 等提出 粗糙集的 模糊熵 [ 5] , 王国胤等提出一种模 糊度, 这里 将其称 为修正模糊度 [ 15] .
国胤, 男, 1970年生, 教授, 博士生导师, 主要研究方向为粗糙集理论、粒计算、知识技术、神经网络、数据挖掘等.