当前位置:文档之家› 粗糙集理论与其它不确定理论的比较分析

粗糙集理论与其它不确定理论的比较分析

文章编号:1672-6197(2004)04-0007-05粗糙集理论与其它不确定理论的比较分析程钧谟1,綦振法1,徐福缘2,段福兴1(1.山东理工大学管理学院,山东淄博255049;2.上海理工大学管理学院,上海200093)摘 要:粗糙集理论作为一门新兴的不确定理论正越来越受到人们的关注.在介绍粗糙集理论基本内容的基础上,对粗糙集理论与模糊理论、随机理论、灰色理论等其它不确定理论的差异性进行了分析,同时讨论了它们之间的互补性问题并构建了相应的互补模型,最后,指出了粗糙集理论对于进一步丰富和完善不确定理论体系的重要性.关键词:粗糙集理论;模糊理论;随机理论;灰色理论;差异性中图分类号:O159 文献标识码:AR elative analysis on rough set theory and other uncertain theoriesCHEN G J un 2mo 1,Q I Zhen 2fa 1,XU Fu 2yuan 2,DUAN Fu 2xing 1(1.School of Management ,Shandong University of Technology ,Z ibo 255049,China2.School of Management ,Shanghai University for Science and Technology ,Shanghai 200093,China )Abstract :As a new uncertainty theory ,the rough set theory is engaging more and more people ’s attention.The basic concepts of rough set are introduced.On the base of this ,the difference be 2tween the rough theory and other uncertain theories such as fuzzy theory ,random theory and grey theory is analyzed.At the same time ,the complementary problems are discussed and the comple 2mentary models are established.At last ,the importance of the rough theory on making the indefi 2nite theory perfect is pointed out.K ey w ords :rough theory ;fuzzy theory ;random theory ;grey theory ;difference管理活动是由一系列决策组成的.在市场竞争非常激烈的今天,无论企业或个人都经常面临复杂的决策问题,不仅需要快速做出决策,而且需要分析与解决决策问题中多重不确定性所带来的困难.一个管理者的决策有效与否,很大程度上取决于他是否拥有适应这种复杂化的决策思想和方法.目前,不确定性决策问题已普遍存在于管理科学、信息科学、系统科学、计算机科学、知识工程及可靠性技术等众多领域,其表现形式也是多种多样的,如随机性、模糊性、灰色性、粗糙性、模糊随机性、粗糙模糊性以及其它多重不确定性.虽然已有的随机理论[1]、模糊理论[2,3]、灰色理论[4]可以解决一部分随机决策、模糊收稿日期:2004-03-23基金项目:国家863资助项目(2002AA414310);国家自然科学基金项目(70072020);山东省重点社科项目(03BJ Z12)作者简介:程钧谟(1964-),男,教授,博士研究生. 第18卷第4期 山 东 理 工 大 学 学 报(自然科学版) Vol.18No.42004年7月 Journal of Shandong University of Technology (Sci &Tech ) J ul.2004决策、灰色决策问题,但由于以上方法对研究对象都有明确的条件设定,因此在解决不确定性决策问题时必然带有较大的局限性.粗糙集理论作为一种处理不精确、不确定与不完全数据的新的数学理论,最初是由波兰数学家Z.Pawlak 于1982年提出的[5].由于最初关于粗糙集理论的研究大部分是用波兰语发表的,因此当时没有引起国际计算机学界和数学界的重视,研究地域也仅局限在东欧一些国家,直到20世纪80年代末才逐渐引起各国学者的注意.近几年来,由于它在机器学习与知识发现、数据挖掘、决策支持与分析等方面的广泛应用,研究逐渐趋热.1991年Z.Pawlak 的专著[6]和1992年应用专集[7]的出版,对这一段时期理论和实践工作的成果作了较好的总结,同时促进了粗糙集在各个领域的应用.1995年,ACM Communi 2cation 将其列为新浮现的计算机科学的研究课题.1998年,国际信息科学杂志(Information Sciences )还为粗糙集理论的研究出了一期专辑.近几年来,关于粗糙集的理论研究已越来越热,有关这方面理论与应用研究的文章近几年来被SCI 收录的数量急剧上升.目前,对粗糙集理论的研究主要集中在:粗糙集模型的推广,问题不确定性的研究,纯粹的数学理论方面的研究,粗糙集的算法研究和人工智能其他方向的研究等.粗糙集理论在数据挖掘、数据分析、控制理论等领域已有了初步的应用.1 粗糙集理论的有关概念粗糙集理论是一种刻划不完整性和不确定性的数学工具,它能有效地分析不精确、不一致、不完整等各种不完备信息.从集合的角度看,粗糙集理论依据对某一集合的隶属程度对问题的论域划分为三部分:肯定属于此集合、肯定不肯定属于此集合和可能属于此集合.其有以下特点:①处理各种数据,包括不完整数据和拥有众多变量的数据;②处理数据的不精确性和模棱两可,包括确定性和不确定性的情况;③求得知识的约简;④从数据中揭示出概念简单、易于操作的模式.粗糙集理论(rough set theory )最早是由Z.Pawlak 于20世纪80年代提出的[8]:给定一个有限的非空集合U 称为论域,H 为U 中的一组等价关系,即关于U 的知识,则二元对(pair )K =(U ,R )称为一个近似空间(approximation space ).设x 为U 中的一个对象,X 为U 中的一个子集,H (x )表示所有与x 不可分辨的对象所组成的集合,换句话说,是由x 决定的等价类,即H (x )中的每个对象都与有相同的特征属性(attribute ).集合X 关于H 下近似(lower approximation )定义为 H (X )={x ∈U |H (x )ΑX}H (X )实际上由那些根据现有知识判断肯定属于X 的对象所组成的最大的集合,有时也称为X 的正域,记作POS (X ).类似地,由根据现有知识判断肯定不属于X 的对象组成的集合称为X 的负域,记为N EG (X ).集合X 关于H 上近似定义为 H (X )={x ∈U |H (x )∩X ≠ }H (X )是由所有与X 相交非空的等价类H (x )的并集,是那些可能属于X 的对象组成的最小集合,显然H (X )+EN G (X )=论域U.集合X 的边界域定义为 B U N (X )=H (X )-H (X )B U N (X )为集合X 的上近似与下近似之差.如果B U N (X )是空集,则称X 关于H 是清晰的;反之,如果B U N (X )不是空集,则称X 为关于H 的粗糙集.这一理论为处理具有不精确数据和不完全信息提供了一种新的框架.粗糙集理论是建立在分类机制的基础上的,它将分类理解为在特定空间上的等价关系(不可分辨性,indiscernibility ),而等价关系构成了对该空间的划分.8 山 东 理 工 大 学 学 报 2004年 2 粗糙集理论与模糊理论、随机理论及灰色理论的差异比较分析粗糙集和模糊集、随机集、灰色集在处理不确定性和不精确性问题方面都推广了普通的集合理论.它们都是研究信息系统中知识不完全、不确定问题的重要方法.但它们的着眼点和研究方法是不同的(见表1).1)粗糙集理论着眼于集合的粗糙程度,模糊理论着眼于集合的模糊性,随机理论着眼于集合的随机性,灰色理论着眼于集合的灰色朦胧性.2)粗糙集理论是基于集合中对象间的不可分辨性思想,模糊理论建立集合的子集边缘的病态定义模型,随机理论则基于集合中随机事件发生的概率,灰色理论是通过灰序列生成来进行的.3)从知识的“粒度”的描述上来看,粗糙集理论是通过一个集合关于某个可利用的知识库的上下近似来描述的,而模糊集理论是通过对象关于集合的隶属程度来近似描述的,随机理论是通过集合中对象出现的可能性来描述的,灰色理论则强调“少数据建模”.4)从集合的关系来看,模糊集理论强调的是集合边界的病态定义上的,即边界的不分明性,而粗糙集理论强调的是对象间的不可分辨性,随机理论则强调集合中事件的随机性,灰色理论强调的是贫信息不确定性.5)从研究的对象来看,模糊集理论研究属于同一类的不同对象间的隶属关系,强调隶属程度,而粗糙集理论研究的是不同类中的对象组成的集合关系,强调分类,随机理论研究不同对象的概率分布情况(概率密度函数),强调概率,灰色理论研究的是“外延明确,内涵不明确”的对象.6)粗糙集理论的计算方法是粗糙隶属函数与上下近似函数的产生,模糊集理论的计算方法主要是连续特征函数的产生,随机理论则是通过期望函数或方差进行,灰色理论则侧重于灰数的产生.表1 粗糙集理论与模糊集理论、随机理论及灰色理论的差异比较粗糙集理论模糊集理论随机理论灰色理论对象间关系的基础对象间的不可分辨关系概念边界的不分明性数据的随机性部分信息已知,部分信息未知不精确刻划方法粗糙度隶属程度概率灰数测度研究方法对象的分类隶属函数概率分布函数灰序列生成对知识的近似描述上、下近似集隶属程度概率灰数先验知识不需要需要需要不需要与普通集合的联系H (X )和H (X )ΑλP (X ) 计算方法粗糙度函数与上下近似集合连续特征函数产生数学期望和方差灰数白化与灰度3 粗糙集理论与模糊集理论、随机理论和灰色理论的互补性分析由于Pawlak 的粗糙集理论是基于可利用信息的完全性的,它对不确定集合的分析方法是客观的,但该理论忽视了可利用信息的模糊性和可能存在的统计信息,而模糊集的隶属函数多数是凭经验给出的,随机理论的概率值也是由人们的经验和知识(主观概率)或事件在大量的重复实验中实验结果的相对频率(客观概率)来表达的,因而隶属函数与主观概率就带有明显的主观性,这也使得我们在研究决策问题时如果能够将粗糙集理论与模糊理论、随机理论、灰色理论结合起来考虑会得到更好的效果.1)模糊—粗糙集合[9]当知识库中的知识模块是清晰的概念,而被描述的概念是一个模糊概念,则人们可以通过建立模糊—粗糙集模型来解决此类问题的近似推理.这时如果把模糊集合中的隶属度看作是模糊集理论中的属性值,知识表达的模糊性依赖于由对象的可用属性值描述,数据库中病态描述的对象可以用属性值集合的可能性分布来表达,这些可能性分布就构成了模糊—粗糙集模型.9第4期 程钧谟,等:粗糙集理论与其它不确定理论的比较分析设U是有限对象构成的论域,H是U上的等价关系,X是U中的一个模糊集合,通过等价关系H 表达的模糊集合X的上近似H(X)和下近似H(X)都是U/H的模糊集合.其隶属函数可分别定义为 μH(X)(x)=inf{μX(y)|y∈H(x)},x∈U μ H(X)(x)=sup{μX(y)|y∈H(x)},x∈U若μH(X)(x)=μ H(X)(x),则称X是可定义的,否则称是模糊—粗糙集.μH(X)(x)表达了对象x肯定属于模糊集合(事件)X的隶属程度,μ H(X)(x)表达了对象x可能属于模糊集合(事件)X 的隶属程度.Pawlak粗糙集模型是基于确定性知识库的,即它的近似空间是完全确定的,因此它忽视了可利用信息库的不确定性,若仍旧按照Pawlak粗糙集模型来处理由随机产生的知识库的数据分析等问题就不能完全反映问题的实质,为此可将粗糙集理论与随机理论结合起来,建立相应的概率粗糙集或随机粗糙集.2)概率—粗糙集合设是有限对象构成的论域,H是U上的等价关系,其构成的等价类为 U/R={X1,X2,…,X n}仍记x所在的等价类为H(x),令P为定义在U的子集类构成的σ代数上的概率测度,三元组A p= (U,R,P)成为概率近似空间,U中的每个子集称为概念,它代表了一个随机事件,P(X/Y)表示事件Y发生下X出现的条件概率,也可以解释为随机选择的对象在概念Y的描述下属于X的概率.设0≤β<α≤1,对于任意的XΑU,定义X关于概率近似空间A p=(U,R,P)依参数α,β的概率下近似Pα-(X)和上近似P-β(X)如下: Pα-(X)={x∈U|P(X|H(x))≥α} P-β(X)={x∈U|P(X|H(x))>β}X关于A p依参数α,β的概率正域、负域和边界域分别为 POS(X,α,β)=Pα-(X) N EG(X,α,β)=U-P-β(X) B U N(X,α,β)=P-β(X)-Pα-(X)当Pα-(X)=P-β(X)时,称X依参数α,β关于A p是概率可定义的,否则称X依参数α,β关于A p 是概率粗糙集.3)基于随机集的粗糙集合设U和W是两个有限非空集合,(U,2U,P)为概率空间,显然(2W,σ(2W))是一个可测空间,这样任何一个集值函数F∶U→2W就是一个随机集,称四元有序组A=(U,W,F,P)为随机集近似空间,对于任意X∈2W,定义X关于A pp-F(X)的下近似和上近似A pp-F(X)为 A pp-F(X)={u∈U|F(u)ΑX} A pp-F(X)={u∈U|F(u)∩X≠ }当A pp-F(X)=A pp-F(X)时,称X关于近似空间A是可定义的,否则称X关于近似空间A是粗糙的.4)灰色—粗糙集合设A={x|p(x)}是论域X上的非空集合,若对任意的x∈A,x对认定(或划定)“x∈A”或“p (x)”的信息可能不完全,则称其不完全程度为x对A的点灰度,记作v A(x),v A(x)为映射X→[0,1],称为点灰函数或点灰度分布.X上的灰色子集或灰色集合就是被划定属于A且具有点灰度v A(x)的元素x的集合,记作A.A的元素x称为灰元,v A(x)>0的元素x称为真灰元,v A(x)=0的元素x称为白元.设α∈[0,1],v H(y)表示y对认定(或划定)“y∈H(x)”的程度,令Hα(x)={y|v H(y)≤a}表示01 山 东 理 工 大 学 学 报 2004年 允许点灰度为α的等价关系集合.定义集合X 关于H α下近似H α(X )和上近似 H α(X )为 H α(X )={x ∈U|H α(x )ΑX} H α(X )={x ∈U |H α(x )∩X ≠} B U N (X )=H α(X )-H α(X )如果B U N (X )是空集,则称X 关于H α是灰色可定义的;反之,如果B U N (X )不是空集,则称X 为关于H α的灰色—粗糙集.4 结 语目前人们在处理不确定问题时,一般是通过随机理论、模糊理论或灰色理论来进行的,而粗糙集理论解决问题的出发点是系统中元素的不确定性和不可分辨性,如果将该理论与上述不确定理论结合起来进行研究,则可以更客观有效地处理现实中越来越复杂的不确定问题,弥补单一理论研究不确定问题的不足.本文从差异性和互补性两个方面对粗糙集理论与随机理论、模糊理论和灰色理论进行了比较分析,认为将粗糙集理论与其他不确定理论结合起来处理不确定问题会使获得的结果更加可观、有效.参考文献:[1]李世楷.随机集与集值鞅[M ].贵州:贵州科技出版社,1994.[2]陈守煜.系统模糊决策理论与应用[M ].大连:大连理工大学出版社,1994.[3]李栋祥,郑兆青.模糊多属性决策方法及其在模糊优选中的应用[J ].山东理工大学学报,2003,17(2):51255.[4]陈大为.灰色模糊集合引论[M ].哈尔滨:黑龙江科学技术出版社,1994.[5]Pawlak Z.Rough Set [J ].International Journal of Computer Information Science ,1982,11(5):3412356.[6]Pawlak Z.Rough Sets ,Theoretical Aspects of Reasoning about Data [M ].Dordrecht :K luwer Academic Publishers ,1991.[7]Slowinski R.Intelligent Decision Support -handbook of Applications and Advances of the Rough Sets Theory [M ].Dordrecht :K luwer A 2cademic Publishers ,1992.[8]曾黄麟.粗糙集理论与应用[M ].重庆:重庆大学出版社,1998.[9]Cattaneo G.Fuzzy Extension of Rough Sets Theory [C].Proceedings of the International Conference on Rough Sets and Current Trends inComputing.Warsaw :Springer 2verlag ,1998.11第4期 程钧谟,等:粗糙集理论与其它不确定理论的比较分析。

相关主题