当前位置:文档之家› 变精度粗糙集模型与应用

变精度粗糙集模型与应用

第9卷第4期 太原师范学院学报(自然科学版) Vo1.9 No.4 2010年l2月 JOURNAI OF TAIYUAN NORMAL UNIVERSITY(Natural Science Edition)Dec. 2010 

变精度粗糙集模型与应用 

张国荣 王治和 周 涛 

(西北师范大学数学与信息科学学院,甘肃兰州730070) 

(摘要] 介绍了Ziarko变精度粗糙集模型、8约简和广义变精度粗糙集模型;讨论了广义变精 度粗糙集模型8上、下近似算子的基本性质,分析了该模型与Ziarko变精度粗糙集模型之间的关 系,最后用实例分析了0约简过程. (关键词] 变精度粗糙集模型;B约简;广义变精度粗糙集模型 [文章编号] 1672—2027(2010)04—0014-04 (中图分类号]TPI8 [文献标识码] A 

0 引言 

近年来,随着计算机、网络和通讯等信息技术的急速发展,数据日益丰富,但数据分析工具贫乏,因此系 

统地开发数据挖掘工具就成为焦点.粗糙集(Rough Sets)是由Pawlak于1982年提出的一种数据分析理论, 是研究不完整数据、不确定知识表达的新型数学工具,能够处理模糊不精确、不确定或不完全信息,不需要预 

先给定某些特征或属性的数量描述,直接从给定问题的描述集合出发,通过一对上、下近似算子确定给定问 题的近似域,从而找出该问题的内在规律.粗糙集理论已经成为数据挖掘的一种新工具,并且在该领域获得 了成功的应用.但传统粗糙集理论建立在等价关系上,这限制了它在实际中的应用.于是Ziarko提出了变精 

度粗糙集模型.它是Pawlak粗糙集模型的扩展,基本思想是在Pawlak粗糙集模型中引入参数B(O≤ < 

0.5),即允许一定程度的错误分类率存在. 

1 Ziarko变精度粗糙集模型[1q] 

定义1 设x和y表示有限论域U的非空子集.令 

f(x,y)一 1一l X n Y l/l x『, !x!>o, l 0, I I一0. 其中,f x}表示x的基数.称c(x,y)为集合x关于集合y的相对错误分类率. 

定义2 设(U,R)为近似空间,其中论域【,为非空有限集合,R为U上的等价关系,U/R一{E ,Ez,…, E }为R的等价类或基本集构成的集合.对于X u,0≤p<0.5,定义x的 下近似、 上近似、 边界域、卢 

负域分别为: 

R x—U{E∈u/R J c(E,x)≤ , R X—U{E∈U/Rl c(E,X)<1-8}, 

bnr ̄X—U{E∈U/RIp<c(E,X)<1-p}, negr ̄X—U{E∈U/RI c(E,X)≥1一 }. X的p正域(或X的 下近似)可理解为将U中的对象以不大于p的分类误差分于X的集合.x的 负 

域为将【,中的对象以不大于 的分类误差分于~x的集合.X的卢边界域是由那些以不大于卢的分类误差 既不能分类于x又不能分类于~x的U中的对象所构成的集合. 

定理1 对于V x L,,R8(X)一negr ̄(~X),其中,~X一【,一x. 

收稿日期:2010-09—14 作者简介:张国荣(1978一),女,山西五台人,忻州师范学院专科部助教,西北师范大学在读硕士研究生,主要从事数据库技术及应用 研究.

 第4期 张国荣:变精度粗糙集模型与应用 15 

证明  ̄(x)=U{EEU/RIf(E, )≤ }一u{EEU/RI ≤ )一 

u{EE U/R I 1一 ≥1一 )二=:u{ E UIR I f(E,~x)≥l一 )===neg (~x). 

1.1近似质量 

设P C,分类质量 (P,D)定义为 (P,D)一』__ 一J_ , 

其中,Uveu/oind(P)口Y为决策属性集D相对于条件属性集C在 下的正域,反映了在给定分类正确率卢下, 知识能正确分类的能力. 

1.2近似约简 条件属性C关于决策属性D的口近似约简满足以下两个条件: 

1) (.P,D)一 (red(C,D),D); 2)从red(C,D)中去掉任何一个属性,都将使1)不成立. 其中,red(C。D)为C的一个属性子集. 

2广义变精度粗糙集模型嘲 

定义3设U是有限非空的论域,R是U上一个任意二元关系,称(U,R)为广义近似空间.对于任意的 

子集XCU,o<fl<o.5,N( )为z的邻域,x关于广义近似空间(【,,R)的 下近似、卢上近似、 边界域和 负域分别定义为: 

apr ̄X—U{N( )I c(N( ),X)≤口}, 

aprpX=U{N( )I c(N(z),X)<1一 }, 

bnr X—U{N(Iz)I <f(N(z),X)<1-8}, negreX—U{N(z)l c(N( ),X)≥1-8). 

命题1 设(U,R)为广义近似空间,对于V X U,apre(~X)一negr ̄(X),其中,~X===U—X. 

证明 (~x)一u{N( 删( ~x }一u{№)l1一 ≤ }一 

u{N( )I ≤ }一U{N(z)l 1~ ≥1一卢)一negra(x). 

命题2设(U,R)为广义近似空间,o ̄p<o.5,则广义变精度粗糙近似算子满足性质: 1)apraX ̄aprpX. 

2)当R自反时,ap U一 【,一【,. 

3)aPDO=apr ̄0—0. 

4)x y 型 y;aprpX ̄__aprpY. 5)apr ̄(Xny) ̄aprpX(7 apr ̄Y. 

6)april(XUY) ̄__aprpX Uapr。Y. 

7)apra(XUy) ̄__一aprBX UaprCY. 

8)apr ̄(Xny) ap n apDY. 

9)a≥ X 型 ;apr.XiaprCX. 证明性质1)由上、下近似的定义直接推出. 2)若存在yE U,对于任意SC E U,有y N(z),apr ̄U—apr ̄U=/=U.而R自反时,c(N( ),U)一0,有 

ap U一型pU一【,,原式得证. 

3)VxEU,若N(z)一0,则c(N(z), )一o<p,apr ̄O=apr ̄0=0;若j N(z)≠D,有 

c(N( ),0)一l>p且f(N( ),0)一1>1一 ,故原式得证.

 16 太原师范学院学报(自然科学版) 第9卷 

4)x y时f(N( ),x)≥c(N( ),y),故 x 型py; x y. 

5)XNYC_X,X r3y y.由性质4),可得 (XfflY) ̄aprpX, (XfflY) ̄aprpY. 故apr ̄(xny) 型 apreY.同理可证性质6)、7)、8). 

6)当a≥p时,V f(N(z),x)≤卢推出c(N(-z),x)≤a,故 ≥ apr.X___ ̄aprCX,一apr x 口x. 

2.1 与Ziarko变精度粗糙集模型的关系 

设(u,R)为广义近似空问,当R是等价关系时,N( )即为变精度粗糙集模型中的 的等价类E,从而 

fapr ̄X—U{N(z)l c(N(z),x)≤卢} 

lapr ̄X—U{N(z)l c(,\,(z),x)<l一 } 等价于 

faprpX—U{E∈U/R l c(E,X)≤ } 

aprpX—U{E∈U/R I c(E,x)<1一 ) 即经典的变精度粗糙集模型可以看成是广义变精度粗糙集模型限定在等价关系下的特例. 

3 算例 

求决策表的|8约简.数据集如表1. 

表1 决策表 Table】Decision tahlP 

其中,c一{e ,e。,e。,e ,e )为条件属性集,D一{d)为决策属性集. 

Step 1 首先求条件属性c的等价类. . 

U/{e1}一{{ 】, 2, 5, 6,aT8),{353, 4, 7, 9)), 

L,/{e2}一{{.271,z2, 4, 5,z6,z8,lz9),{ 3,377}} U/{e3}一{{aT.1,z4,z9},{ 3,z7),{ 2,,2g5,376,.aT8}) L,/{e4}:{{z1,,aT2,373, 4,z5, 6,.aT8, 9},{lz7}} 

U/{e5}:{{ 1, 2,z4,356, 7,Lz8, 9},{z3,z5}} 经过求各属性间的交集运算,得到条件属性C的等价类为:X 一{.z },X 一{35。},X。:{ z , 。),X 

一{ 4,359},xs一{z5},X6一{.277).决策属性D的等价类:D1一{ 1,z2,Iz3,z4},D2一{-z5, 6, 7,z8, 9}. 

利用公式f(x,y):=二{1一。xn 。/。x :xI>一,,可得c(X1,D1)=10 0 一 =。,同理f(x , l , l X l一, 一 l 1 J …一 … 

D1)一0,f(X3,D2)一0.333,f(Xl,D1)一0.5,c(X5,D2)一0,c(X6,D2)一0. 当 ∈[O.333,O.5)时,利用公式 (P,D)一 一 ,可得y一7/9,决策属性 

集D相对于条件属性集C在 下的正域为{z ,.z , 。5775, ,357,z }. 

Step 2 xCTNf ̄集 },利用上面所求结果,知U/{ }一{ ,x ,X。),其中x 一{ , , 。},X。一 { 3,357},xs一{352,355,z6, s}.同上类似,利用公式,计算得c(x】,D1):=:0.333,c(X2,D )一0.5,c(X。,D ) 一0.25 1 1 l 1 O O O O O 一2 2 l 2 1 2 2 2 2 

一l 2 O 1 2 2 O 2 l 第4期 张国荣:变精度粗糙集模型与应用 17 

当 ∈[O.333,0.5)时,求得y一7/9,决策属性集D相对于属性集{ 。}在卢下的正域为{27 , ,z , , 

6,z8,z9}. Step 3 对于属性集{e ,e。,e5),【,/{e1,e3,e )==={X1,X2,X。,X ,X5,X6},其中,X 一{z1),X2一{z3}, 

X3一{z2,z6, 8}, 4一{ 4,z9),X5一{ 5),X6:fz7). 同上类似,得C(X1,D1)一0,C(X2,D1)一0,C(X3,D2)一0.333,f(X4,D1)=0.5,C(X5,D2)=0,f(X6, 

D2)一0. 当 ∈[O.333,0.5)时,y一7/9,决策属性集D相对于条件属性集{P。,P。 )在卢下的正域为{ ,z ,z。, 

5,St"6,z7, 8}. Step 4据Ziarko所给约简定义,约简实质上是约简前后决策表的信息不发生变化,对任意o<fl<o.5, 都能保持分类质量与原决策表相同,故得出属性集{e ,e。,e }和{e。}都是原决策表的约简. 

从上述分析过程不难看出,Ziarko的约简定义其实并不稳定,约简过程会产生反复.本例就是一个最好 的说明.属性集(e ,e。,e }是原决策表的一个约简,但去掉任一属性,如e ,则并不是原决策表的约简,但再去 

掉属性e。后,属性集{e。)又成了原决策表的约简. 

4 结束语 

变精度粗糙集理论有效扩充了传统粗糙集理论,阈值 的引入,增强了模型的知识分辨能力,同时也为 近似决策规则的获取打下了基础.在 约简过程中,由于约简子集的不唯一性,因此,每次约简需到单属性为 

止.如何将相关理论研究结果应用于信息系统知识发现是下一步要解决的问题. 参考文献: [1]Ziarko W,Variable precision rough set model[J].Journal of Computer and System Science,1993,46(1):39—59 [2]张文修,吴伟志,梁吉业,等.粗糙集理论与方法[M].北京:科学出版社,2001 [3]赵越岭,王建辉,顾树生.基于变精度粗糙集阈值的选取EJ].控制与决策,2007,22(1):78—80 [4]周杰,王加阳,罗安.变精度粗糙集模型约简层次研究[J].计算机工程与应用,2007,43(12):173—176 [53孙士保,姚磊磊,吴庆涛,等.变精度粗糙集模型及其应用研究[J].计算机工程与应用,2009,45(7):10—13 

相关主题