粗糙集理论与算法初步
粗糙集合论的成员关系
粗糙包含关系 知识库K=(U,S),R IND(K)的一个等价关系, 对任意U中的集合X,Y定义: 1)X为R下粗包含于Y R X R YX Y R
2)X为R上粗包含于Y
R X R Y X Y R
3)X为R下粗包含于Y,且同时X为R上粗包含 Y 于Y,称X粗包含于Y,记作 XR
粗糙集理论与算法初步
2012.9.19
第零节
前言
粗糙集发展历程
1970s,Pawlak和波兰科学院、华沙大学 的一些逻辑学家,在研究信息系统逻辑特 性的基础上,提出了粗糙集理的思想。 在最初的几年里,由于大多数研究论文是 用波兰文发表的,所以未引起国际计算机 界的重视,研究地域仅限于东欧各国。 1982年,Pawlak发表经典论文《Rough sets》,标志着该理论正式诞生。
近似分类质量
RU
R U U
粗糙集的数值特征
系统参数的重要度 知识库K=(U,S),RIND(K)表示描述系统特 性的一组或单个系统参数。U中任意的概念 X以及独立于系统参数R的划分,有 参数R的重要度 U b n RX
s ig RX
U
Ub n X
粗糙集的近似集R0.5的提出
这里定义相似度为:
s(A, B) A B A B
隶属度函数定义: 非空论域U,以及等价关系R,以及U中的 对象子集X,对于任意的xX,隶属度定义 为: X xR R R0.5的定义 X (x) xR
粗糙集的近似集R0.5的提出
由近似度定义可以得到粗糙集的上下近似 集的表达 R R xx U , x 1 X X
知识范畴并的约简 知识库K和其上的子集簇 Sub(2U)=F={X1,…,Xn},对任意的GF,若 : 1)G在∪G中是独立的 2)∪G=∪F G R E D ( F ) 称G是∪F的一个约简,记作 。 知识范畴的核 注:知识范畴并的核是唯一的但不满足 C O R E (F ) R E D F
知识的相对约简与相对核
必要性 知识库K=(U,S)和知识库中的两个等价 关系族P,QS,对于任意P中的R,若 POSIND(P)(IND(Q) ≠ POSIND(P-{R}) (IND(Q) 成立,称R为P中Q必要的。 独立性 如果对每一个P中R,R都是P中Q必要的, 称P是Q独立的,否则称P是Q依赖的。
R X R X , R X , R X U
2)R-内不可定义,若 3)R-外不可定义,若
4)R-全不可定义,若
R X R X , R X , R X U
R X R X , R X , R X U
知识范畴的相对约简与相对核
知识范畴的相对约简 知识库K和其上的子集簇 Sub(2U)=F={X1,…,Xn},和一个集合YU, 且∩FY,对于任意的GF,若: 1)G在∩F中相对于Y是独立的 2)∩GY R E D ( F ) 称G是∩F的一个Y约简,记 作 G 。 Y 知识范畴的核
的基础,有力地推动了国际粗糙集理论与 应用的深入研究。
粗糙集理论特点
所处理的内容是复杂系统中的数据和信息 无需提供所出数据之外的任何先验信息 对比模糊集方法,证据理论方法和概率 方法等
第一节
粗糙集理论
第一节
粗糙集理论
1、相关定义
知识表达系统
知识和概念(范畴或信息粒) 设U使我们感兴趣的对象组成的非空有限 集合,称作一个论域。论域U的任何一个子集 X称作论域U中的一个概念或范畴。论域U中任 何一个子集簇(概念簇)称作关于U的抽象知 识,简称知识。论域中的每一个概念(子集) 表示他的一个信息粒。 知识库 给定一个论域U和U上的一簇等价关系S, 称二元组K=(U,S)是关于论域U的一个知识库。
粗糙集发展历程
1991年,Pawlak的第一本关于粗糙集理论 的专著《Rough sets: theoretical aspects of reasoning about data》 1992年,Slowinski主编的《Intelligence
decision support: handbook of applications and advances of rough sets theory》的出版,奠定了粗糙集理论
R R U ,0 x 1 X xx X
另外,我们也可以定义X的λ 近似集: R R Xx U ( 0 , 1 ] 以及X的强λ 近似集: R R Xx U ( 0 , 1 )
粗糙集的近似集R0.5的近似度
粗糙集合论的成员关系
粗糙相等关系 知识库K=(U,S),R IND(K)的一个等价关系, 对任意U中的集合X,Y定义: 1)X和Y为R下粗相等
R X R Y X Y R
2)X和Y为R上粗相等
R XR Y X Y R 3) X和Y为R下粗相等,且同时X和Y为R上粗 相等,称X和Y为R粗相等,记作 X RY
知识范畴的相对约简与相对核
知识范畴的相对必要性与相对独立性 知识库K=(U,S)和知识库中的一个子集簇 Sub(2U)=F={X1,…,Xn},和一个集合YU, 且∩FY,对于任意Xi,若
( F { X } ) Y i
称范畴Xi 在∩F中相对于Y必要的,同时F在 ∩F中是相对于Y也是独立的。
C O R E ( F ) R E D F Y Y
知识约简
知识的约简 知识库K和其上的一族等价关系PS,对 任意的GP,若: 1)G是独立的 2)IND(G)=IND(P) 称G是P的一个约简,记作G∈RED(P)。 其中RED(P)表示P的所有约简组成的集合。 有此可知,约简不一定唯一。
Hale Waihona Puke 知识约简知识的核 知识库K=(U,S)和知识库中的一个等价 关系族PS,对于任意P中的R,若: IND(P-{R})≠IND(P)称R为P中必要的。 另外,P中所有必要的知识组成的集合 称为P的核,记做CORE(P)=∩RED(P)。
{ YY URY , X }
上近似: R ( X ) { x x Ux , [] } R X
{ Y Y U R , Y X }
粗糙集和精确集
若X的上近似等于X的下近似,称X为R-精确集; 若X的上近似不等于X的下近似,称X为R-粗糙集
粗糙集定义
第一节
必要性与独立性 知识库K=(U,S)和知识库中的一个子集 簇SPOS(U)=F={X1,…,Xn},对于任意Xi,若 ∩F≠∩ (F-{Xi}), 称R为P中必要的,也是独立的。
知识范畴的约简与核
知识范畴的约简 知识库K和其上的子集簇 SPOS(U)=F={X1,…,Xn},对任意的GF,若: 1)G是独立的 2) ∩ G= ∩F R E D (F )。 称G是P的一个约简,记作G 知识范畴的核
定理:设X是有限论域U上的集合,R是U上 的等价关系,对任意的0.5<λ ≤1,若: X R X X RX R X X RX
第一节
粗糙集理论
4、粗糙集的拓扑特征
粗糙集的拓扑特征
定义 1)R-粗糙可定义,若
R X R X , R X , R X U
R U RXi
i 1
n
下近似
R U RXi
i 1 n
粗糙集的数值特征
论域U和一个等价关系R,以及U的一个划分
Ux { , x ,, x } U
12 n
划分独立于知识R,于是定义: 近似分类精度 R U U R RU
知识的相对核 知识库K=(U,S)和知识库中的两个等价 关系族P,QS,对于任意P中的R,若: POSIND(P-{R})(IND(Q))≠POSIND(P)(IND(Q)) 称R为P中Q必要的。
另外,P中所有必要的知识组成的集合 称为P的核,记做COREQ(P)=∩REDQ(P)。
知识范畴的约简与核
3、R0.5理论
粗糙集的近似集R0.5的提出
集合的相似度 A,B是论域U上的两个子集定义从U×U→[0,1] 的映射(A,B)→s(A,B),称s(A,B)为A,B的 相似度,如果满足如下条件: 1)任意U中的集合 A,B,s(A,B)有界; 2)对称性,即s(A,B)=s(B,A); 3)s(A,A)=1,且s(A,B)=0的充要条件是A∩B 为空集。
R P
等价关系
两个知识库的关系 设K1 =(U,S1),K2 =(U,S2)为两个知识库。 若IND(S1)=IND(S2), 则K1 ,K2 等价,记作K1 ≌ K2 若IND(S1) IND(S2), 则称K1 比K2 更精细。
粗糙集定义
集合的下近似和上近似 RX ( ) { x x U ,[ x ] X } 下近似: R
知识的相对约简与相对核
知识的相对约简 知识库K和其上的两族等价关系P,QS, 对任意的GP,若: 1)G是Q独立的 2)POSG(Q)=POSP(Q) 称G是P的一个Q约简,记作G∈REDQ(P)。 其中REDQ(P)表示P的所有约简组成的集合。 有此可知,约简不一定唯一。
知识的相对约简与相对核
当λ =0.5时,Rλ有以下性质: 定理:设X是有限论域U上的集合,R是U上 的等价关系,对任意的0.5≤λ 1<λ 2≤1,有: s X , R X s X , R X 1 2