粗糙集论文题目 粗糙集综述1 粗糙集属性约简1.1 经典粗糙集属性约简对于经典粗糙集我们可以用上下近似来描述。
给定知识库()R U K ,=,对于每个子集U X ⊆和一个等价关系()K ind R ∈,定义两个上下近似:{}{}.|/,|/ U U φ≠⋂∈=⊆∈=X Y R U Y X R X Y R U Y X R 另外上下近似还可以用以下的等式表达:[]{}[]{}.|,| U U φ≠⋂∈=⊆∈=X x U x X R X x U x X R R R 当利用区分矩阵来表达知识时有许多优点,特别是他能很容易计算约简和核。
约简是满足能区别由整个属性集区别的所有对象的属性极小子集。
如果A 包含B 是满足B 交区别对象x 和y 的所有属性集合的极小子集不为空,且区别对象x 和y 的所有属性集合的极小子集不为空,则B 是A 的一个约简。
核是区分矩阵中所有单个元素组成的集合。
对于决策表,C 为条件属性集,D 为决策属性集,决策表S 的区分矩阵是一个n n ⨯矩阵,其任一元素为},x ),(),(|{),(a *)(且y a y f a x f C a y x ω≠∈=对于满足),(,,x y x U y ω∈)(y )(x D pos D pos C C ∉∈且,或者)(y )(x D pos D pos C C ∈∉且,或者).(),()(,D ind y x D pos y x C ∉∈且如果φφ≠∀≠⋂⊆),(,),(C C C **''y x a y x a 满足条件的极小子集(关于包含),则'C 是C 的D 约简(相对约简).D 核(相对核)是决策表S 的区分矩阵中所有单个元素组成的集合,即}.,},{),(a |{)(core *U y x a y x C a C D ∈=∈=其中1.2 变精度粗糙集属性约简变精度粗糙集是粗糙集的扩充,它是在基本粗糙集模型的基础上引入)5.00(<≤ββ,即允许一定程度的错误分类率存在。
这一方面完善了近似空间的概念,另一方面也有利于粗糙集理论从认为不相关的数据中发现相关数据。
当β=0时,经典粗糙集模型是变精度粗糙集模型的一个特例。
X 和Y 表示有限论域U 的非空子集,且Y ⊆X 。
令⎩⎨⎧>>⋂=0,|X |0,0,|X | |,X |/|Y X |1-Y)c(X, 多数包含关系定义为ββ≤⇔⊇),(Y Y X c X 。
约简是保持和决策属性Q 的依赖性相同的最小条件属性子集。
通过近似以来的定义来引入近似约简概念。
条件属性集P 关于据测属性集Q 的β约简是P 的一个子集),,(βQ P red ,且满足:),),,,((),,()1(ββγβγQ Q P red Q P =. 不成立。
都将是中去掉任何一个属性,从)1(),,()2(βQ P red引入)5.00(<≤ββ参数后,扩充了基本粗糙集理论,更好体现了数据分析中的数据相关性,从而为获取近似决策规则奠定了基础。
1.3 概率粗糙集属性约简概率是对不确定的随机事件的一种客观的反映。
经典粗糙集模型是基于可利用信息的完全性的,因而忽视了可利用信息的不完全性和可能存在的统计信息,从概率论的观点出发来研究粗糙集理论,为研究不确定信息系统提供了新的粗糙集模型。
设U 是有限对象构成的论域,R 是U 上的等价关系,其构成的等价类为},,{/U 21n X X X R ,=。
令P 为定义在U 的子集类构成的σ代数上的概率测度,三元组),,(A P R U p =称为概率近似空间。
U 中的每个自己称为概念,它代表一个随机事件。
定义X 关于概率近似空间),,(A P R U p =依参数βα,概率()I 型下近似)(PI X a 和上近似)(PI X β如下:}{)][|(|)(a x X P U x X PI a ≥∈=, }{)][|(|)(ββ≥∈=x X P U x X PI 。
当)(PI )(PI X X a β=时,称X 依参数βα,关于p A 是概率()I 型可定义,否则称X 依参数βα,关于p A 是概率()I 型粗糙集。
同样概率粗糙集模型还有很多其他形式如概率()II 型,概率()III 型,概率()IV 型。
设),,,(ρV A U K =为一个信息系统,},,,{/21*n X X X R U R ==为等价关系R 在U 上导出的划分,S 为U 上另一个等价关系,且},,,{S 21*m Y Y Y =,则在已知知识*R 时知识*S 的正则条件熵定义为m X Y P X Y P X P R S n i mj i j i j i log /)|(log )|()()|(H 11**0∑∑==-= 显然1)|(H 0**0≤≤R S 。
系统K 中的属性子集A M ⊆称为关于属性集A B ⊆是统计依赖的,若存在M 的一个真子集L 使)|()|(**0**0L B H M B H =,否则称M 关于B 是统计独立的。
N称为M 关于B 的所有相对约简记为)(sred M B ,所有这些约简的交集称为M 关于B 的相对核,记为)(score M 。
系统K 中的属性子集A M ⊆称为关于属性集A B ⊆是统计依赖的,若存在M 的一个真子集L 使)|()|(**0**0L B H M B H =,否则称M 关于B 是统计独立的。
N 称为M 关于B 的一个相对约简,若N 是M 关于B 的一个极大统计独立子集,M 关于B 的相对约简记为)(score B M 。
属性a 在A 中称为统计可省略的,若)|()}){\(|(**0**0A A H a A A H =,否则称a 在A 中为统计不可省略的。
属性a 在A 中称为关于属性集D 是统计不可省略的,若)|()}){\(|(**0**0A D H a A D H =,否则称a 在A 中关于属性集D 是统计不可省略的。
1.4 模糊粗糙集及其发展情况在人们的实际生活中,涉及更多的是模糊概念和模糊知识。
反映在粗糙集模型中主要有两类,一类是知识库的知识是清晰的,而被近似的概念是模糊的,另一类是知识库的知识和被近似的概念都是模糊的。
在经典粗糙集模型中,论域U 上任意一个经典集合A 不一定能用知识库()R U ,中的知识来精确描述,这时就用A 关于()R U ,的一对上下近似来描述。
但在实际生活中,人们涉及到的知识火概念往往是模糊的不确定的,即A 是U 上的一个模糊集合,于是提出了模糊粗糙集模型。
设()R U ,是经典近似空间,即R 是论域U 上的一个等价关系。
若A 是U 上的一个模糊集合,贼A 关于()R U ,的一堆下近似R A 和上近似R A 定义为U 上的一对模糊集合,其隶属函数分别定义为,},][|)(sup{)(,},][|)(inf{)(U x x y y A x A U x x y y A x A R R R R ∈∈=∈∈=其中[]R x 为元素x 在关系R 下的等价类。
若)()(x A x A R R =,则称A 是可定义的,否则称A是模糊粗糙集。
当A是U上的经典集合时,AA和就退化为A在经典意义下关于()RU,的下近似和上近似,因此模糊粗糙集就是在经典粗糙集下的推广。
在经典粗糙集模型中知识库中的知识都是清晰的,即近似空间中的集合都是经典集合。
但是在实际问题中知识库往往是模糊的,也可用知识库中的模糊知识来近似的粗糙集模型来讨论模糊集,称之为基于三角模的模糊粗糙集模型。
同样,我们知道知识表示系统中,论域中的概念是用知识库中的知识来描述的,在决策表中还可以提取决策规则。
从协调的决策表中可以提取额确定性规则,而从不协调的决策表中只能抽取不确定规则或可能性规则,这是因为在不协调的系统中存在着矛盾的事例。
这种从决策表中抽取规则的推理的实质是一种广义的包含关系。
因此,从包含度的概念可以定义出基于包含度的粗糙集模型。
2粗糙集的推广2.1 从关系来对粗糙集进行推广目前从R这方面的推广主要有:把R定义为等价关系,也就是经典粗糙集。
R同样可以定义为一般关系、相似关系、黄金关系、多关系、灰色关联、优势关系、余等价关系、强对称关系、约束关系、限制容差关系、相容关系、类传递关系、自相关关系等。
2.2 从包含来对粗糙集进行推广从包含关系来推广主要有:完全包含、部分包含、概率包含等。
2.3从论域来对粗糙集进行推广从论域来推广主要有:多论域、可测空间、随机集、模糊论域等。
2.4从子集来对粗糙集进行推广从子集对粗糙集推广主要有:模糊、不完备等。
2.5从取值来对粗糙集进行推广从点对粗糙集进行推广主要有:点、区间、模糊数等。
3总结通过一学期的学习对粗糙集有比较深入的了解。
虽然粗糙集在各个领域都有了很深入的研究,但仍旧有很多发展的空间。
这门课不光学到了许多关于粗糙集理论的相关知识和内容,也同样学到了很多思维方式和学习方法,对一个已知的知识进行推广想像,从各个领域推广,均有很大的发展空间。
通过粗糙集的学习,加深了我对粗糙集理论基础内容的认识,同时为我后续的学习奠定了基础,拓展了我的知识面,增强了自己的专业修养,学无止尽,还需在后续的课程学习中,多学,多看,多写。
参考文献[1]张文修,吴伟志,梁吉业,李德玉.粗糙集理论与方法. 北京:科学出版社.[2] 苗夺谦,李道国. 清华大学出版社.。