一.模糊数学的基础知识1.模糊集、隶属函数及模糊集的运算。
普通集合A ,对x ∀,有A x ∈或A x ∉。
如果要进一步描述一个人属于年轻人的程度大小时,仅用特征函数就不够了。
模糊集理论将普通集合的特征函数的值域推广到[0,1]闭区间内,取值的函数以度量这种程度的大小,这个函数(记为)(x E )称为集合E 的隶属函数。
即对于每一个元素x ,有[0,1]内的一个数)(x E 与之对应。
(1)模糊子集的定义:射给定论域U ,U 到[0,1]上的任一映射: ))((],1,0[:U u u A u U A ∈∀→→都确定了U 上的一个模糊集合,简称为模糊子集。
)(u A 称为元素u 属于模糊集A 的隶属度。
映射所表示的函数称为隶属函数。
例如:设论域U=[0,100],U 上的老年人这个集合就是模糊集合:⎪⎩⎪⎨⎧≤<-+≤=--10050,))550(1(50,0)(12u u u u A 若在集合U 上定义了一个隶属函数,则称E 为模糊集。
(2)模糊集合的表示:},.....,,{21n u u u U =,)(u A 称为元素u 属于模糊集A 的隶属度;则模糊集可以表示为:nn u u A u u A u u A A )(....)()(2211+++=。
或 )}(),.....,(),({21n u A u A u A A =,))}(,()),.....,(,()),(,{(2211n n u A u u A u u A u A =,(3)模糊集合的运算:)}(),.....,(),({21n u A u A u A A =,)}(),.....,(),({21n u B u B u B B =,并集:)}()(),.....,()(),()({2211n n u B u A u B u A u B u A B A ∨∨∨=⋃,交集:)}()(),.....,()(),()({2211n n u B u A u B u A u B u A B A ∧∧∧=⋂,补集:)}(1),.....,(1),(1{21n c u A u A u A A ---=,包含:B A u B u A U u ⊂≤∈∀,则有有若)()(,,2.模糊集的截集已知U 上模糊子集))((],1,0[:U u u A u U A ∈∀→→对]1,0[∈λ,则称})(,{λλ≥∈=u A U u u A 为模糊集A 的λ-截集; 称})(,{λλ>∈=u A U u u A s 为模糊集A 的λ-强截集;λ称为λA 、sA λ的置信水平或阀值。
二.模糊数学的基本定理1.模糊截积:已知U 上模糊子集))((],1,0[:U u u A u U A ∈∀→→对]1,0[∈λ,A λ也是U 上模糊集,其隶属函数为:)(),())((U u u A u A ∈∀∧=λλ; 称为A λ为λ与A 的模糊截积。
2.分解定理1:已知模糊子集)(U F A ∈,则λλλA A ]1,0[∈⋃= 推论1:对,U u ∈∀}],1,0[{)(λλλA u u A ∈∈∨=3.分解定理2:已知模糊子集)(U F A ∈,则SA A λλλ]1,0[∈⋃= 推论2:对,U u ∈∀}],1,0[{)(S A u u A λλλ∈∈∨=三.模糊关系与模糊聚类1.模糊关系与模糊关系的合成(1) 模糊关系普通集合的经典关系,模糊关系:从U 到V 上的一个模糊关系:]1,0[:→⨯V U R ,),(j i v u R 表示j i v u 与具有的关系程度,V v U u j i ∈∈,。
n m ij a A ⨯=)((ij a 满足0≤ij a ≤1)称为U 到V 上的一个模糊关系的模糊矩阵。
(2).设A =p n ij a ⨯)(和B =m p ij B ⨯)(为两个模糊矩阵,令ij c =)(1kj ik pk b a ∧∨=,i =1,2,…,n ,j =1,2,…,m 。
则称矩阵C =m n ij c ⨯)(为模糊矩阵A 与B 的褶积,记为C =A B •,其中“∨”和“∧”的含义为},max{b a b a =∨ },min{b a b a =∧显然,两个模糊矩阵的褶积仍为模糊矩阵2. 模糊等价矩阵及其λ矩阵设方阵A 为以模糊矩阵,若A 满足A A =A则称A 为模糊等价矩阵。
模糊等价矩阵可以反映模糊分类关系的传递性,即描述诸如“甲像乙,乙像丙,则甲像丙”这样的关系。
设A =n n ij a ⨯)(为一个模糊等价阵,0≤λ≤1为一个给定的数,令⎪⎩⎪⎨⎧<≥=λλλij ij ij a a a 若若,0,1)( ,,...,2,1,n j i =则称矩阵n n ij a A ⨯=)()(λλ为A 的-λ截阵例如,A =⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡14.06.04.014.06.04.01为一个模糊等价阵,取0.4<6.0≤λ,则λA =⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡101010101若取4.00≤≤λ,则λA =⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡1111111112.模糊聚类:模糊划分的概念最早由Ruspini 提出,利用这一概念人们提出了多种聚类方法,比较典型的有:基于相似性关系和模糊关系的方法(包括聚合法和分裂法),基于模糊等价关系的传递闭包方法、基于模糊图论最大树方法,以及基于数据集的凸分解、动态规划和难以辨识关系等方法. 然而由于上述方法不适用于大数据量情况,难以满足实时性要求高的场合,因此其实际的应用不够广泛,故在该方面的研究也就逐步减少了. 实际中受到普遍欢迎的是基于目标函数的方法,该方法设计简单、解决问题的范围广,最终还可以转化为优化问题而借助经典数学的非线性规划理论求解,并易于计算机实现. 因此,随着计算机的应用和发展,该类方法成为聚类研究的热点.(1)模糊聚类的基本概念模糊聚类目标函数的演化模糊聚类方法模糊聚类法和一般的聚类方法相似,先将数据进行标准化,计算变量间相似矩阵或样品间的距离矩阵,将其元素压缩到0与1之间形成模糊相似矩阵,进一步改造为模糊等价矩阵,最后取不同的标准λ,得到不同的-λ截阵,从而就可以得到不同的类。
具体步骤如下:第一步:数据标准化1.数据矩阵设论域},...,,{21n x x x U =为被分类的对象,每个对象又由m 个指标表示其性状: },...,,{21im i i i x x x x = (n i ,...,2,1=)于是得到原始数据矩阵为⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡nm n n m m x x x x x x x x x (2122221)11211 2.数据标准化在实际问题中,不同的数据一般有不同的量纲。
为了使有不同的量纲的量也能进行比较,通常需要对数据作适当的变换。
但是,即使这样得到的数据也不一定在区间[0,1]上。
因此,这里所说的数据标准化,就是要根据模糊矩阵的要求,将数据压缩到区间[0,1]上。
通常需要作如下变换:(1)平移·标准差变换: kk ik ik S x x x '-=' (m k n i ,...,2,1;,...,2,1==) 其中∑∑==-=='n i k ik k n i ik x x n S x n x 121)(1,1。
经过变化后,每个变量的均值为0,标准差为1,且消除了量纲的影响。
但是,这样得到的kx '还不一定在区间[0,1]上。
(2)平移·级差变换}{min }{max }{min 111ik n i ik n i ik n i ik ik x x x x x '-''-'=''≤≤≤≤≤≤- (m k ,...,2,1=)显然有10≤''≤ikx ,而且也消除了量纲的影响。
第二步:标定(建立模糊相似矩阵)设论},...,,{},,...,,{2121im i i i n x x x x x x x U ==依照传统的方法确定相似系数,建立模糊相似矩阵,i x 与j x 的相似程度),(j i ij x x R r =。
可根据问题的性质,选取下列公式之一计算ij r1. 数量积法⎪⎩⎪⎨⎧≠⋅==∑=;,1;,11j i x x M j i r jk mk ik ij 其中)(max 1∑=≠⋅=mk jk ik j i x x M 显然ij r ]1,0[∈,若ij r 中出现负值,也可采用下面的方法将ij r 压缩在[0,1]上 令21+='ij ij r r ,则]1,0[∈'ij r 。
当然也可用上述的平移·级差变换。
2.夹角余弦法ij r =2111221][∑∑∑===⋅nk n k jk ik n k jk ik x x x x若将变量i X 的n 个观测值T in i i x x x ),...,,(21与变量j X 的相应n 个观测值T jn j j x x x ),...,,(21看成n 维空间中的两个向量,ij r 正好时这两个向量夹角的余弦。
3.相关系数法从统计角度看,两个随机变量的相关系数是描述这两个变量关联性(线性关系)强弱的一个很有用的特征数字。
因此,用任意两个变量的n 个观测值对其相关系数的估计可作为两个变量关联性的一种度量,其定义为ij r =2111221])()([|)(||)(|∑∑∑=-=-⋅---nk n i j ji i ik n k j jk i ik x x x x x x x x , 其中i x (i =1,2,…,p )见(i x =∑=nk ik x n 11,i =1,2,…, p ,)。
ij r (1p j i ≤≤,)其实就是X =T p X X ),...,(1的样本相关矩阵中的各元素。
4.指数相似系数法∑=-⋅-=m k kjk ik ij S x x m r 122})(43exp{1, 其中∑=-=n i ik ik K x x n S 12)(1,而),...,2,1(11m k x n x n i ik k ==∑= 需要注意的是,相关系数法与指数相似系数法中的统计指标的内容是不同的。
5.最大最小法∑∑==∨∧=m k jk ik m k jk ik ij x xx xr 11)()(6.算术平均最小法 ∑∑==+∧=m k jk ik mk jk ik ij x xx x r 11)()(2 7.几何平均最小法∑∑==⋅∧=m k jkik m k jk ik ij x x x x r 11)( (上述5,6,7三种方法均要求0>ij x ,否则也要做适当变换)8.绝对值减数法∑=--=mk jk ik ij x x C r 1||1适当选取C ,使得01≤≤ij r 。