当前位置:文档之家› 数据处理(模糊数学)

数据处理(模糊数学)


统计数学是将数学的应用范围从确定性的领域扩大到了不确 定性的领域,即从必然现象到偶然现象, 定性的领域,即从必然现象到偶然现象,而模糊数学则是把数学 的应用范围从确定领域扩大到了模糊领域,即从精确现象到模糊 的应用范围从确定领域扩大到了模糊领域, 现象。 现象。
模糊是指客观事物差异的中间过渡中的“不分明性” 模糊是指客观事物差异的中间过渡中的“不分明性” 是指客观事物差异的中间过渡中的 亦此亦彼性” 或“亦此亦彼性”。 如高个子与矮个子、年轻人与老年人、热水与凉水、 如高个子与矮个子、年轻人与老年人、热水与凉水、环境 污染严重与不严重等。在决策中,也有这种模糊的现象, 污染严重与不严重等。在决策中,也有这种模糊的现象, 如选举一个好干部,但怎样才算一个好干部? 如选举一个好干部,但怎样才算一个好干部?好干部与不 好干部之间没有绝对分明和固定不变的界限。 好干部之间没有绝对分明和固定不变的界限。这些现象很 难用经典的数学来描述。 难用经典的数学来描述。
第一章 模糊数学基本概念
一、经典集合与特征函数 集合:具有某种特定属性的对象集体。 集合:具有某种特定属性的对象集体。 通常用大写字母A 等表示。 通常用大写字母 、B、C等表示。 等表示 论域:对局限于一定范围内进行讨论的对象的全体。 论域:对局限于一定范围内进行讨论的对象的全体。 通常用大写字母U 等表示。 通常用大写字母 、V、X、Y等表示。 等表示 论域U中的每个对象 称为 论域 中的每个对象u称为 的元素。 中的每个对象 称为U的元素。
称为集合A的特征函数 的特征函数。 函数 χ A 称为集合 的特征函数。
二、模糊集合及其运算 1、模糊子集 、 定义: 是论域, 定义:设U是论域,称映射 是论域
µA : U →[0,1],
~
x a µA( x) ∈[0,1]
确定了一个U上的模糊子集 ~ 确定了一个 上的模糊子集 A 。映射 µ A 称为 A 隶属函 上的 ~ ~
~
µ 的隶属程度,简称隶属度 隶属度。 数, A ( x ) 称为 x 对 A 的隶属程度,简称隶属度。 ~
~
唯一确定, 模糊子集 A 由隶属函数 µ A 唯一确定,故认为二者 是等同的。为简单见,通常用A来表示 A 和µ A 。 是等同的。为简单见,通常用 来表示 ~
~
~
~
设论域U 例 设论域 = {x1 (140), x2 (150), x3 (160), x4 (170), x5 (180), x6 (190)}(单位:cm)表示人的身高,那么 上的一 单位: 表示人的身高, 单位 表示人的身高 那么U上的一 个模糊集“高个子” 的隶属函数 的隶属函数A(x)可定义为 个模糊集“高个子”(A)的隶属函数 可定义为
A = (0.15,0.2,0.42,0.6,0.8,0.9)(向量表示)
模糊集的运算
相等: 相等:A = B ⇔ A(x) = B(x); ; 包含: ⊆ 包含:A⊆B ⇔ A(x)≤B(x); ; 并:A∪B的隶属函数为 ∪ 的隶属函数为 (A∪B)(x)=A(x)∨B(x);取大运算 ∪ ∨ ; 交:A∩B的隶属函数为 的隶属函数为 (A∩B)(x)=A(x)∧B(x);取小运算 ∧ ; 余:Ac的隶属函数为 Ac (x) = 1- A(x). -
2. 指派方法
一种主观方法根据实践经验来确定, 一种主观方法根据实践经验来确定,一般给出隶属函 数的解析表达式。 数的解析表达式。
3. 借用已有的“客观”尺度 借用已有的“客观” 根据问题的实际意义来确定,在经济管理, 根据问题的实际意义来确定,在经济管理,社会管理 中常用。 表示产品, 模糊集“ 中常用。如U表示产品,定义 模糊集“质量稳定”, 表示产品 定义A模糊集 质量稳定” 可用产品的“正品率”作为A的隶属度 的隶属度。 可用产品的“正品率”作为 的隶属度。 • 常用的隶属函数有 函数(偏小型)、 函数(中 常用的隶属函数有Z函数(偏小型)、∏函数 函数 )、 函数( 间型)、 函数(偏大型) )、S函数 间型)、 函数(偏大型). • 偏小型一般适合于描述像“小,少,浅,淡,青 偏小型一般适合于描述像“ 等偏小程度的模糊现象。 年”等偏小程度的模糊现象。 • 偏大型一般适合于描述像“大,多,深,浓,老 偏大型一般适合于描述像“ 等偏大程度的模糊现象。 年”等偏大程度的模糊现象。 • 中间型一般适合于描述像“中,适中,不太多, 中间型一般适合于描述像“ 适中,不太多, 不太浓,暖和,中年” 不太浓,暖和,中年”等处于中间状态的模糊现 象。
我们把12个气象观测站的观测值看成12个向量组, 12个气象观测站的观测值看成12个向量组 解法一 我们把12个气象观测站的观测值看成12个向量组,由于 本题只给出了10年的观测数据,根据线性代数的理论可知, 10年的观测数据 本题只给出了10年的观测数据,根据线性代数的理论可知,若 向量组所含向量的个数大于向量的维数, 向量组所含向量的个数大于向量的维数,则该向量组必然线性 相关。 相关。于是只要求出该向量组的秩就可确定该向量组的最大无 关组所含向量的个数,也就是需保留的气象观测站的个数。 关组所含向量的个数,也就是需保留的气象观测站的个数。由 于向量组中的其余向量都可由极大线性无关组线性表示,因此, 于向量组中的其余向量都可由极大线性无关组线性表示,因此, 可以使所得到的降水信息量足够大。 可以使所得到的降水信息量足够大。 用i=1,2,L,10分别表示1981年,1982年,…,1990年。aij i=1,2,L,10分别表示1981年 1982年 分别表示1981 ,1990年 i=1,2,L,10,j=1,2,L,12)表示第j个观测站第i年的观测值, (i=1,2,L,10,j=1,2,L,12)表示第j个观测站第i年的观测值, )10×12。 记A=(aij)10×12。 利用MATLAB可计算出矩阵A的秩r(A)=10,且任意10个列向 利用MATLAB可计算出矩阵A的秩r(A)=10,且任意10个列向 MATLAB可计算出矩阵 r(A)=10 10 量组成的向量组都是极大线性无关组, 量组成的向量组都是极大线性无关组,
在论域U中任意给定一个元素 及任意给定一个 在论域 中任意给定一个元素u及任意给定一个 中任意给定一个元素 经典集合A, 用函数表示为: 经典集合 ,则必有 u ∈ A 或者u ∉ A ,用函数表示为:
χA : U →{0,1} u a χA(u),
其中
1, u∈ A χA(u) = 0, u∉ A
实际中,我们处理现实的数学模型可以分成三大类: 实际中,我们处理现实的数学模型可以分成三大类: 第一类是确定性数学模型,即模型的背景具有确定性,对象之间 第一类是确定性数学模型,即模型的背景具有确定性, 具有必然的关系。 具有必然的关系。 第二类是随机性的数学模型,即模型的背景具有随机性和偶然性。 第二类是随机性的数学模型,即模型的背景具有随机性和偶然性。 第三类是模糊性模型,即模型的背景及关系具有模糊性。 第三类是模糊性模型,即模型的背景及关系具有模糊性。
x −140 A(x) = 190 −140
也可用Zadeh表示法: 表示法: 也可用 表示法
x −100 A(x) = 200 −100
0 0.2 0.4 0.6 0.8 1 A= + + + + + x1 x2 x3 x4 x5 x6 0.15 0.2 0.42 0.6 0.8 0.9 A= + + + + + x1 6 0.9 1 1 1 A = + + + + + + + 1 2 3 4 5 6 7 8
c
三、 隶属函数的确定
模糊数学的基本思想是隶属度思想, 模糊数学的基本思想是隶属度思想,应用模糊数学 建立数学模型的关键是建立符合实际的隶属函数。 建立数学模型的关键是建立符合实际的隶属函数。如何 确定一个模糊集的隶属函数至今还是尚未解决的问题这 里仅介绍几种常用的确定隶属函数的方法 1. 模糊统计方法 与概率统计类似,但有区别:概率统计随机事件 是 与概率统计类似,但有区别:概率统计随机事件A是 固定不变的,样本空间中样本点数是变动的, 固定不变的,样本空间中样本点数是变动的,而模糊统 计试验中, 是固定不变的 而模糊集A*是可变的 是固定不变的, 是可变的。 计试验中,x是固定不变的,而模糊集 是可变的。
例如,我们选取前10个气象观测站的观测值作为极大线性无关组, 例如,我们选取前10个气象观测站的观测值作为极大线性无关组, 10个气象观测站的观测值作为极大线性无关组 则第11 12这两个气象观测站的降水量数据完全可以由前10个气 11, 这两个气象观测站的降水量数据完全可以由前10 则第11,12这两个气象观测站的降水量数据完全可以由前10个气 象观测站的数据表示。 xi(i=1,2,L,12)表示第i 象观测站的数据表示。设xi(i=1,2,L,12)表示第i个气象观测 站或第i个观测站的观测值。 站或第i个观测站的观测值。则有 x11=0.0124x1−0.756x2+0.1639x3+0.3191x4− x11=0.0124x1−0.756x2+0.1639x3+0.3191x4−1.3075x5 −1.0442x6−0.1649x7−0.8396x8+1.679x9+2.9379x10 1.0442x6−0.1649x7− x12=1.4549x1+10.6301x2+9.8035x3+6.3458x4+18.9423x5 +19.8061x6−27.0196x7+5.868x8−15.5581x9− +19.8061x6−27.0196x7+5.868x8−15.5581x9−26.9397x10 到目前为止,问题似乎已经完全解决了,可其实不然, 到目前为止,问题似乎已经完全解决了,可其实不然,因为如 果上述观测站的数据不是10 10年 而是超过12 12年 果上述观测站的数据不是10年,而是超过12年,则此时向量的 维数大于向量组所含的向量个数,这样的向量组未必线性相关。 维数大于向量组所含的向量个数,这样的向量组未必线性相关。 故上述的解法不具有一般性,下面我们考虑一般的解法,首先, 故上述的解法不具有一般性,下面我们考虑一般的解法,首先, 我们利用已有的12个气象观测站的数据进行模糊聚类分析 12个气象观测站的数据进行模糊聚类分析, 我们利用已有的12个气象观测站的数据进行模糊聚类分析,最 后确定从哪几类中去掉几个观测站。 后确定从哪几类中去掉几个观测站。
相关主题