当前位置:文档之家› 正态云的数学性质

正态云的数学性质


3 正态云的数学性质二
性质二
对一个有共识的定性概念,所有定 量实现(即云滴)的确定度为随机变量Y, 其概率密度是一个固定的形式,与云模 型反映的概念的三个数字特征无关。
根据正态云发生器算法,所有云滴的确定度构成的
随机变量Y,每一个确定度可以看做是由随机变量
Yi
=
− (x − Ex )2
e 2 (En 'i )2
z 根据正态云发生器的实现算法,由于 P{En-3He<En’<En+3He}=0.997,所以当En3He>0时,99.7%的云滴落在外曲线y1内曲线y2 之间
48
8
云的雾化点
z He=En/3时,由于内曲线的指数趋向负无 穷大,函数值趋于0,云图开始雾化。
He>En/3时云图的变化
z 内曲线y2开始加宽,随着He的继续增大 ,
产生的一个样本。
当 y ∈ (0,1) 时,
FYi (y) = P{Yi
} ≤ y
=
P
⎪⎨⎧e
−( X −Ex)2 2(En'i )2
≤ y⎪⎬⎫ =
⎪⎩
⎪⎭
P⎧⎨−
− 2 ln y ≤ X − Ex ≤

2
ln
y
⎫ ⎬

En'i

Q
( ) X ~ N Ex, En'i2

X − Ex ~ N (0,1)
云模型揭示了这样的认知机理:
尽管概念蕴涵有不同范畴,尽管不同人、 不同时期对同一概念有不同认识,定性概念 转换成大量的定量云滴,云滴表现出不同的 确定度,但是要形成普遍的共识,它们在不 同人中反映出的云滴确定度的统计认知规律 是一致的,用不同语言值表示的不同定性概 念之间存在共同的认知机理。
4 正态云的数学性质三
《不确定性人工智能》课件之四
正态云的数学性质
Mathematical Properties of Normal Clouds
李德毅
deyi_li@
2009年3月16日
思考
如何理解自然语言中概念对量的规定性及 其不确定性?如何理解用正态云表示的定性 概念的内涵与外延?反映概念不确定性的数 字特征,与这个概念的语义、语境有关还是 无关?如果人们对一个概念很发散,云会变 为雾吗?
正态云模型是产生泛正态分布的算法,它利用 三个独立的数字特征:期望Ex、熵En和超熵He, 通过二阶正态分布在论域空间生成泛正态分布的云 滴,由高斯隶属函数计算得出云滴的确定度,构造 出定性概念及其定量表示之间的转换算法。
当He=0时,云滴分布为正态分布。
重要说明:
对于一个严格意义的正态分布的随机变量, 如果期望已知,则方差的共轭先验分布为倒伽玛 分布,这种先验分布显示了期望与方差的相关性。
性质三
定性概念的定量实现——云滴X, 与其确定度Y的联合分布( X,Y )的期 望曲线(或期望曲面、期望超曲面) 呈现为高斯形态。
6
云滴及其确定度的联合概率分布(X,Y )
所有云滴X及其确定度Y 形成的二维 随机变量(X,Y )的概率分布非常复杂, 没有解析形式。但是具有明显的几何特 征,可以通过期望曲线方法来研究它。
回归曲线
主曲线
正态云模型云滴的期望曲线
该期望曲线函数为: − (E ( X )− Ex )2
y = e 2 En2
正态期望曲线性质
z μ=3,σ=5
驻点
拐点
-2 3 8
此结论可以推广到高维论域空 间里的概念,其定量实现——云滴X 与确定度Y的联合分布(X, Y)的期 望曲面(超曲面)呈现为高斯形态。
z 还有更高阶的熵,例如用超超熵去反映超熵 的不确定性,是可以无限深追的,但人类使 用自然语言思维不会涉及过多的数学运算;
z 也可以构造“均匀——正态”等其他云模型
2 正态云的数学性质一
对任一定性概念,其所有定 量实现——云滴组成的随机变量, 在论域空间呈泛正态分布。
云滴在论域空间的概率分布
记所有云滴组成的随机变量为X,由云 发生器的算法,X的概率密度为:
背景:利用统计方法确定隶属度和隶属函 数的合理性
从概率测度角度看,云模型的定 义域是N 维量化论域空间。
云滴是该论域空间中的一个随机 变量,服从泛正态分布;云滴对概念 的确定度,也是一个随机变量。
概率论中的正态分布及普适性
正态分布广泛存在于自然现象与 社会现象中,实际中遇到的许多随机 现象都服从或者近似服从正态分布。
7
5 正态云的数学性质四
思考
在云发生器算法中,通常选用较小 的超熵He生成云滴,如He较大(概 念的共识差,离散性强),会产生 什么样的分布形态?
如果一个概念缺少共识,反映其数字特 征的超熵会变得很大,云的整体轮廓不再清 晰可见,云逐渐“雾化”。但雾化过程中, 始终可保持云滴在靠近中心部分占优势。
=
1
− ( x−Ex)2 − ( y−En)2
e 2y2
2He2 dy
−∞ 2 He y
此函数没有解析形式。
云滴的统计特性
云滴X 的期望 E(X)=Ex ;
方差D(X) = ∫ ∫ +∞ (
x

Ex
) 2dx
−∞
+∞ 1 −∞ 2πHe
y
exp ⎜⎜⎝⎛ −
( x − Ex ) 2 2y2

( y − En ) 2 2 He 2
模糊性和随机性,曾经被认为是完全不 同的两类不确定性,分别进行处理。
可能性理论: 一个人早餐吃5个鸡蛋的可能性为1,但吃5
个鸡蛋的概率为0。
随机性和模糊性毫无关联! 模糊性对排中律的背叛:
A+ A≠1
2
在更多情况下,随机性和模糊性相关。
“17岁是青年人吗?”
统计得到“是”的概率越大,则“17岁”隶 属于“青年”的程度也越大。
正态分布的普适性和高 斯隶属函数的普适性,共同 奠定了正态云模型的普适性。
3
云模型的数理统计基础
9 云模型利用三个数字特征设计特定的算法, 构造出一个服从泛正态分布的随机变量 ——云滴。
9 云模型本质是基于概率测度空间的云滴及其 确定度的分布模型。云模型对模糊性和随机 性的关联性,建立了简单但是较为合理的映 射关系。
一维云模型云滴的期望曲线
研究数据集分布的几何规律性,寻 找数据集的“中间”结构——“脊梁 骨”,用一条光滑曲线代替数据集,几 何上非常直观。
研究数据集分布的几何规律性,寻找数据集的 “中间”结构——“脊梁骨”,用一条光滑曲线代 替数据集,几何上非常直观。常用的寻求期望曲线 的方法有主曲线和回归曲线等。
云模型的数理统计基础
对某一定性概念,云滴在靠近期望值出现 的概率较大,且该云滴能代表此定性概念的 确定度也较大;云滴在远离期望值处出现的 概率较小,该云滴能代表该概念的确定度也 较小。
用模糊性对随机性关联的映射函数来计算 确定度,恰好可说明上述现象。
为什么不用更少或者更多的 数字特征构造云模型?
z 用三个数字特征进行定性定量转换是最小集 合,不可能再少;
2He2
−∞ 2π
2
= En2 + He2
性质一 正态云算法产生的云滴,是一个期望
为Ex,方差为 En2 + He2 的随机变量,呈现 泛正态分布。参数He是偏离正态分布程度 的度量,可以用来反映在论域空间影响概 念诸因素的不均匀、不独立现象。
若He=0,云滴为正态分布;若En=0, He=0,云滴则总是出现在期望点Ex上,没 有不确定性。
fX (x) =
1 2π En'
exp⎛⎜⎜⎝

(
x − Ex)2 2En'2
⎞⎟⎟⎠
而En’的概率密度为:
fEn' (x) =
1 2π
He
exp⎜⎜⎝⎛

(x − En)2 2He2
⎟⎟⎠⎞
4
故 X 的概率密度函数为:
f X (x) = f En' (x) × f X (x En' )
∫ π ∞
雾化过程分析
z 通过研究X的概率分布可知,X的分布函数 没有解析形式
∫ f X (x) =
fEn' (x) ×
f
X
(
x
|
En'
)
=
∞ −∞
1 2πHe
|
− ( x−Ex)2 − ( y−En)2
e 2y2
2He2 dy
y|
超熵变大的过程
z 当He逐渐增大的时候,云滴开始离散,云 滴的凝聚性变差了
云滴分布规律
⎟⎟⎠⎞dy
= ∫ ∫ 1
+∞
y
exp{− (y − En)2 }dy
+∞
1
(x − Ex)2 exp{− (x − Ex)2 }dx
2π He −∞
2He2
−∞ 2π y2
2y2
=
∫ ∫ 1 +∞y2 exp{− (y − En)2 }dy +∞ 1 t 2 exp{− t 2 }dt
2π He −∞
降低-速度慢
云线密度
降低-速度快
云心相对线密度(云心 增加 线密度/云线密度)
简要证明如下:
设正态云为(Ex,En,He),云滴总数为 N。由切比 雪夫不等式:
P{ X − Ex < 4 En2 + He2 } ≥ 15 ≈ 1 16
即云长度可近似为:8 En2 + He2 故云线密度为 N / 8 En2 + He2
模糊集合中常用的隶属函数形态
1、线性隶属函数 2、三角型隶属函数 3、凸形隶属函数 4、梯型隶属函数 5、岭型隶属函数 6、高斯隶属函数
相关主题