当前位置：文档之家› 正态云的数学性质

正态云的数学性质

3 正态云的数学性质二
性质二
对一个有共识的定性概念，所有定量实现(即云滴)的确定度为随机变量Y，其概率密度是一个固定的形式，与云模型反映的概念的三个数字特征无关。
根据正态云发生器算法，所有云滴的确定度构成的
随机变量Y，每一个确定度可以看做是由随机变量
Yi
=
− (x − Ex )2
e 2 (En 'i )2
z 根据正态云发生器的实现算法,由于 P{En-3He<En’<En+3He}=0.997，所以当En3He>0时，99.7%的云滴落在外曲线y1内曲线y2 之间
48
8
云的雾化点
z He=En/3时，由于内曲线的指数趋向负无穷大，函数值趋于0，云图开始雾化。
He>En/3时云图的变化
z 内曲线y2开始加宽，随着He的继续增大 ,
产生的一个样本。
当 y ∈ (0,1) 时，
FYi (y) = P{Yi
} ≤ y
=
P
⎪⎨⎧e
−( X −Ex)2 2(En'i )2
≤ y⎪⎬⎫ =
⎪⎩
⎪⎭
P⎧⎨−
− 2 ln y ≤ X − Ex ≤
−
2
ln
y
⎫ ⎬
⎩
En'i
⎭
Q
( ) X ~ N Ex, En'i2
∴
X − Ex ~ N (0,1)
云模型揭示了这样的认知机理：
尽管概念蕴涵有不同范畴，尽管不同人、不同时期对同一概念有不同认识，定性概念转换成大量的定量云滴，云滴表现出不同的确定度，但是要形成普遍的共识，它们在不同人中反映出的云滴确定度的统计认知规律是一致的，用不同语言值表示的不同定性概念之间存在共同的认知机理。
4 正态云的数学性质三
《不确定性人工智能》课件之四
正态云的数学性质
Mathematical Properties of Normal Clouds
李德毅
deyi_li@
2009年3月16日
思考
如何理解自然语言中概念对量的规定性及其不确定性？如何理解用正态云表示的定性概念的内涵与外延？反映概念不确定性的数字特征，与这个概念的语义、语境有关还是无关？如果人们对一个概念很发散，云会变为雾吗？
正态云模型是产生泛正态分布的算法，它利用三个独立的数字特征：期望Ex、熵En和超熵He，通过二阶正态分布在论域空间生成泛正态分布的云滴，由高斯隶属函数计算得出云滴的确定度，构造出定性概念及其定量表示之间的转换算法。
当He=0时，云滴分布为正态分布。
重要说明：
对于一个严格意义的正态分布的随机变量，如果期望已知，则方差的共轭先验分布为倒伽玛分布，这种先验分布显示了期望与方差的相关性。
性质三
定性概念的定量实现——云滴X，与其确定度Y的联合分布( X，Y )的期望曲线（或期望曲面、期望超曲面）呈现为高斯形态。
6
云滴及其确定度的联合概率分布(X,Y )
所有云滴X及其确定度Y 形成的二维随机变量(X,Y )的概率分布非常复杂，没有解析形式。但是具有明显的几何特征，可以通过期望曲线方法来研究它。
回归曲线
主曲线
正态云模型云滴的期望曲线
该期望曲线函数为： − (E ( X )− Ex )2
y = e 2 En2
正态期望曲线性质
z μ=3，σ=5
驻点
拐点
-2 3 8
此结论可以推广到高维论域空间里的概念，其定量实现——云滴X 与确定度Y的联合分布（X, Y）的期望曲面（超曲面）呈现为高斯形态。
z 还有更高阶的熵，例如用超超熵去反映超熵的不确定性，是可以无限深追的，但人类使用自然语言思维不会涉及过多的数学运算；
z 也可以构造“均匀——正态”等其他云模型
2 正态云的数学性质一
对任一定性概念，其所有定量实现——云滴组成的随机变量，在论域空间呈泛正态分布。
云滴在论域空间的概率分布
记所有云滴组成的随机变量为X,由云发生器的算法，X的概率密度为:
背景：利用统计方法确定隶属度和隶属函数的合理性
从概率测度角度看，云模型的定义域是N 维量化论域空间。
云滴是该论域空间中的一个随机变量，服从泛正态分布；云滴对概念的确定度，也是一个随机变量。
概率论中的正态分布及普适性
正态分布广泛存在于自然现象与社会现象中，实际中遇到的许多随机现象都服从或者近似服从正态分布。
7
5 正态云的数学性质四
思考
在云发生器算法中，通常选用较小的超熵He生成云滴，如He较大（概念的共识差，离散性强），会产生什么样的分布形态？
如果一个概念缺少共识，反映其数字特征的超熵会变得很大，云的整体轮廓不再清晰可见，云逐渐“雾化”。但雾化过程中，始终可保持云滴在靠近中心部分占优势。
=
1
− ( x−Ex)2 − ( y−En)2
e 2y2
2He2 dy
−∞ 2 He y
此函数没有解析形式。
云滴的统计特性
云滴X 的期望 E(X)=Ex ；
方差D(X) = ∫ ∫ +∞ (
x
−
Ex
) 2dx
−∞
+∞ 1 −∞ 2πHe
y
exp ⎜⎜⎝⎛ −
( x − Ex ) 2 2y2
−
( y − En ) 2 2 He 2
模糊性和随机性，曾经被认为是完全不同的两类不确定性，分别进行处理。
可能性理论: 一个人早餐吃5个鸡蛋的可能性为1，但吃5
个鸡蛋的概率为0。
随机性和模糊性毫无关联! 模糊性对排中律的背叛：
A+ A≠1
2
在更多情况下，随机性和模糊性相关。
“17岁是青年人吗？”
统计得到“是”的概率越大，则“17岁”隶属于“青年”的程度也越大。
正态分布的普适性和高斯隶属函数的普适性，共同奠定了正态云模型的普适性。
3
云模型的数理统计基础
9 云模型利用三个数字特征设计特定的算法，构造出一个服从泛正态分布的随机变量 ——云滴。
9 云模型本质是基于概率测度空间的云滴及其确定度的分布模型。云模型对模糊性和随机性的关联性，建立了简单但是较为合理的映射关系。
一维云模型云滴的期望曲线
研究数据集分布的几何规律性，寻找数据集的“中间”结构——“脊梁骨”，用一条光滑曲线代替数据集，几何上非常直观。
研究数据集分布的几何规律性，寻找数据集的 “中间”结构——“脊梁骨”，用一条光滑曲线代替数据集，几何上非常直观。常用的寻求期望曲线的方法有主曲线和回归曲线等。
云模型的数理统计基础
对某一定性概念，云滴在靠近期望值出现的概率较大，且该云滴能代表此定性概念的确定度也较大；云滴在远离期望值处出现的概率较小，该云滴能代表该概念的确定度也较小。
用模糊性对随机性关联的映射函数来计算确定度，恰好可说明上述现象。
为什么不用更少或者更多的数字特征构造云模型？
z 用三个数字特征进行定性定量转换是最小集合，不可能再少；
2He2
−∞ 2π
2
= En2 + He2
性质一正态云算法产生的云滴，是一个期望
为Ex，方差为 En2 + He2 的随机变量，呈现泛正态分布。参数He是偏离正态分布程度的度量，可以用来反映在论域空间影响概念诸因素的不均匀、不独立现象。
若He=0，云滴为正态分布；若En=0, He=0，云滴则总是出现在期望点Ex上，没有不确定性。
fX (x) =
1 2π En'
exp⎛⎜⎜⎝
−
(
x − Ex)2 2En'2
⎞⎟⎟⎠
而En’的概率密度为:
fEn' (x) =
1 2π
He
exp⎜⎜⎝⎛
−
(x − En)2 2He2
⎟⎟⎠⎞
4
故 X 的概率密度函数为:
f X (x) = f En' (x) × f X (x En' )
∫ π ∞
雾化过程分析
z 通过研究X的概率分布可知，X的分布函数没有解析形式
∫ f X (x) =
fEn' (x) ×
f
X
(
x
|
En'
)
=
∞ −∞
1 2πHe
|
− ( x−Ex)2 − ( y−En)2
e 2y2
2He2 dy
y|
超熵变大的过程
z 当He逐渐增大的时候，云滴开始离散，云滴的凝聚性变差了
云滴分布规律
⎟⎟⎠⎞dy
= ∫ ∫ 1
+∞
y
exp{− (y − En)2 }dy
+∞
1
(x − Ex)2 exp{− (x − Ex)2 }dx
2π He −∞
2He2
−∞ 2π y2
2y2
=
∫ ∫ 1 +∞y2 exp{− (y − En)2 }dy +∞ 1 t 2 exp{− t 2 }dt
2π He −∞
降低-速度慢
云线密度
降低-速度快
云心相对线密度（云心增加线密度/云线密度）
简要证明如下：
设正态云为（Ex,En,He），云滴总数为 N。由切比雪夫不等式：
P{ X − Ex < 4 En2 + He2 } ≥ 15 ≈ 1 16
即云长度可近似为：8 En2 + He2 故云线密度为 N / 8 En2 + He2
模糊集合中常用的隶属函数形态
1、线性隶属函数 2、三角型隶属函数 3、凸形隶属函数 4、梯型隶属函数 5、岭型隶属函数 6、高斯隶属函数

e商务文档

正态云的数学性质

相关文档推荐：