(冶金自动化》2004年增刊
一种新的模糊系统建模方法研究与应用
张永忠
(上海电视大学计算机系,上海,200086)
〔摘要〕基于聚类技术和一类模糊神经网络,提出一种新的自动生成模糊系统规则库的设计方法。通过结构辨识(原始数据聚类得到模糊规则数)和参数辨识(RBF网络优化参数)方法,构造模糊系统完善的模糊规则库。通过对丙烯睛收益率问题及函数逼近问题的仿真,说明了该方法具有规则数目少、学习速度快、建模精度高等特点。〔关键词〕聚类;模糊神经网络;模糊规则库
0引言
在模糊系统的设计过程中,对于模糊推理规则的获取,传统方法是单凭经验确定隶属度函数和规则,
实现自学习功能,复杂且难度大。模糊系统初始结构的确定涉及模糊规则的提取、输人输出空间的模糊划分,初始参数的选取等诸多方面,因而模糊系统在设计时常会遇到:隶属函数的确定、模糊规则的选取
和模糊推理的实现等问题,而其中最重要的就是要得到理想的模糊规则库。对于模糊规则的获取,通常采用在模型构造方面大有作为的聚类学习算法。目前,已有许多种聚类算法可以采用,如归类树法、最近
邻聚类法、K-means聚类法、模糊C- means以及自组织竞争法等。这些聚类学习具有聚类结果清晰,无模糊、二义的优点,但也存在许多问题。研究表明,大多数聚类学习算法,如模糊C-means聚类算法
等,均需用户事先给定聚类个数。然而,聚类个数通常也正是问题求解的一部分,且聚类结果对聚类个数大小非常敏感,聚类个数直接影响模糊划分的有效性,对于不同初值的聚类结果往往大相径庭。
1监督聚类算法和初始结构的确定
针对以上提出的问题,本文采用在径向基函数网络和模糊建模中常用的、具有代表性的一种无监督的聚类算法—减法聚类,自动地对已知输人输出数据聚类,而不需要有关数据的任何先验假设〔1-710
该算法是一种基于人类视觉数据集形成原理和数据间相关性而进行聚类的简洁算法。通过建立数据密
度指标,自适应地确定聚类数及类中心,进而确定模糊系统的初始结构。 聚类技术与径向基函数网络或是模糊建模一起使用,主要确定径向基函数的初始位置或模糊if -
then规则。减法聚类中,聚类中心的候选集为数据点,计算量与数据点的数目呈简单的线性关系,且与所
考虑问题的维数无关。
考虑M维空间的n个数据点((XI 9X2 + ... 9X,)。不失一般性,假定数据点已经归一化到一个超立方体
中。由于每个数据点都是聚类中心的候选者,因此,数据点x、处的密度指标定义为:
D/一奢exp(-(r. /2)'(1)
这里y。是一个正数。显然,如果一个数据点有多个邻近的数据点,则该数据点具有高密度值。半径
rQ定义了该点的一个邻域,半径以外的数据点对该点的密度指标贡献甚微。
在计算每个数据点密度指标后,选择具有最高密度指标的数据点为第1个聚类中心,令xd为选中的点,D‘;为其密度指标。那么每个数据点x、的密度指标可用公式
D‘一”-Ddexp[- I I (Ya/2)2I I2」(2)
修正。其中,7b是一个正数。显然,靠近第1个聚类中心x.1的数据点的密度指标将显著减小,这样使得
这些点不太可能被选为下一个聚类中心。常数y。定义了一个密度指标显著减小的邻域。常数y、通常
〔收稿日期〕2004-06-16〔作者简介」张永忠(1968-),男,江苏扬州人,副教授,主要从事计算机理论与控制工程方面的研究工作。
《冶金自动化》2004年增刊
大于y.,以避免出现相距很近的聚类中心,一般,yb=1.5yao 修正了每个数据点的密度指标后,选定下一个聚类中心x'2,再次修正数据点的所有密度指标。该过
程不断重复,直至产生足够多的聚类中心。 当减法聚类法应用于一个输人一输出数据集时,每个聚类中心代表一个展示被建模系统的某些特性的原型,这些聚类中心可以合理地用作零阶Sugeno模糊模型中模糊规则的前提的中心,或RBFN中径向基函数的中心。例如,假定i第个聚类中心是M维的“,则‘、可分解为两部分向量p‘和qi,这里p‘是
输人部分,它包含。、的前N个元素;而q‘是输出部分,包含“的后M-N个元素。那么给定一个输人向
量x,它满足规则i的程度定义为:。‘一exp-上康井)(3)
如果用RBFN建模思想来解释,上式也是第i个径向基函数的定义。一旦确定了前提部分(或径向基函数),再采用优化方法进一步调节,可以获得更高的模型精度。
通过上述的聚类算法就可以将已知的数据分为。(c=最终的聚类个数)个类,并得到相应的聚类中心Ci,于是就可以构造如下的初始模糊规则库。
规则Ri , If x1 is A! (xi ),…,and xM-1 is Ail-1 is Ajf_1(xm_,),then y = wi,j=1,2,…,‘(4)其中,。是模糊规则的数目,规则中前提部分的隶属函数风i (xi)的表示如(3)式。规则中结论部分的实数
wi可以表示为:wj牛qj(5)wi -qi最后,模糊系统总的输出用所有规则结论来表示为
、,才于
、,产只U
t口12、毛
2‘、,一自aiwi
ai=H 14 i_=1l Eaij=1
:(xi )
2参数优化
在构造了初始的模糊规则库之后,接下来就需要对模糊系统的参数((pi, qi)进行进一步优化。即设计
一类模糊神经网络,通过有监督学习逐步调整网络的权值,也就是对模糊规则库中的参数进行细调整,使
其具有更高的精度,最后得到一个理想的、完善的模糊规则库。
RBF网络是由Moody和Darken [21提出的一种采用局部接受区域来执行函数映射的网络结构,它可以以任意精度逼近任意连续非线性函数,而且不存在局部最小问题。已经证明RBF网络和T-S型模糊推理过程具有内在的相似性,当模糊规则的个数与RBF网络的隐层个数相等时,两者在函数关系上是等
价关系。因此,可以将神经网络的网络化形式和优化技术引人模糊系统,采用RBF网络优化参数,网络中的权值和规则库中的参数相对应。
本文所设计的网络结构如图1所示。
输入层隶属函数层规则层输出层
图1模糊神经网络结构图由图1可以看出,该RBF网络由输人层、隶属函数层、规则层和输出层组成
第1层:输人层每个神经元接受一个数据信号xi,并向下一层传递。
(冶金自动化》2004年增刊
第2层:隶属函数层 原始数据经过聚类分为。类(‘条规则),因此每个组(用方框表示)内各有‘个神经元(表示。
个规则前提)。其隶属函数式如(3)式。 第3层:规则层 即前提集合层,实现每个规则的前提匹配。这一层共有。个神经元,其中第i个神经元只接受前一层每个组内的第i个神经元的输出。其输出如(7)式。
第4层:输出层(去模糊化层) 实现规则集合。神经元的输出如(6)式。
定义网络训练的目标函数为:
E=1,二于ky-y乙资)2(8)
式中,y为网络实际输出,y‘为期望输出。 采用有监督的剃度下降法来调整该模糊神经网络的权值((p=,q;),也就是优化模糊规则库中规则的前
提和结论参数。
3仿真实例
3.1丙烯胺收率问题 在丙烯睛装置的生产过程中,丙烯睛的收率是一个非常重要的指标,及时、准确地测量产品中丙烯睛的收率是进行丙烯睛装置先进控制的关键。采用在线分析仪表检测丙烯睛收率,价格昂贵、维护保养复杂,而且有较大的测量滞后,难以满足生产要求,因此采用软测量方法对丙烯睛收率预测具有重要的意
义。 本文针对某化工厂的年产5万t丙烯睛装置B反应器,采用聚类算法和RBF神经网络相结合的技术,对该系统建模。该化工厂的年产5万t丙烯睛装置,采用美国标准石油公司Sohi。的生产工艺,以C-41作催化剂,用丙烯、氨、空气为原料,在沸腾床反应器中一次直接氧化制取丙烯睛(即丙烯氨氧化
法)。工艺条件由车间根据计划科下达的当月生产任务和生产装置运行的实际情况确定。经分析,对丙烯睛收率影响较大的因素可以归结为原料的配比、反应温度、反应压力、接触时间、空塔线速等条件[3]0
根据丙烯睛工艺分析,最后将反应压力、中段温度、纯丙烯量、空比、氨比、反应线速、触媒量作为软测
量建模的辅助变量。将采集到的200组数据经过进行标准化处理后,分为两份,150组作为训练样本,用来训练网络模型;另外50组数据作为测试样本,用于检验模型的泛化能力。采用上述方法,仿真结果如
图2所示。Tested Dataahe line of y*follow y一一T”厂二Test Data・・一Simulated Outout
',-A, }--r。布厂.
1111111165 170 175 180 185 190 195 200 Sample No
丙烯脑收益率模型仿真结果凡j
,‘,二On,』Ot300000nR}7
7 哥招邻婆毅起
160
图2 由仿真结果可以看出,模型整体逼近效果良好,系统整体误差为6. 166 7 X 10-7,可以满足工艺要求,
能有效应用于丙烯睛收益率的软测量问题。
3.2非线性函数通近问题 考虑采用如下公式的非线性函数逼近问题川:
y=0. 5 (1+sin(27rxl) cos(27rx2))(9)
11
《冶金自动化》2004年增刊
上式中x1 ,x2 E [0,1],均匀选取400个输人输出数据对。按上述无监督聚类算法进行规则和初始参数的
提取,聚类后得到了10个聚类中心((c=10),及相应初始参数。因此,按照(3)式建立了包含有10条初始
规则的模糊规则库。然后采用如前述结构的RBF网络(如图1)对得到的参数进一步优化。图3、图4分别画出了采用本文方法和直接采用原始数据并用BP网络逼近该函数的结果图。
the line of output target入}TargetOutDu,尹矛七 .
‘0
八U the line of output follow target0.8I尸—,一下不二一- Target}`}``} }-- Outou
0.7卜l } r'、一
05
叫
03・・。节公己t-二品』己L乙0
11】月马
门」0
0
n
n}1芍分己・!艺沙口
100 150 200 250 300 350 400 Sample No. 0.1护一责一谕Siop Tminlaol150 200 250 Sample No.300 350 400
图3采用RBF函数逼近效果图4采用BP网络逼近效果 由以上图的对比可以看出,采用本文方法,系统整体逼近性能良好(图3 : SSE= 6. 961 4 X 10',图
4 : SSE= 7. 135 94 X 10-5),且由于采用RBF网络,训练时间明显比使用传统的直接采用原始数据并用
BP网络逼近函数的方法的时间短。
4结论
本文基于无监督聚类技术和RBF网络提出了一种新的模糊系统规则库的设计方法。应用聚类算
法,自适应地确定模糊系统的初始结构和参数,避免了对结构和参数选取的盲目性和随机性。通过仿真结果,可以看出本文提出了一种有效的自适应确定模糊系统规则库的方法,引人RBF网络先进的学习算
法,提高了参数的优化效率,也大大缩短了网络训练的时间,而且系统仿真输出的精度较高。
〔参考文献〕[1] Ching一Chang Wong, Chia-Chong Chen. A hybrid clustering and gradient descent approach for fuzzy modeling [J]. IEEE Trans on Systems, Man and Cybernetics. Part B, 1999,29(6):686一693.[2]Moody J, Darken C. Fast learning in networks of locally一tuned processing units仁J]. Neural Computation, 1989, (11):281一294.[3]闻新,周露. MATLAB神经网络应用设计[M].北京:科学出版社,2001.仁4] R R Yager, D P Filev. Approximate clustering via the mountain method [J]. IEEE Trans on System, Man and Cyber- netics, 1994,24(8):1 279一1 284.[5] Alexandre Evsukoff, Antonio C S Branco, Sylvie Galichet. Structure identification and parameter optimization for non 一linear fuzzy modeling [J]. Fuzzy Sets and Systems, 2002, (132):173一188.[6] Sungkwun Oh, Witold Pedrycz. Identification of fuzzy systems by means of an auto-tuning algorithm and its applica- tion to nonlinear systems [J]. Fuzzy Sets and Systems, 2000, (115):205一230.[7] Jianqin Chen, Yugeng Xi, Zhongjun Zhang. A clustering algorithm for fuzzy model identification [J]. Fuzzy Sets and Systems, 1998, (98):319一329. 仁编辑:沈黎颖〕