当前位置：文档之家› 基于静态删减算法的神经网络在软件可靠性预测中的应用

基于静态删减算法的神经网络在软件可靠性预测中的应用

第３２卷第３期　２０１３年６月　飞行器测控学报　Ｊｏｕｒｎａｌ　ｏｆ　Ｓｐａｃｅｃｒａｆｔ　ＴＴ＆Ｃ　Ｔｅｃｈｎｏｌｏｇｙ　ＶｏＬ　３２　Ｎｏ．３　Ｊｕｎ．２０１３　

基于静态删减算法的神经网络　

在软件可靠性预测中的应用　

夏　烨，闰国英，司倩然　

（北京跟踪与通信技术研究所・北京・１０００９４）　

摘　要：与传统的基于人工神经网络的软件可靠性预测模型结构普遍由预先经验或者通过不断尝试的方法确定不　同，在分析一般的软件可靠性模型的基础上，提出将一种基于静态删减算法的神经网络模型应用到软件可靠性预测　中。通过利用２组经典的软件失效数据进行仿真，并与传统的神经网络可靠性预测模型对比分析，研究了神经网络　拓扑结构和预测精度的关系，结果表明，基于静态删减算法的运用能够提高神经网络模型对软件可靠性的预测精度。　关键词：软件可靠性；神经网络；静态删减算法（ＳＰＡ）；拓扑结构；可靠性预测　中图分类号：ＴＰ３¨．５２　文献标志码：Ａ　文章编号：１６７４　５６２０（２０１３）０３—０２３４　０６　Ｄ０Ｉ：１０．７６４２／ｊ．ｉｓｓｎ．１６７４—５６２Ｏ．２０１３－０３—０２３４—０６　

Ｓｏｆｔｗａｒｅ　Ｒｅｌｉａｂｉｌｉｔｙ　Ｐｒｅｄｉｃｔｉｏｎ　ｗｉｔｈ　ａ　Ｎｅｕｒａｌ　Ｎｅｔｗｏｒｋ　

Ｍｏｄｅｌ　Ｂａｓｅｄ　ｏｎ　Ｓｉｌｅｎｔ　Ｐｒｕｎｉｎｇ　Ａｌｇｏｒｉｔｈｍ　

ＸＩＡ　Ｙｅ，ＹＡＮ　Ｇｕｏｙｉｎｇ，ＳＩ　Ｑｉａｎｒａｎ　

（Ｂｅｉｊｉｎｇ　Ｉｎｓｔｉｔｕｔｅ　ｏｆ　Ｔｒａｃｋｉｎｇ　ａｎｄ　Ｔｅｌｅｃｏｍｍｕｎｉｃａｔｉｏｎｓ　Ｔｅｃｈｎｏｌｏｇｙ，Ｂｅｉｊｉｎｇ　１０００９４）　

Ａｂｓｔｒａｃｔ：Ｆｏｌｌｏｗｉｎｇ　ａ　ｓｔｕｄｙ　ｏｆ　ｔｙｐｉｃａｌ　ｓｏｆｔｗａｒｅ　ｒｅｌｉａｂｉｌｉｔｙ　ｐｒｅｄｉｃｔｉｏｎ　ｍｏｄｅｌｓ，ａ　ｎｅｗ　ｓｏｆｔｗａｒｅ　ｒｅｌｉａｂｉｌｉｔｙ　ｐｒｅｄｉｃｔｉｏｎ　ｍｏｄｅ１　ｂａｓｅｄ　ｏｎ　ｎｅｕｒａｌ　ｎｅｔｗｏｒｋ　ｕｓｉｎｇ　ＳＰＡ（Ｓｉｌｅｎｔ　Ｐｒｕｎｉｎｇ　Ａｌｇｏｒｉｔｈｍ）ｉｓ　ｐｒｏｐｏｓｅｄ．Ｔｈｅ　ｍｏｄｅｌ　ｉｓ　ｄｉｆｆｅｒｅｎｔ　ｆｒｏｍ　ｍｏｓｔ　ｓｏｆｔｗａｒｅ　ｒｅｌｉａｂｉｌｉｔｙ　ｐｒｅｄｉｃｔｉｏｎ　ｍｏｄｅｌｓ　ｂａｓｅｄ　ｏｎ　ｎｅｕｒａｌ　ｎｅｔｗｏｒｋｓ　ｉｎ　ｔｈａｔ　ｔｈｅ　ｔｏｐｏｌｏｇｉｃａｌ　ｓｔｒｕｃｔｕｒｅｓ　ｏｆ　ｔｈｅ　ｎｅｔ—　ｗｏｒｋｓ　ａｒｅ　ｄｅｔｅｒｍｉｎｅｄ　ｂｙ　ｔｈｅ　ａｌｇｏｒｉｔｈｍｓ　ｗｉｔｈ　ｐｒｉｏｒ　ｋｎｏｗｌｅｄｇｅ　ｏｒ　ｔｒｉａｌ　ａｎｄ　ｅｒｒｏｒ．Ｓｉｍｕｌａｔｉｏｎ　ｗｉｔｈ　ｔｗｏ　ｓｕｉｔｅｓ　ｏｆ　ｃｌａｓｓｉ—　ｃａｌ　ｓｏｆｔｗａｒｅ　ｄｅｆｅｃｔ　ｉｎｆｏｒｍａｔｉｏｎ　ｓｈｏｗ　ｔｈａｔ　ＳＰＡ　ｈｅｌｐｓ　ｉｍｐｒｏｖｅ　ｔｈｅ　ａｃｃｕｒａｃｙ　ｏｆ　ｎｅｕｒａｌ　ｎｅｔｗｏｒｋ—－ｂａｓｅｄ　ｓｏｆｔｗａｒｅ　ｒｅｌｉａｂｉｌｉ—－　ｔｙ　ｐｒｅｄｉｃｔｉｏｎ　ｍｏｄｅｌｓ　ａｎｄ　ｔｈｅ　ｒｅｌａｔｉｏｎｓｈｉｐ　ｂｅｔｗｅｅｎ　ｔｈｅ　ｔｏｐｏｌｏｇｉｃａｌ　ｓｔｒｕｃｔｕｒｅｓ　ｏｆ　ｎｅｕｒａｌ　ｎｅｔｗｏｒｋｓ　ａｎｄ　ｐｒｅｄｉｃｔｉｏｎ　ａｃｃｕ　ｒａｃｙ　ｉｓ　ｄｉｓｃｕｓｓｅｄ　ｉｎ　ｃｏｍｐａｒｉｓｏｎ　ｗｉｔｈ　ｔｒａｄｉｔｉｏｎａｌ　ｎｅｕｒａｌ　ｎｅｔｗｏｒｋ—ｂａｓｅｄ　ｓｏｆｔｗａｒｅ　ｒｅｌｉａｂｉｌｉｔｙ　ｐｒｅｄｉｃｔｉｏｎ　ｍｏｄｅｌｓ．　Ｋｅｙｗｏｒｄｓ：ｓｏｆｔｗａｒｅ　ｒｅｌｉａｂｉｌｉｔｙ；ｔｏｐｏｌｏｇｙ；ｎｅｕｒａ１　ｎｅｔｗｏｒｋ；Ｓｉｌｅｎｔ　Ｐｒｕｎｉｎｇ　Ａｌｇｏｒｉｔｈｍ（ＳＰＡ）；ｒｅｌｉａｂｉｌｉｔｙ　ｐｒｅｄｉｃｔｉｏｎ　

０　引　

软件可靠性研究是保证软件质量的一个重要方　

面，但是如何对软件的可靠性进行预测，一直是软件　工程实践中的一个难题。　预测软件的可靠性，首先需要建立软件可靠性　

模型。软件可靠性建模方法可以概括为２类：基于　统计分析的方法和基于计算智能的方法。前者在软　

件可靠性预测的发展过程中占很大比例，其中典型　

的可靠性模型有Ｊ—Ｍ模型、Ｇ—Ｏ模型、ＭｕＳＡ模型　等。然而，这类模型都基于一定的数学理论假设。　在实际应用中，一方面这些假设往往是不现实的或　

难以满足的；另一方面开发者也无法预先得知软件　的失效过程符合哪一种可靠性模型的假设，导致选　

择合适的模型进行可靠性预测成为一个难题。　

软件可靠性预测的计算智能方法是一种数据驱　动的预测技术，即不做任何限制性的假设，直接通过　

已有失效数据对软件可靠性进行分析和预测。由于　

ＡＮＮ（人工神经网络）非常强的非线性运算能力，这　

种方法已成为最主要的基于数据驱动的软件可靠性　

预测方法。１９９１年，Ｋａｒｕｎａｎｉｔｈｉ等口　首次提出了　

基于神经网络的可靠性预测模型，证明了神经网络　

＊收稿日期：２０１３—０２—０１；修回日期：２０１３—０２—２７；网络出版时间：２０１３—０５—２７　１１：１９　网络出版地址：ｈｔｔｐ：／／ｗｗｗ．ｃｎｋｉ．ｎｅｔ／ｋｃｍｓ／ｄｅｔａｉｌ／１１．４２３０．ＴＶ．２０１３０５２７．１１１９．０１３．ｈｔｍｌ　第一作者简介：夏烨（１　９８７一），女，硕士研究生，助理工程师，主要研究方向为软件测试、软件可靠性；Ｅ－ｍａｉｌ：ｓｕｎｎｙｂａｙ０４＠ｈ。ｔｍａｉｌ

＿ｃｏｍ　第３期　夏烨，等：基于静态删减算法的神经网络在软件可靠性预测中的应用　２３５　

模型具有很好的预测一致性。为了进一步提高预测　可信度，许多研究人员提出了改进的方法。例如，　

Ｎ．Ｒ．Ｋｉｒａｎ等＿２　提出利用小波函数作为隐含层激　

活函数，形成３层全连接的小波神经网络，对软件可　靠性进行预测。Ａ．Ｊｏｍｅｉｒｉ＿３］在前馈网络的基础　

上，将隐含层前一时刻的输出反馈到输入层对软件　

进行缺陷检测。　神经网络的拓扑结构、学习算法、学习速率等因　

素都会影响网络的性能，但是在现有的基于神经网　络的软件可靠性预测模型中，大部分的模型结构都　

是由预先经验或通过不断尝试的方法确立的。为了　获得更好的预测效果，本文主要关注拓扑结构，利用　

基于ＳＰＡ（静态删减算法）的神经网络［４］进行软件　

可靠性预测，研究拓扑结构与预测精度的关系，并在　

此基础上讨论归一化处理对预测精度的影响。　

１　基于神经网络的软件可靠性模型　

利用神经网络进行软件可靠性预测可以视为一　个时间序列预测问题，主要包括２个阶段＿５］：　

１）训练阶段。对神经网络进行训练的目的是，　

利用网络输出和期望输出的偏差，通过数值计算方　

法对连接节点的权重不断调整，得到期望的输出。　若给定一个累积失效序列｛Ｙ　，Ｙ　，…，Ｙｗ），可以构　

造以　时刻以前的累积失效序列｛Ｙ…，Ｙ　，…，　

Ｙ　＋　｝作为输入，　＋　＋忌时刻的累积失效数Ｙ　作为　

期望输出的训练数据集，其输入输出的映射关系如　图１（ａ）所示。　２）预测阶段。利用训练好的网络，对未知的数　

据集进行预测，ｋ一１时称为单步预测；ｋ≥２时称　

为多步预测。图１（ｂ）所示的是单步预测。　

输入　（ｙｌ，Ｙ２，…，　）　

，　…，　＋　）　

｛Ｙｉ　，ｙ　１，　一，Ｙｉ—１）　输出　

（ａ）￣ｌｌ练过程　

｛Ｙｉ　＋ｌ，　…２，　。，　】　｛ｙ　＋２，Ｙｉ　＋３，’。。，Ｙ　１　

（ｂ）预测过程　

图１基于ＡＮＮ的软件可靠性模型　Ｆｉｇ．１　Ｓｏｆｔｗａｒｅ　ｒｅｌｉａｂｉｌｉｔｙ　ｍｏｄｅｌ　ｂａｓｅｄ　ｏｎ　ＡＮＮ　（ａ）ｔｒａｉｎｉｎｇ　ｐｈａｓｅ；（ｂ）ｐｒｅｄｉｃｔｉｏｎ　ｐｈａｓｅ　２模型结构的确立　

目前，软件可靠性预测大部分采用的都是ＦＦＮ　

（前馈神经网络）。ＦＦＮ由３层神经元组成：输人　

层、隐含层和输出层，如图２所示。输入层有叫个　神经元，对应数据集｛　一　＋　，Ｙ　＋。，…，Ｙ　，Ｙ　）；隐　

含层可包含多个神经元；在进行单步预测时，输出层　

只有１个神经元。　

…１　

ｙ￡　＋２　

），　输入层　隐含层　输出层　

＼　

图２前馈神经网络　Ｆｉｇ．２　ＦＦＮ　

由于输入层和输出层的神经元一般是根据情况　

或需要确定的，而隐含层神经元（又称为隐单元）往　

往是根据经验或通过不断尝试的方法来确定，例如，　文献［６３中按经验把隐单元数设为３，文献［７］中将　

隐单元数设为ｑ一２ｗ＋１，其中叫为神经网络输入　

层神经元数。然而由于样本数据集大小以及输入　

层、输出层神经元个数的差异性，上述方法得到的神　

经网络并不能达到最优预测效果。２０１１年，Ｓ．Ｕ＿　

Ａｈｍｅｄ等　提出了基于ＬＺＣ（Ｌｅｍｐｅｌ—Ｚｉｖ复杂度）　

的ＳＰＡ，并在大量的机器学习问题上证明了其在动　

态确立神经网络结构上有良好的效果。ＳＰＡ有如　下优点：　

１）在进行网络训练过程中不会产生很大　

扰动；　

２）保留复杂度高的隐单元，删减复杂度低的隐　

单元，使隐含层对前层输入有较好的灵敏性。　

本文利用ＳＰＡ动态确立基于神经网络的软件　

可靠性模型结构，并与隐单元数分别为３和２ｗ＋１　

的软件可靠性模型在相同的数据集进行实验，通过　

实验结果的对比分析表明，ＳＰＡ能快速确立基于神　

经网络的软件可靠性模型结构，提高预测精度。

　飞行器测控学报　第３２卷　

２．１　隐单元ＬＺＣ　ＳＰＡ是利用ＬＺＣ理论计算得到的冗余度来删　

减人工神经网络的冗余隐单元　］。ＬＺＣ是一种度　

量符号序列复杂性的算法。它衡量的是描述一个给　定符号序列所需最少的、互不相同的子串个数。复　

杂度越大，说明数据出现的新变化越多，发生新变化　

的速率越快。因此，神经元的复杂度是神经网络是　否能有组织地协同作用、较好地实现功能的一个指　

标。ＬＺＣ值越大，表明该神经元灵敏度越高。计算　

隐单元ＬＺＣ的过程如图３所示。其中　（　）表示隐　单元的输出序列，它是位于（０，１）的浮点数，当　（　）　

大于等于０．５时，则将Ｓ（　）赋值为１；否则，将其赋　值为０。这样，就构成了Ｓ。ｎ为Ｓ的长度，ｃ（　）表　

示ｓ的ＬＺＣ值，ＢＵＦ１和ＢＵＦ２是２个缓冲区。　

图３隐单元ＬＺＣ计算流程　Ｆｉｇ．３　Ａｌｇｏｒｉｔｈｍｉｃ　ｓｔｅｐｓ　ｔｏ　ｍｅａｓｕｒｅ　ＬＺＣ　ｏｆ　ｔｈｅ　ｎｅｕｒｏｎｓ　ｏｆ　ｔｈｅ　ｈｉｄｄｅｎ　ｌａｙｅｒ　

２．２可靠性模型中隐含层的确定　

ＳＰＡ动态调整基于神经网络的软件可靠性模　型结构的主要思想是：首先根据软件失效数据集的　大小确定输入层神经元数，通过计算训练过程中隐　

单元的复杂度，删除含有ＬＺＣ最小值或者最大冗余　

度的神经元，并保留训练中ＬＺＣ值较大的神经元。　

关键步骤如下：　１）创建一个全连接的ＦＦＮ，隐单元数从设定的　

取值范围中随机获得，进行单步预测时输出层神经　

元数为１。利用软件失效数据作为神经网络的输　

入。　２）使用ＢＰ（反向传播）算法对初始神经网络进　

行训练，并按图３所示流程计算训练好的各隐单元　的ＬＺＣ值。隐单元和输出层神经元选择Ｓ型函数　

作为激发函数。　３）计算所有隐单元ＬＺＣ的平均值Ｍ，将其作为　

阈值。　４）若当前所有隐单元中最小的ＬＺＣ小于Ｍ，删　

除ＬＺＣ最小的隐单元，训练新网络。　５）在迭代的过程中检验训练样本的ＲＭＳＥ（均　

e商务文档

基于静态删减算法的神经网络在软件可靠性预测中的应用

相关文档推荐：