课程设计报告 题 目基于数据挖掘的航电系统故障诊断专业名称 电子信息工程 学生姓名 王腾飞 指导教师 陈 杰 完成时间 2014年3月18日摘要航电系统是飞机的重要组成部分,由于其综合应用了电子、机械、计算机及自动检测等许多学科的先进技术,结构层次很多,所以对其实施故障诊断具有涉及专业领域多、诊断难度大、要求时间短等特点。
这对快速处理故障数据提出了很大的挑战。
从独立的联合式航电机箱的按键通电测试,到集中式飞机管理系统数据收集,飞机维修系统经过漫长的发展已演变成故障诊断工具。
现代飞机均采用了中央维修系统,用以收集所有子系统的故障报告、判断故障根源并推荐修理方法。
飞机的故障信息和历史数据存放在数据库中。
如果用传统的数据分析方法对这些海量的数据进行分析时会显得力不从心,不仅浪费时间而且对于隐含的知识难以有效的进行挖掘。
数据挖掘技术十分符合现实的需要,它可以客观地挖掘出历史数据库中潜在的故障规则,这些规则能更好地指导故障的定位与检修,并对潜在的故障做出预测。
随着数据的不断增长,如何能自动获取知识已经成为故障诊断技术发展的主要制约条件,而数据挖掘技术为解决这个“瓶颈”问题提供了一条有效的途径。
本文详细介绍了故障诊断技术与数据挖掘技术,并总结了航电系统的故障诊断的特点。
拟采用聚类分析的技术对故障数据快速处理,实现对故障的快速定位。
关键词:故障诊断数据挖掘聚类分析航电系统故障诊断技术故障诊断技术简介故障诊断就是指当设备系统不能完成正常的功能时,利用一定的方法找出使该功能丧失的原因及发生故障的部位,实现对故障发展趋势的预测的过程。
故障诊断涉及到多方面的技术背景,主要以系统论、信息论、控制论、非线性科学等最新技术理论为基础,它是一门综合性的学科,具有重要的实用价值。
设备系统故障及故障诊断随着现代化工业的发展,设备系统能够以最佳状态可靠地运行,对于保证产品质量、提高企业的产能、保障生命财产安全都具有极其重要的意义。
设备系统的故障是指设备系统在规定时间内、规定条件下丧失规定功能的状况。
故障诊断的作用则是发现并确定发生故障的部位及性质,找出故障的起因,预测故障的发展趋势并提出应对措施。
故障诊断技术的使用范围不应只局限于设备系统使用和维修过程中,在设备系统的设计制造过程中也可以使用故障诊断技术,为以后的故障监测和设备系统维护创造条件。
因此,故障诊断技术应该贯穿于设备系统的设计、制造、运行和维护的全过程当中。
机载设备的故障诊断流程框图:航电系统的故障诊断航电系统是飞机的重要组成部分,不仅包括众多的数字计算机、多路传输数据总线、控制显示装置,还有许多传感器或航线可更换件,而且由于其综合应用了电子、机械、计算机及自动检测等许多学科的先进技术,结构层次很多,所以对其实施故障诊断具有涉及专业领域多、诊断难度大、要求时间短等特点。
当航电系统发生故障时,由于其自身的多层次性和复杂结构,使得故障一般不会独立存在,他们之间通常相互依存和影响,同时系统的子部件存在密切的数据传输和耦合关系,多故障状态和多故障传播大量存在,所以一种故障可能对应多种征兆,一种征兆可能对应多种故障,征兆和故障源之间的关系复杂,各种不确定影响因素很多,它们参与故障的传播并最终将故障反映在征兆上。
航电系统排故过程中多故障给故障定位和诊断带来了一定困难。
数据挖掘技术简介数据挖掘的定义数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。
这个定义包括好几层含义:数据源必须是真实的、大量的、含噪声的;发现的是用户感兴趣的知识;发现的知识要可接受、可理解、可运用;并不要求发现放之四海皆准的知识,仅支持特定的发现问题。
通常人们把概念、模式、规则和规律等看作知识,但是从广义上来说信息、数据也是知识的表现形式。
人们把数据看作是发现知识的来源的矿石,知识就如同从中提炼出的矿产一样。
数据挖掘得到的知识可应用在过程控制、决策支持、信息管理、查询优化及数据自身的维护等领域。
数据挖掘是一门涉及到数据库、人工智能、并行计算、数理统计和可视化等方面技术的交叉学科,它使人们在数据的利用方面,不但可以脱离简单查询的局限,而且可以向知识发现方面拓展,目的是挖掘出有用的知识,最终在决策制定方面给以支持。
由于数据挖掘方法具有广阔的应用前景,大量来自不同领域的学者和工程技术人员都投身到这一新兴的研究领域,为数据挖掘的发展提供了强大的动力。
数据挖掘方法分类(1)关联规则方法:用于发现大量数据集中属性间的相互关联性,如“95%的客户在购买商品A的同时也会购买商品B"这一规则,所表达的意思为客户在购买一些商品的同时购买另外一些商品的可能性。
(2)聚类和分类方法:聚类就是将数据对象集合按照某种相似性度量原则划分为若干个类似数据对象组成的多个类的过程。
而分类则是预先假定数据库中的某个对象属于某个预先给定的类,再将数据库中所有的数据都分配到给定的类中的过程。
聚类和分类都是以类内差别最小而类间差别最大为目标进行划分。
(3)机器学习方法:机器学习是一种利用认识模型模仿人的学习方法并从数据集中提取知识的方法。
(4)多层次数据汇总归纳:数据库中的数据对象一般包含的是原始概念层次上的详细信息,将一个数据集从原始概念层信息归纳为更高概念层次信息的技术称为数据汇总。
(5)神经网络方法:神经网络具有良好的鲁棒性、并行处理、自组织自适应性、分布存储和高度容错等特性,极其适合用于数据挖掘。
典型的神经网络模型主要分三类:一是用于分类、预测和模式识别的前馈式神经网络模型;二是用于联想记忆和优化计算的反馈式神经网络模型;三是用于用于聚类的自组织映射方法。
(6)决策树方法:建立决策树的过程,就是利用信息论中的信息增益寻找数据库中具有最大信息量的字段,首先建立一个节点,再根据字段的不同取值建立树的分支;在每个分枝子集中,重复建立树的下层节点和分支的过程。
(7)可视化技术:为了使用户对数据的剖析更清楚,将数据结果转化表达成图形和图像等可视化形式的过程。
数据挖掘的过程(1)数据准备数据准备又可分为数据选取、数据预处理和数据变换三个子步骤。
数据选取的主要任务是确定操作对象,即目标数据。
数据预处理通常包括去除噪声、删除重复记录、转换数据类型和推导计算缺值等。
数据变换可以对特征进行分析,去除与知识挖掘无关的特征,减少数据挖掘过程中需要处理的数据量,大大提高挖掘的效率。
(2)数据挖掘数据挖掘阶段主要用来确定挖掘任务,并决定所使用的挖掘算法。
确定开采的任务就是根据数据的特点确定使用哪种方法更有效,这些方法包括数据总结、分类、聚类、关联规则发现及序列模式发现等;在确定挖掘方法之后,就要考虑使用什么样的挖掘算法。
这个过程中首先要考虑各种数据间的不同特点,选用与之相应的算法来挖掘;其次要考虑用户或实际运行系统的需求,例如一些用户或系统的要求是使预测型知识的预测准确度尽可能高,而另外一些用户则希望获取容易理解、描述型的知识。
(3)结果解释和评价数据挖掘阶段发现的知识经过评价后,要去除其中可能存在的冗余或与实际无关的模式。
如果某些模式不满足用户需求,就要返回到数据挖掘阶段之前,重新对知识进行挖掘。
最后得到的知识要面向用户,并且要将发现的知识进行可视化,把结果转化为用户易于理解的形式数据挖掘系统可以分为三部分,第一部分是由数据库、数据仓库等组成的数据源;第二部分是利用各种数据挖掘方法分析数据库中的数据发现知识的挖掘器;第三部分是用户层,应用多种方式将发现的知识及获取的信息反映给用户,使用户可以对结果进行直观的理解,达到用户的需求。
数据挖掘的一般步骤及过程框图如下:聚类分析(1)定义依据研究对象(样品或指标)的特征,对其进行分类的方法,减少研究对象的数目。
各类事物缺乏可靠的历史资料,无法确定共有多少类别,目的是将性质相近事物归入一类。
各指标之间具有一定的相关关系。
聚类分析(cluster analysis)是一组将研究对象分为相对同质的群组(clusters)的统计分析技术。
聚类分析区别于分类分析(classification analysis) ,后者是有监督的学习。
(2)算法分类聚类分析计算方法主要有如下几种:分裂法(partitioning methods):层次法(hierarchical methods):基于密度的方法(density-based methods): 基于网格的方法(grid-based methods): 基于模型的方法(model-based methods)。
1. 分裂法又称划分方法(PAM:PArtitioning method) 首先创建k个划分,k为要创建的划分个数;然后利用一个循环定位技术通过将对象从一个划分移到另一个划分来帮助改善划分质量。
典型的划分方法包括:K-means, K-medoids, CLARA (Clustering Large Application),CLARANS (Clustering Large Application based upon Randomized Search),FCM2. 层次法(hierarchical method) 创建一个层次以分解给定的数据集。
该方法可以分为自上而下(分解)和自下而上(合并)两种操作方式。
为弥补分解与合并的不足,层次合并经常要与其它聚类方法相结合,如循环定位。
典型的这类方法包括:BIRCH(Balanced Iterative Reducing and Clustering Using Hierarchies) 方法,它首先利用树的结构对对象集进行划分;然后再利用其它聚类方法对这些聚类进行优化。
CURE(Clustering Using REprisentatives) 方法,它利用固定数目代表对象来表示相应聚类;然后对各聚类按照指定量(向聚类中心)进行收缩。
ROCK方法,它利用聚类间的连接进行聚类合并。
CHEMALOEN方法,它则是在层次聚类时构造动态模型。
3.基于密度的方法,根据密度完成对象的聚类。
它根据对象周围的密度(如DBSCAN)不断增长聚类。
典型的基于密度方法包括:DBSCAN(Density Based Spatial Clustering Of Application With Noise):该算法通过不断生长足够高密度区域来进行聚类;它能从含有噪声的空间数据库中发现任意形状的聚类。
此方法将一个聚类定义为一组“密度连接”的点集。
OPTICS(Ordering Points To Identify The Clustering Structure):并不明确产生一个聚类,而是为自动交互的聚类分析计算出一个增强聚类顺序.4、基于网格的方法,首先将对象空间划分为有限个单元以构成网格结构;然后利用网格结构完成聚类。