第29卷第5期 计算机仿真 2012年5月 文章编号:1006—9348(2012)05-0159-04
物联网中传感节点数据异常检测方法研究
黄 华 (清远职业技术学院,广东清远511510) 摘要:研究物联网中节点数据异常的检测问题,提高检测的准确率。针对当物联网中的传感节点采集到的外界数据内容随 机性较大,在数据存储形式、格式等特征上存在较大差异时,造成各个节点数据之间很难取得一致。传统方法检测无法准确 根据差异信息建议统一待检测特征,造成检测的准确度不高的问题。为了解决这一问题,提出一种基于特征模糊聚类概率 搜索的节点数据异常检测算法,通过计算节点数据与异常数据之间的特征模糊聚类概率,运用模糊概率因素判定非法节点 数据。实验证明,改进方法能快速、完整地将检测节点异常数据,取得了理想的效果。 关键词:物联网;节点数据;特征模糊聚类概率 中图分类号:TP393.08 文献标识码:A
Data Anomaly Detection Method of Sensor Nodes in Internet of Things HUANG Hua (Qingyuan Vocational and Technical College,Qingyuan Guangdong 511510,China) ABSTRACT:Research the abnormality detection of the network nodes to improve the testing accuracy.Data collected from sensor nodes of network are random and different in format and storage form,thus it is hard for the nodes to fit each other.The traditional detection method cannot accurately suggest the uniform features to be detected according to different information,which leads to the low accuracy of the detection.To solve this problem,this paper proposed an algorithm based on the characteristics of the fuzzy clustering probability searching.By caculating the probability of the fuzzy characteristics between node data and abnormal data,we can determine the illegal node data with the application of the fuzzy probability factors. KEYWORDS:Internet of Things;Node data;Contact probability
1 引言 现代的物联网应用中。传感网络技术得到了长足的发 展,数据的传递也变得十分地快速、便捷,与传统的互联网不 同。物联网络连接的是与生活息息相关的外界环境,传递的 是一些设备仪器采集到的外界信息,这些功能给人们的生产 和生活都带来了极大的便利l1]。与此同时,各种有害信息也 给物联网中的传感网络带来了极大的威胁,这些有害信息如 果大范围传递,会对物联网络终端的各种设备带来很大威 胁。为了避免上述问题带来的危害,针对物联网的传感网络 安全防范技术已经成为这个领域研究的核心问题。学者们 希望能够利用一种有效方式,自动识别物联网的传感网络中 的异常节点,避免异常数据给物联网中的传感网络带来的威 胁 。 与互联网中检测方法不同,物联网中多是以传感器网络 为基础的,采集到的外界信息有较强的随机性。使用传统方
收稿日期:2011—10—06修回日期:2011—11—03
式进行物联网络安全检查.需要利用有规律的配准算法、通 过配准过滤算法等对物联网传感网络中的节点数据异常情 况进行检测。这些方法必须建立在节点数据异常特征能够 被准确描述的基础上,但是与互联网不同的是,在物联网中. 传感网络中传递的数据具有很强的随机性,数据格式、内容 等特征存在很大的差异,因此,很难像互联网一样,建立统一 特征对物联网中的数据特征进行有效描述[3 1。当传感网 络中的数据区别较大的情况下,检测方法无法建立统一的检 测特征,会造成传统方法无法检测出传感数据的异常,获取 结果的漏检率非常高_6]。所以,完整检测出物联网传感网络 中的数据异常信息,是保证物联网传感网络安全的基础。 为了避免使用传统方式进行物联传感网络节点数据异 常检测的缺陷.提出了一种基于特征模糊聚类概率搜索的节 点数据异常检测算法。通过建立数学模型。进行节点数据和 异常数据相关性概率计算.获取异常节点数据之间的相关 性,通过衡量标准进行对比分析,确定这种节点数据是否存 在异常情况_7]。实验证明。本文提出的方式能够对物联网中 传感网络异常数据进行准确检测,取得了让人满意的效果。
一1 59— 2物联网节点检测原理 物联网络与传统的互联网络不同,最主要的区别就是其 传递的信息是外界采集的不规则的、有差异的数据信息,物 联网多依靠由传感器组成的传感网络为主。物联网传感网 络中的节点数据异常检测.也叫做物联网传感网络节点数据 验证检测,这种检测方式是将物联网传感网络中节点数据, 与正常节点数据进行对比,根据配准结果实现对节点数据异 常的检测l8-9 3。具体方法如下所述: 首先建立物联网络中异常节点数据数学模型,选择节点 数据特性,设为z(Y,z)。 利用上面建立的模型,对物联网传感网络节点数据与正 常节点数据进行对比分析,利用式(1)提取出疑似非法节点 数据特征,将其作为检测对象,方法如下: f(Z(y,z)+T)/logT≥0.5 提取 为检测对象,1、 【(Z(Y, )+T)/logT<0.5不提取 为检测对象。。 通过上面阐述的方法提取节点检测对象是T=(T , , ,…, ),其中 代表第 个节点数据,s是待检测节点数据 的数量。 将获取的待测对象集合与数据库中的节点数据进行对 比。利用式(2)能够锁定物联网传感网络中的异常节点数 据: s E(z)=sinx/ logT (2) J:2 将物联网传感网络中的异常数据 (z)与标准节点进行 对比分析,从而得知这个检测对象中是否包含异常数据: fE(z) tx节点数据异常 , 【E(1)< 节点数据正常 一 通过以上检测原理可以看出,传统的检测方法是建立在 对网络节点数据的特征提取基础上进行的.需要提取网络数 据中同一特征建立标准节点特征进行检测,但是在物联网路 中,传感器采集到的信息存在很大的随机性和非线性,不同 传感节点之间采集到的数据存在着很大的差异,很难建立统 一的特征¨l 。这就造成,式(1)中很难提取出一个统一的特 征对异常节点数据进行有效的描述,导致式(2)锁定节点不 准确,最终导致式(3)无法做出准确的判断。导致从物联网 传感网络中数据异常检测的准确率越低的问题。 为了避免传统检测方式的上述缺陷,提出了一种基于特 征模糊聚类概率搜索的节点数据异常检测算法,通过计算节 点数据与异常数据之间的相关性,运用模糊概率因素确定非 法节点数据。避免了传统检测方式过于依赖节点中单一样 本特征的缺陷,准确检测出物联网传感网络中的异常数据, 为快速、完整地过滤物联网传感网络中的异常数据奠定了良 好的基础。 3 特征模糊聚类概率检测 3.1 异常节点数据搜索 与传统的互联网络不同.物联网的异常节点检测多是建 一160一 立在传感器采集回的差异信息基础上的。很难像互联网一 样,建立统一的传递模型。在对物联网传感网络中的异常数 据进行检测时,最重要的步骤是计算节点数据与异常数据之 间的特征模糊聚类概率。需要建立一个数学模型描述这种 特征模糊聚类概率。这个模型中包括n个待测节点数据和P 条相关性较大的数据,建立一个大小是n×P的矩阵,用C… ={Cik)…描述。矩阵中的每个点都代表节点数据特性,每 列都代表有一定相关性的数据特性。
C = (4) 为了获取节点数据与异常数据之间的联系.减少运算步 骤,缩短运算时间,需要对矩阵进行降维处理。 C…=( + )/X, (5) 其中,n代表矩阵中的样本数量,P代表有一定相关性数 据的样本数量,通过式(6)能够得到: U=,(Pl,P2,…,P ),s>max(n,P) (6) 其中,P 代表矩阵相关性系数。 对矩阵进行降维处理,能够得到式(7): Cf=(W +P,+W )/2 (7) 如果在满足上述条件的情况下,1无限接近于rank(B), 则c 与C…无限接近。假设对矩阵进行降维处理,则在矩阵 中,选取物联网传感网络中的待测节点数据,则可以得到与 其相关的节点数据,从而过滤与其无关的节点数据,提高了 过滤异常数据的效率。根据上面阐述的方法,可以准确选取 异常数据的特性,得到节点数据与异常数据之间的特征模糊 聚类概率,从而提高了异常数据检测效率。 3.2 特征模糊聚类概率的计算 与互联网的直接检测法不同,在获取物联网传感网络中 的异常数据后,需要计算节点数据与异常数据之间的特征模 糊聚类概率,从而确定这些数据是否属于异常数据。具体步 骤如下: 使用传统方式进行物联网传感网络节点数据异常检测, 忽略了节点数据与异常数据之间的联系,获取的检测结果准 确率较低,因此提出了节点数据与异常数据之间的特征模糊 聚类概率计算方式提高检测准确率:假设P代表异常数据数 目,e 代表第k个扫描节点,如果这些异常数据能够按照其相 关性分为L类,其特性是(W ,W ……W ),n是待测异常数 据数目,e (w W ,…..,Wh)代表节点数据,因此,e : (W W ,…..,Wh)代表物联网传感网络中全部待测节点 数据。这种检测方法需要将节点数据e 按照不同的特性进 行分类,分为异常数据和节点数据两类。确定物联网传感网 络中的节点数据是否是异常数据的时候,需要利用式(8)计 算节点数据与异常数据之间的特征模糊聚类概率: Q( )=q(,^)q(fl+ )/q(c,) (8) 其中,k:1,2,…,P。