第八章容错技术详解
部件故障检测
比较策略
多数投票 均值 中值 ……
部件故障检测
决策判断实例
A1
`
B1
`
C1
`
A4
A0
A2
B4
B0
B2
C4
C0 C3
C2
A3
(a) 正常感应器 (b)
B3
` 故障传感器 (c)
O n log n
部件故障检测
加权中值判断结果
加权后的理论识别率(邻居数为4)
O n log n
内容提要
1. 2. 3. 4. 5.
概述
故障模型
故障检测
故障修复
可靠性协议
可靠性协议
物理层
链路层 网络层
传输层
可靠性协议
物理层 物理层是实现无线网络通信的基石, 其可靠性能的优劣直接影响到整个系统 的容错能力。物理层主要负责数据的编 码调制、解调解码、发送与接收。对于 无线传感器网络节点间的通信,为了使 得数据能够被可靠地传输或接收,必须 要做到高的接收机灵敏度、低的背景噪 声及较强的抗干扰能力。
可靠性协议
传输层
事件汇聚到Sink
可靠性协议
传输层 ---- 从汇聚节点到传感节点的传输 PSFQ(Pump Slowly, Fetch Quickly)为 无线传感器网络的重编程或重新指定任务提供 了可靠传输,并提供了到接收端延迟保证。源 节点低速向网络注入数据包以避免网络拥塞, 接收节点有足够的时间来检测这些数据包是否 丢失,假如发生丢失就请求重传。当节点收到 的包序号不等于上一个包序号加1,那么就认为 有包丢失。这个节点在收到正确的包之前停止 继续发送包。
三连通图
故障修复
基于连接的修复 ----部署k连通拓扑
在完全图中找最小代价的K连通子图的算法 集中式 FGSSk 分布式 FLSSk
集中式 FGSSk 基本思路:把网络模型化一个图,节点是图 中的点,存在直接通信连接的节点间做一条边, 节点间的距离作为这条边的权重。 步骤:1、按权重对所有边排序; 2、根据该边两个端点是否有K条路径连通 按照权重由大到小考虑是否加入生成子图; 3、判断所有节点是否都达到K连通,不是 则重复第2步。
可靠性协议
传输层 ----
从汇聚节点到传感节点的传输
PSFQ重传机制
总结
容错技术的概念及其重要性 故障类型、故障检测与诊断、故障修复 设计容错技术时网络各层的考虑
部件
故障节点能够正 常通信,但是测 量数据是错误的 故障节点不能与 其它节点进行通 信
检测出错误的测 量数据
舍 弃 或 校 正 出错 的测量数据
节点
通过询问或重新 路由等方法检测 故障节点
通 过 移 动 冗 余节 点 弥 补 形 成 的连 接和覆盖问题
故障模型
传感部件故障 固定故障 偏移故障 倍数故障 方差下降故障
概述
以往容错研究关注的领域: 大规模集成电路 分布式系统 数据库 互联网 ……
概述
容错方面的术语: 故障(Fault) 差错(Error) 失效(Failure) 可靠性(Dependability) ……
概述
WSN容错的重要性: 技术和实现因素。通常需要直接暴露在环境 中,在受到成本和能量限制的同时,需要完 成一系列的任务。 无线传感器网络是一个新兴的研究和工程领 域,处理特定问题的最优方法还不明确。 无线传感器网络的应用模式。无线传感器网 络通常是运行在无人干预模式,它们需要具 有更强的容错能力。
可靠性协议
网络层
建立局部多路径
可靠性协议
网络层
定向洪泛
Sender
A
B
Sink Node
Virtual Aperture
可靠性协议
无线传感器网络的传输层需要提供可靠 的、低延迟、能量有效的、公平的信息 传输。为了达到这些要求,它需要解决 信道损耗、干扰、带宽有限、突发通信、 节点资源受限等问题。分布式的跳与跳 的传输层机制来提供传输的可靠性。
故障修复
基于连接的修复 ----非k连通拓扑
重新路由
故障修复
基于连接的修复 ----选择容错节点
Sk可作为S3的容错节点
s3
s1
s2
Sk
故障修复
基于覆盖的修复
定义 计算方法
名称
覆盖区域
移动区域
节点单独覆盖的 整个感知区域去掉与其它 区域 节点重叠的感知区域
有效节点移动到 以遗漏区域的边界为圆心, 该区域即可重新 节点感知半径为半径作圆 覆盖漏掉的区域 所形成的所有区域
节点故障检测
集中式故障检测
汇聚节点做出的判断
描述 用来识别事件的信息
事件名
节点丢失
孤立节点 路由改变
节点没有出现在任何节点的邻居列表中
节点没有任何邻居 比较当前路由表与上次路由表的变化
所有邻居表
此节点的邻居表 此节点的路由表信息
邻居表改变
链路质量改 变
比较当前路由表与上次的邻居表的变化
此节点的邻居表
基于覆盖的修复 (保证区域覆盖)
故障修复
基于连接的修复 ----部署k连通拓扑
V7失效会导致网络断开成三部分
基于连接的修复 ----部署k连通拓扑
K连通网络:网络中任意两点之间 都至少有K条不相交的路径,K连通网 络中任意K-1个节点发生故障时网络仍 然保持连通。
故障修复
基于连接的修复 ----部署k连通拓扑
《无线传感器网络技术》讲义
第八章、容错设计技术
内容提要
1. 2.
概述 故障模型
3.
4. 5.
故障检测
故障修复 可靠性协议
容错是系统在运行过程中发生一定的硬 件故障或软件错误时,仍能保持正常工 作而不影响正确结果的一种性能或措施。 容错是采用冗余方法来消除故障影响的。
● 硬件冗余: 以检测或屏蔽故障为目的而增加一定硬件设备的方法。 ● 软件冗余:为了检测或屏蔽软件中的差错而增加一些在正常运行时所不 需要的软件方法。 ● 信息冗余:在实现正常功能所需要的信息外,在添加一些信息,以保证 运行结果正确性的方法。纠错码就是信息冗余例子。 ● 时间冗余:使用附加一定时间的方法来完成系统功能。这些附加的时间 主要用在故障检测、复执或故障屏蔽上。
此节点与邻居的链路质量低于统计定义的门 此节点的邻居表 槛值。把当前的和以前的链接质量写入日志。
节点故障检测
分布式故障检测 由每个节点自行检测。节点发现数据 下降后,询问子节点,如果得到肯定答 复则继续询问下去,如果遇到否定回答, 则这个父节点触发诊断程序,把诊断到 的原因和可能的补救措施发往基站以写 入日志。
分布式FLSSk 由信息收集、拓扑构造、决定传输 能量三个阶段组成。
信息收集:节点广播ID并收集周围节点信 息; 拓扑构造:使用FGSSk算法,每个节点生 成一个K连通子图; 决定传输能量:去掉单向边或者加强为双 向边改进生成的连通图
故障修复
基于连接的修复 ----非k连通拓扑
基站收不到某些节点的消息
实施步骤:
构造——得到所有变量的联合概率分布
学习——通过训练得到各变量间的条件概率 推理——由一些已知属性值推断位置变量的 概率分布。
部件故障检测
基于贝叶斯网络----以大鸭岛试验为例
部件故障检测
基于贝叶斯网络----以大鸭岛试验为例
温度、电压的概率分布
部件故障检测
基于贝叶斯网络----以大鸭岛试验为例
概述
大鸭岛试验结果
概述----一个容错实例
用声音、高度两个特征区分一间办公室 的六个人
内容提要
1. 2. 3. 4. 5.
概述
故障模型
故障检测
故障修复
可靠性协议
故障模型
部件故障
传感、供电、通信等部件发生故障,测量值 偏离了实际值
节点故障
节点无法连上网络
故障模型
故障级别 故障表征 故障检测 修复机制
否 并发冲突? 发送队列满?
否 并发冲突?
否
..
是 隐藏终端
是 网络拥塞
是 非对称链路
使能RTS/CTS
减低发送速率
修改路由表
每个节点判断的算法
内容提要
1. 2. 3. 4. 5.
概述
故障模型
故障检测
故障修复
可靠性协议
故障修复
基于连接的修复 (保证连接的通畅)
部署k连通拓扑 非k连通图
气压、相对湿度的条件概率分布
部件故障检测
基于贝叶斯网络----以大鸭岛试验为例
计算推理
节点故障检测
集中式故障检测
在Sink节点放置检测程序,实时监测网络 状态,根据节点上报的信息判断发生了什 么事件。
汇聚节点收集的信息
名称 邻居列表 链路质量 字节数 下一跳 路径丢失 描述 由邻居ID号组成的一个列表 用0(100%丢失)至100(100%传送)间的一个 数来表示 节点传输和收到的字节数 路由的下一跳节点(路由表) 从节点到 Sink 节点的链接质量的一种衡量(路由 表)
部件故障检测
加权中值判断结果
加权后的理论误报率(邻居数为4)
O n log n