当前位置:
文档之家› 第八章 可测性设计技术与故障容错设计技术的融合研究
第八章 可测性设计技术与故障容错设计技术的融合研究
> 目前大量舰船导航系统并未有效考虑故障的故障检测与处理 进而使相关系统出现故障后,基本无法继续正常运行。
2016年3月20日
2
一、传统提高复杂对象可靠性的途径
1. 回顾:可靠性
复杂系统的可靠性是指: 其产品在规定的条件下和规定的时间内,完成规定功能的能力。
随着系统设备向结构复 杂化、功能多样化方向发展。 对其可靠性的要求也越来越 高。特别是军工、航天领域 的系统设备。一旦出现故障, 可能会导致严重的后果。 卫星在太空出现故障,如何 才能让卫星产生“自我意识”, 及能够自发解决故障的问题?
18
五、DFT与DFFT融合研究应用展望
1. 融合研究实例──容错扫描触发器
a. 容错扫描触发器的由来
> 随着纳米工艺的逐渐成熟,低电压技术开始在集成电路设计 中广泛得到使用。
* 低电压技术却增加了晶体管对辐射粒子的敏感性,在辐射环境中极 易发生软错误。 具有容错功能的扫描触发器就此提出,以满足电路可靠性的要求。
RHBD锁存器电路原理
20
五、DFT与DFFT融合研究应用展望
1. 融合研究实例──容错扫描触发器
d. 融合可测性设计和故障容错设计的容错扫描触发器产生
> 通过对扫描触发器结构复用而得到,既使芯片测试变得简易, 又能满足电路较高的可靠性要求。 e. 容错扫描触发器的应用 > 在大量复杂系统电路中可以将原有触发器替换成容错扫描触发 器,以提高复杂系统的可靠性。 > 基于目前大量复杂系统更趋向于数字化,容错扫描触发器的应 用前景是非常广阔的。
b.“可测性设计与故障容错设计进行融合”是一种有价值的新方法
> 这两种设计技术各自已有较为成熟的解决方案。
> 这两种设计技术同时融入于一个复杂系统理论上是可行的。
可测性设计与故障容错设计技术的融合 极有可能使复杂系统的可靠性提升到一个新的高度。 值得投入足够的财力与物理进行深入研究
9
三、DFT与DFFT融合研究不可避免
3
一、传统提高复杂对象可靠性的途径
2. 回顾:目前提高可靠性的主要方式
a. 故障隔离 > 故障隔离是为了把故障限制在局部,防止影响系统的其他部分。
* 通过故障隔离技术将产生故障的因素不传播到所在模块的错一般是采用冗余方法以消除故障影响。
* 主要有硬件冗余、软件冗余、时间冗余和信息冗余等。
* 航天技术的高速发展,低成本小卫星逐渐成为空间系统的重要组成。
为了提高空间系统的可靠性,保证卫星在发生故障时仍能顺利 完成既定任务,可测性设计和容错设计必然可以大有作为。
23
五、DFT与DFFT融合研究应用展望
2. 融合研究可应用前景展望
c. 组合导航领域中的应用与应对 > 舰船在航行、操纵、定位、避碰等方面所遇到的自动化和系 统化新课题,急盼新颖的组合导航技术来实现与改善。
1. 两种设计融合研究必要性
a. 有效提高复杂系统(对象)的可靠性
> 可测性设计的引入
* 将使复杂系统具备高测量精度、高测试覆盖率等优点,同时也可改善 传统测试成本高、资源浪费、维护和操作不便等问题。
> 故障容错设计的引入
* 将运用冗余技术为复杂系统提供部件(模块)的容错功能,以屏蔽故 障产生的影响,使系统保持正常运行。
学者提出的一个重大挑战。
7
二、DFT与DFFT融合研究的迫切性
1. 现有的可靠性研究是否已经足够了?
d. 从电子商务的角度来看
> 在网络电子商务时代,企业的关键计算业务要求能够 365天,每 天24小时不停运转。如发生宕机,则将会导致重大损失。
* 著名电子交易网站的一次宕机故障,将使其销售业务平 均每分钟损失25,000美元。
b. 从智能电表的角度来看
* 能否保证几亿个智能 电表的可靠性?
* 能否定量评估外界各
种因素对智能电表可 靠性的影响? * 能否在智能电表出现 故障时,及时自我检
随着国家电网公司智能电网 思路的提出,智能电表开始走向
测,并自我容错?
千家万户。
将国家损失降到到最低 !
6
二、DFT与DFFT融合研究的迫切性
2. 两种设计融合研究的意义
使复杂系统同时具备故障检测与故障恢复的功能,能够最 大化地提高复杂系统的可靠性,产生“1+1>2”的效果。
尤其是避 免与减少 灾难性事 故的发生。
防止故障 和事故发 生。
降低产品 的总费用。
增加产品前 期费用, 降低产品后 期费用。
减少停机 时间,提 高产品的 可用率。
提高产品
* 除直接经济损失外,关键业务的宕机可能还会导致企业客户群流失、 信誉降低、股票下跌、竞争力下降等其它更为严重的问题。
8
二、DFT与DFFT融合研究的迫切性
2. 新的方法“蓄势待发”
a. 继续寻找新的方法
从诸多由可靠性不足而引发的案例来看,当前对复杂系 统的可靠性研究还存在不足,因此还需要寻找提高复杂系统 可靠性的新方式。
* 其关键可靠性指标达到5~9个或更多。
* 对于竞争无比激烈的智能手机行业来说,一旦发生故障,会引起客户 严重的不满。理论上是不允许的。 * 但是,当前智能手机产品仍时不时会发生卡机,死机等状况。
可靠性以成为 智能手机生命 力的代名词。
5
二、DFT与DFFT融合研究的迫切性
1. 现有的可靠性研究是否已经足够了?
“性价比”
> 对于复杂系统产品来说,不仅要保证产品的可用性,更要满足 规定的产品性能指标。
* 通常情况下,提高系统性能和增加系统可靠性是相互矛盾的目标。
b. DFT与DFFT的引入,会对系统性能指标造成较大的影响 > 复杂系统产品性能因素已成为制约DFT与DFFT技术应用的关 键问题。
> 在确保系统总体性能不变情况下,进行DFT与DFFT融合研究。
17
四、DFT与DFFT融合研究将遭遇的主要问题
4. DFT与DFFT融合研究主要问题小结
针对这两种设计融合研究产生的 主要问题,在进行复杂系统设计时, 需要采用合适的技术,对系统可靠性、 性能指标和成本核算等诸方面作一个
全面的评估和平衡。
综合考虑,目前可采用可测性设计和故障容错设计技术融合的领 域还是在国防军事、航空航天、人造卫星、银行储蓄以及其他对可靠 性有着特别要求的情况中。 随着相关技术研究的深入与进步,其应用领域必将全面拓展!
b. 扫描路径法完善触发器电路的可测性设计 > 扫描路径法是一种非常重要的时序电路可测性设计方法。
* 将容错扫描触发器组成扫描链,以获得电路的可控性和可观性。
19
五、DFT与DFFT融合研究应用展望
1. 融合研究实例──容错扫描触发器
c. 冗余设计完善触发器电路的容错设计
> 触发器常见的加固技术包括:
21
五、DFT与DFFT融合研究应用展望
2. 融合研究可应用前景展望
a. 核电领域中的应用与应对
* 1986.4.26日乌克兰切尔诺贝利核电厂发生爆炸。 * 大量放射性物质泄漏,15年内有6-8万人死亡。 * 方圆30公里地区的11.5万多民众被迫疏散。
> 针对核电站可靠性问题更要作一个充分完整的设计,而 DFT与 DFFT融合在复杂核电站系统中无疑是可行的一种方式。
> 在DFT与DFFT融合研究与实施过程中,可展开系统性能优化 设计方面的研究。
16
四、DFT与DFFT融合研究将遭遇的主要问题
3. 复杂系统产品功耗方面的问题
a. 以VLSI为代表的复杂系统产品,对功耗的要求更为苛刻
> 随着集成电路设计技术的迅猛发展,原先已经接近临界点的 功耗指标,再次由于DFT与DFFT的引入而告急。
产品总费用
前期费用
后期费用
> 虽然两种设计融合在一个复杂系统上,能够显著提升复杂系统 可靠性,但是其所增加的成本,也是需要重点考虑的关键问题。
* 两种设计相关成本问题将在第九章中着重介绍,这里不在赘述。
15
四、DFT与DFFT融合研究将遭遇的主要问题
2. 复杂系统产品性能方面的问题
a. 产品性能问题是技术发展的焦点
* 功耗的不断增加,不仅使芯片易于发热,更会致其工作失效与使用 寿命缩短。 * 降低功耗成为集成电路设计需要考虑的非常重要的技术问题。
b. 功耗问题不解决,DFT与DFFT融合也会受到极大的制约
> 在复杂系统融合可测性设计与故障容错设计的同时,也要融入 低功耗设计。
* 要避免盲目地一味追求系统的可靠性指标。
第八章 可测性设计技术与故障 容错设计技术的融合研究
上海大学 通信与信息工程学院 2016年03月 张金艺
2016年3月20日
1
提要
一、传统提高复杂对象可靠性的途径 二、DFT与DFFT融合研究的迫切性 三、DFT与DFFT融合研究不可避免 四、DFT与DFFT融合研究将遭遇的主要问题 五、DFT与DFFT融合研究应用展望
* 这将大大增加延缓故障容错实施的时间。
* 对一些可靠性要求特别高的复杂系统来说,越快检测到故障,就能越 快实施故障容错,同时也可以最大限度地减少故障所造成的损失。
可测性在故障容错系统设计中是一个非常重要的指标, 如果我法对某个系统进行测试,又如何知道其有故障呢?
11
三、DFT与DFFT融合研究不可避免
* 实践证明:若产品寿命周期为5年,产品开发周期 每延长6个月,利润将损失1/3。
14
四、DFT与DFFT融合研究将遭遇的主要问题
1. 开发周期与成本方面的问题
b. 复杂系统产品前期费用显著增加
> 可测性设计和故障容错设计的融入,需要增加额外的软硬件, 这必然会增加产品的前期费用。
研发 制造 试验 销售 使用 维护