当前位置:文档之家› 浅谈当今容错技术的发展

浅谈当今容错技术的发展

对于后台数据处理机
对可靠性要求极为苛刻 设计中应融和两种途径
• 系统节点的设计应当考虑部件级冗余设计 – 例如, 使用LockStep技术检测故障 – 使用检查点技术进行恢复
主要内容
HIT-MCRC
容错计算的新趋势 高性能容错计算机 移动计算环境下的容错计算 可信计算
移动计算
普适计算 穿戴计算 无线感知网
-40%
SUN
IBM
HP
Fujitsu
SGI
Others
销量(千台)
增长率(%)
图4:国内高端服务器市场销量市场占有率。
高性能容错计算机:HP的NON-STOP系统
“Shared Nothing” Design
Message based
To and from all entities
2-4096 CPUs
操作系统
• 开放的Linux有逐步取代UNIX的趋势,如IBM、HP、SUN、 SGI、BULL、Stratus等公司的服务器产品均支持LINUX,此 外,国产OS的推广在一定程度上也促进了国外操作系统逐步 开放的趋势,如过去封闭的Solaris已对外开放源码。
技术发展趋势
新技术的出现为容错计算系统发展提供了新的机遇
技术特征,具备很强的故障预测和错误恢复的能力 单服务器系统最大可支持32颗处理器。 可支持通用的AIX和Linux操作系统。 与IBM p系列类似,HP Superdome和SUN E2K等商用服务器
也普遍采用了容错技术,以提高系统的可靠性和可用性。
高端容错服务器特点
现有的容错系统特点 IBM:可靠,透明 HP:可扩展 NEC:面向小型服务器和客户端
可信计算理论的提出
• 容错技术不能满足新的计算模式的要求 • 要求计算机系统提供可信赖的计算服务,这种可信赖性是可以
验证的。
主要内容
HIT-MCRC
容错计算的新趋势 高性能容错计算机 移动计算环境下的容错计算 可信计算
高性能容错计算机
可以预测有强劲的发展动力
中国经济发展带动高性能计算机的发展 经费支持 提供高性能容错计算机的体系结构
技术发展趋势
开放结构和通用部件正成为容错计算系统 发展的主流
体系结构
• 从原来的紧耦合结构逐渐向松耦合结构转化,呈现出开放的趋势 • 以基于松耦合开放结构的双机冗余服务器和多机机群服务器系统,目
前应用广泛,发展势头良好
处理器
• 由于开放性、性能价格比等方面的优势,IA处理器增长迅猛, 有逐步取代RISC处理器的趋势
市场被国外厂商高度垄断。2006年国内 高性能服务器总销售额约96亿元,基本 被IBM、HP、SGI、SUN等国外高性能 服务器厂商垄断,其市场占有率达到 95.6%;
40
34.00
25.60 10.8%
30
23.50 8.0%
4.7%
3.7%
20%
2.0%
10%
20 2.1%
10
7.54
3.32
IBM p系列服务器
p系列不断吸纳容错机的设计思想 配备具有容错、纠错、自修复能力的部件, 系统具有源自大型主机的芯片、部件、封装方法、检错方法, 外围部
件的冗余设计, 内存的纠错能力,部件和整机的故障诊断机制,子系统在线修复部件
的能力, 比z系列更为简化的系统软件,类似LPAR的资源虚拟化管理技术等
8
30%
6
4
9.6% 10.2%
4.4% 2
6.3%
25%
20%
14.3% 9.2%
12.6%
11.5% 2.6%
8.2%
15%
4.8% 10% 5%
0
0%
制造 政府 教育 金融 电信 交通 能源 流通 科研 邮政 其它
2006年高端服务器销量(千台)
增长率(%)
图:高端服务器销量行业分布
需求迫切
HIT-MCRC
浅谈当今容错技术的发展
哈尔滨工业大学 计算机科学与技术学院
杨孝宗
HIT-MCRC
主要内容
HIT-MCRC
容错计算的新趋势 高性能容错计算机 移动计算环境下的容错计算 可信计算
容错计算的新趋势
容错计算已经在很多领域取得一定的成绩
芯片级、部件级、微小型计算机容错理论日渐成熟 微型机、航天、航空、舰船等专用微型容错机普遍应
2.04
0% -10%
0
-20%
SUN
IBM
HP
Fujitsu
SGI
Others
销售额(亿元)
增长率(%)
图3:国内高端服务器市场销售额市场占有率。
10
8.68
8
10.4% 6.42
24.4%
6
6.3%
4.12
4
2
7.0% 1.61
5.5% 0.85
4.4% 0.62
40% 20% 0% -20%
0

新的计算模式的发展,为容错提出了新的挑 战
容错ห้องสมุดไป่ตู้算的新趋势
容错计算的外延在拓展
容错体系结构的研究向更多领域扩展
高性能计算机 系统容错
银行 电信
能源 民航
芯片级容错 部件级容错 微小型计算机容错
容错 体系 结构
容灾 系统
网络系统 容错
航天 航空 军用
容错计算的内涵在深入
容错 计算
可信 计算
Transparent Access
Single system image
Peer-to-peer Synchronized
ServerNet® expansion
board
Managed
System-wide Load Balancing
Process Pairs for key components
多核处理器 系统虚拟化 刀片服务器
核心硬件部件对容错的直接支持,如安腾和 Xeon处理器的锁步执行支持、商用高速互连网 的链路冗余和动态路由,对高端容错计算系统的 发展也提供了很多的新机遇。
技术设想
高性能计算机容错技术的层次结构 可行的容错体系结构
容错技术的层次结构
容错技术的层次结构
NEC 公司与Stratus合作,推出了类似ftServer的 Express5800/ft系列容错服务器。
高性能容错计算机: IBM的s390/z900
IBM z系列服务器
z系列服务器是具有高可靠、高容错、高纠错能力的专用大型主机系 统。
z系列具有长期连续运行的高可靠容错能力。 z系列以实现自底向上的数据一致性保障、提供应用不间断运行环
ServerNet Y
SCSI SCSI SCSI
P M
SCSI SCSI SCSI
P M
Communications or external I/O
Communications or external I/O
ServerNet expansion
board
HP NonStop系列
包括两个子系列,即旧有专用的基于MIPS处理器的S系列和新扩展的基 于安腾处理器的Integrity系列。
可通过松耦合方式扩展至4080颗处理器。 可支持NonStop专用操作系统、HP OpenVMS、Microsoft Windows、
Linux等操作系统。
高性能容错计算机: STRATUS/NEC
Stratus ftServer系列
混合冗余容错结构 支持双模/三模灵活配置 软硬结合的容错技术
120
100
85.6
80
60
40 17.8
20
0 2004年
90.0 20.2
2005年
96.0 22.3
2006年
销售量(千台)
销售额(亿元人民币)
图1. 2006年高端服务器销量与销售额。
需求迫切
高端服务器主要应用于金融、电信、能 源、政府等关系到国计民生和国家战略安 全的重要领域。高端服务器市场客户对系 统高可用性有普遍明确的需求。
造成严重的损害,往往会产生巨大的经济损失,甚至直接 威胁到社会的安定和经济的正常运行。
需求迫切
国内近期的几个主要案例如下:
2006年4月20日上午10时56分,中国银联系统通信网络和系统主 机出现故障,造成辖内跨行交易全部中断8个多小时;
2005年6月7日银联系统POS机系统主机故障造成POS交易停顿2 个小时,由于上述系统故障,市民无法刷卡消费,银行间无法进 行跨行结帐,造成较大的直接和间接经济损失,严重影响了居民 的正常生活。
2006年10月10日,由于中国民航信息网络有限公司(简称“中航 信”)离港系统的主机出现技术故障,导致包括北京首都国际机场 等多个机场离港系统瘫痪,严重影响了北京、上海、广州等多个 大型机场的航班进出港,造成大量旅客滞留,造成了巨额的经济 损失,严重影响了交通运输秩序。
需求迫切
国内金融、电信、能源、国防、政府等领域,由于需要高 性能高可靠的服务器系统,又由于国内没有合适的替代产 品,所以在过去一直采用进口的高端服务器。根据CCID 2006年服务器市场调研报告数据显示,中国2006年的 高端服务器市场的市场规模达到96亿元人民币,销售量 达到22300台,销售额增长率达到10.4%。
Immediate Failover Context preserved No Outages
Lockstep CPUs Lockstep CPUs
Memory
Memory
ServerNet Transfer Engine
相关主题