数据库原理与应用 第10章
(5) 微型计算机的开发工具比并行计算机的专用解决方面 要成熟得 构建并行计算环境。
(6) 微型计算机机群比高性能专用计算机平台更便宜而且 更易于获得。
(7) 通过增加内存和处理器,增加节点的性能,很容易扩 展计算机机群的性能。
10.1.2 计算机机群及其体系结构 机群是一种并行或分布式处理系统,由很多连接在一起的
机群是一群以计算机网络技术互连起来的高性能计算机或 PC机的集合。机群工作时像一个统一的整合资源,所有节点 (连接在机群上的单个计算机)使用单一界面。
在支持并行计算方面,计算机机群和MPP机相比具备如下 特点:
(1) 单个计算机越来越强大。按照摩尔定律,微型处理器 的性能每隔18个月就会提高1倍,这是已经持续多年的处理器 的发展规律,这一直带动微型计算机快速发展。最近,多核技 术的产生和普及应用,使得微处理器的发展越来越快,业界已 经推出具有80核心的微处理器。具有数百核心的流处理器的浮 点计算性能已经达到1TFloaps,而它们的成本却非常低廉。
根据人们对计算能力需求的不同,可以将计算分为两个发 展时代:串行计算时代和并行计算时代。随着人们对高性能计 算和处理资源的需求,并行应用时代的到来已经势不可挡。在 20世纪80年代,人们认为计算机性能的提高主要是由于生产出 了更快更有效的处理器。随着时间的推移这种观点受到了并行 处理概念的挑战:并行计算就是将两台或多台计算机连接起来, 协同地解决计算问题。从20世纪90年代以来,昂贵而特制的并 行超级计算机向高性能微型计算机网络转换的趋势越来越强。 商品化的高性能微型计算机和网络部件为这种转换的提供了廉 价的硬件基础。新技术的发展使计算机(PC机或高性能微型计 算机)网络环境成为并行处理的理想工具,从而导致了低价商 品化超级计算机的出现。如今,基于计算机机群的并行计算装 置已经成为当今高性能计算设备的主流,世界排名前500的超 级计算机中大多基于计算机机群技术。
图10.1展示了具有4个计算节点的计算机机群,每个计算机 节点包括本机通信系统(通信设备、协议及通信软件)、本机系 统软件(操作系统)、本机应用系统(数据库支持、ODBC);每个
计算机节点可以独立支持传统的串行计算。所有计算节点通过 高速网络通信系统连接在一起,高速网络通信系统由通信介质、 网络交换设备、路由设备、终端通信设备、通信协议以及通信 软件构成。
(2) 随着新的网络技术和通信协议在LAN上的广泛使用, 连接机群的高性能计算机间的网络带宽正在增加,延迟正在减 小。因而通信瓶颈问题逐步得到改善。
(3) 高性能微型计算机机群比专用的并行计算机更容易地 与现有的网络整合起来。
(4) 一般说来,用户对个人微型计算机的使用率是较低的, 因此可以挖掘节点的空闲资源进行并行计算。这是一种获取高 性能计算资源的可行手段。
10.1 计算机机群概述
10.1.1 可扩展的并行计算体系结构 计算机业是发展最快的行业之一,这归功于计算机硬件和
软件技术的快速发展。硬件技术的发展体现在芯片设计和制作 工艺的快速发展。当今,芯片制作工艺已经达到45纳米或更精 细,多核心技术的引进使微处理器性能的发展令人惊叹不已。 各种高带宽低延迟的互联网络技术的广泛应用,为基于网络的 计算结构奠定了基础。软件技术也有很大的发展,成熟的软件, 如操作系统、编程语言、算法和开发工具等都可得到,新型的 软件开发技术,如网络计算技术、中间件技术、网格技术在科 学、工程和商业领域得到了长足的发展。
构成计算机机群的一些重要部件如下所列。 1.计算节点部件 (1) 多个高性能计算机(PC、工作站或SMP)。 (2) 网络接口卡(NIC)。 (3) 支持机群计算的操作系统(分层或基于微内核)。目前常 用的操作系统包括Unix、Linux、Windows NT、Windows Server系列等。
并行数据库系统以高性能、高可用性和高扩充性为目标,充分 利用多处理器平台的工作能力,多个处理机协同处理,以达到 更快的数据库响应速度和分析能力。在很多情况下,并行数据库 的数据分布在多个处理机中并共同组成一个完整的数据库系统。
并行数据库需要有效的硬件支持平台才能发挥其性能,这 些硬件平台可以是昂贵的MPP并行计算机,也可以是支持多处 理器的小型计算机,更可以是由多个微型计算机(或PC服务器) 构建的计算机机群。所谓计算机机群就是利用高速计算机网络 把若干个同构或异构的计算机连接起来,通过配置在机群上的 中间件系统、通信系统、管理系统以及其上的应用系统来支持 大规模的数据计算和处理能力的计算装置。同样,可以把并行 数据库系统配置到计算机机群上构建机群数据库系统,以便支 持大规模数据并发处理能力。
第10章 机群数据库
10.1 计算机机群概述 10.2 机群数据库 10.3 Oracle机群数据库简介 10.4 应用实例 习题
随着信息技术的迅速发展和Internet技术应用的日益普及, 信息爆炸带来了海量数据,数据库系统所要处理的数据也从 MB级达到TB级甚至PB级。另一方面,实时在线应用已经深 入到社会工作和人们生活的各个角落,这些应用如电子商务、 门户网站、搜索引擎、网络游戏、网络视频服务等,不仅需要 海量的存储装置,更需要大规模并发响应能力,即支持和处理 来自Internet的成千上万用户瞬间、突发、峰值访问的能力。 传统的数据库系统中进行某种查询有的时候要运行很长的时间, 这不能满足瞬息万变的网络应用的需求。这些新的要求对传统 的数据库技术提出了挑战。数据量呈爆炸增长,而单个计算机 的处理速度是有极限的,即使是超级计算机的计算资源也会显 得力不从心。并行处理成为数据库继续发展的必然趋势。
独立计算机组成,像一个单独集成的计算资源一样协同工作。 计算机节点可以是一个单处理器或多处理器的系统(PC机、
高性能计算机或PC服务器),其拥有独立的CPU、内存、I/O设 备和操作系统。节点可以是在一起的,也可以是物理上分散而 通过LAN连接在一起的。这样的系统可以提供一种合理的性能 价格比,并可根据需求来构建合适的计算装置。典型的机群系 统的体系结构如图10.1所示。