当前位置:文档之家› 多核平台上遥感图像并行处理性能的初步实验研究

多核平台上遥感图像并行处理性能的初步实验研究

自动配准
名公布中,超级计算机用户,『F以他们所能做到的 最快速度向双核半台转移。,双核芯片现在是主流处 理器架构,在仅仅6个月的时间里,榜单上采用 英特尔Woodcrest芯片计算机数量便由31台攀升
到了205台。
遥感图像处理是典型的数据密集型并行应用, 目前有很多关于遥感图像处理算法在集群半台上
的研究1作。但如何在多核平台上来提高计算的效
P I
X川nrI'M1
t:11I
j{f制眦杼器川,㈦I梭)个数:
|I=受总数:
16 (h1
n一:
,M线F,’址舟刖。1l:
蛳制眦杼器l~仃数M洲mn胪…S
蛳制服箭器仃储f【}、…agP
交换l叫络 系统软件信息System 操作系统:()‘:
Software
H,】{n J)I{Ij(.(. 76【,SA【'A
[至匦互巫]
r—————?———————]

兰型!!!竺竺竺竺

r—?————————]

I. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 一
图1 自动配准筒‘法流程罔
3.2
【冬【像重采样
自动配准算法并行实现方式 配准算法采用数据并行的方式,编程模式采用
主从模式,利用MPI[11进行消息和数据传递。
4试验
4.1试验环境 单核系服务器统软硬件信息
系统硬件信息System (.m奖’删
Hardware lnfrnmation IntPl(I{l 3 00{,Hz
3自动配准算法
Байду номын сангаас

nI

多核系服务器统软硬件信息
系统硬件信息System tⅢI炎’W
Harrlware Information
比较。 从计算时间上来看,相同nD处理相同数据量
X㈨11…1(.I,【
I・7310@
111I。Iml
l 60【,Hz
的情况下,多核架构比单核架构最快的时候快了5 倍多。但是在单核环境下,所获得的加速比都比多 核情况下高。在两种半台上都能获得超线性加速 比,与算法的特点和实现有关系。
f4钏暇箭器(Ⅲl/4核】个数:
核总数: 趔线袱址仃仆们.
16
f4钏暇箭器山仆数.
f4f圳£务器“f晰jI}. 交换削r* 系统软件信息System 操作系统. 内核: MPI(:H版小: …,【版水: ⅥKl数、.叫乍:
1“, 146【,^^、
表2单核环境(cluster)下的测试结果
1000M以凡I叫
试的算法描述参见”】。
3.1
自动配准算法实现 以多光谱图像任意一个波段为配准参考波段,
在参考波段上均匀选择若干控制点,以每个控制点 为种子点,在参考波段和待配准波段上列应提取一 定大小的匹配窗口,然后住亚像元级对两个对应匹 配窗口进行匹配,寻找控制点在待匹配图像中列席 的同名控制点。同名控制点选取卅来后利用MQ 几何校『F模型建立参考图像与待配准图像之间的 映射关系,选择一种重采样方法(比如三次卷积内 插法)完成像元灰度值重采样。:流程图如图1所示:
Software Information I{P{lHnI【lni【x 2 4 6 55 A‘4 0【15h641 Speedup IjI、j11l ldeal M11】【,Hl l 0 014 time
rs)
10 0l
从表中可以看出,两种环境下的计算能力和内 存总量基本相同。

2测试结果
表1
Np
多核环境下的测试结果
自动配准算法综合利用互信息、遗传算法和 MQ几何校正模型进行多光谱图像的自动配准。在 算法中,以互信息作为配准的相似件度量,获得了 很高的配准精度;利用遗传算法的快速搜索特性, 可以较快的完成搜索并获得整体的最优解;利用 MQ几何模型可以精确的建立罔像之间的几何关 系。,试验表明该算法对于多光谱图像波段间非线性 几何关系,能够取得非常高的波段间自动配准精 度,整体配准误差在一个像元以内。本算法已经应 用到通用高性能遥感I J_星地面预处理系统((;H
多核平台卜遥感图像并行处理性能的初步实验研究
度重视、在同一个处理器中放置多个内核是一种切 实可行的技术,能够充分利用现有的单内核处理器 的架构优势。 多核处理器可在不改变基础设施情况下,提高 数掂中心的生产率,服务器的整合将会变得更加经 济,凶为更少的主机可以处理更多的1作负担、多 核处理器在性价比、功效和可扩展性方面具有极大 的优势在性能之外,多核处理器将极大地加强虚 拟功能和安全性现在,IT经理正在利用虚拟技 术在处理器级别分配任务,从而大幅度提高IT系 统的处理能力的实际可用性、利用多核处理器,这 种分配可以在不降低系统总体性能的情况下进行, 并将可信任的应用从不可信任的应用中抽离卅来。 多核处理器带来的是真真切切的客户利益和 价值,多核处理器标志着处理器设计的一个自然进 化过程,在软件具有支持能力的时候将性能大幅度 提升,并且将功能增强到单核处理器所无法企及的 一个水平。正是凶为这些实实在在的利益,多核处 理器无疑将成为服务器的一个重要发展趋势。 总而言之,基于双核x86处理器服务器半台使 海量数据处理、大规模网络应用、复杂科学计算及 大型图形建模为特征的企业级或行业关键应用领 域,在处理能力、扩展件,稳定性、可靠性、易管 理性等方面实现更大突破。:超大容量内存访问已经 迎刃而解,64位的内存寻址完全能够满足未来的 计算需求;而且在处理器内部集成了内存控制器和 超传输技术,使得内存带宽和I/O带宽可以线性 增长,解决了CPU的共享内存等资源的瓶颈问题。
广—————————j7一
得很快的计算速度,但是获得的加速比和效率却并 不理想。:但是从实用的角度说,多核架构能够节省 更多的空间且耗电量低。
参考文献 1]http://www 2]
intel(,onl
张林波、迟学斌、莫!lI|』尧、李若,并行计算导论 版R期:2006年7月
【3]
马广彬,章文毅等,一种新的卫旱多光谱图像自动配 准算法遥感技术与应用,2007年ol期
hh Lme旷r=
1000M以止叫
lnfimnatlon
(.fnI()S 4 1 6 9 5 0 3 6 FI、n¨1
内核…K"l:
M¨t:H版4x:Ml’J(.H、H、i…1: 川’I版本:…’【、H…¨1:
M J’¨.HI 2

J,11)
S)中,取得了令人满意的配准结果。本文所测
Mkl数刊乍:MKI
2008年伞围高性能计算学术年会
多核平台上遥感图像并行处理性能的初步实验研究
王建李国庆马艳
(中国学院对地观测与数字地球科学中心) (jwang@rsgs
aC
cn)
摘要:以双核、四核处理器为代表的多核计算平 台正在逐步成为服务器的主流架构,在这种架构下 传统的遥感图像并行处理算法的性能问题成为随 之而来的问题、本文通过在多核服务器平台和单核 架构的集群平台上对于并行卫星多光谱图像自动 配准算法进行比较研究和性能测试,来分析和说明 多核对高性能计算的影响, 关键词:多核遥感并行多光谱 任务
从技术层面来看,多核处理器,较之当前的单 核处理器,能带来更多的性能和生产力优势,【园而 最终将成为一种广泛普及的计算模式。向多核处理 器的迈进是一个重要的技术发展趋势。双核处理器 技术的引入是提高处理器性能另一个行之有效的 方法。凶为处理器实际性能是处理器在每个时钟周 期内所能处理器指令数的总量,凶此增加一个内 核,处理器每个时钟周期内可执行的单元数就将增 加一倍。 双核服务器:企业服务器的必由之路。计算机 处理器的设计在近20年来以一个常速住不断进化 发展。计算机持续向大众市场发展和扩散和我们提 出的要求都在不断推动着向更强大的处理器前进 的趋势。市场对更高性能处理器的要求与对更成熟 的软件应用程序的需求紧密相关。多核处理器有助 于突破当今单核技术的性能局限,为处理今后更先 进的软件提供足够的性能和能/J。 继在64位计算方面大获成功之后,多核处理 器技术领域创新,体现了IT产业对于帮助客户克 服挑战,为实现未来的可能件提供突破性技术的高
率,是一个全新课题本文以一个Ii星多光谱图像 自动配准算法为例,给m在两种架构下性能分析、

简介 2多核计算的特点
多核化趋势正在改变IT计算的面貌。跟传统
的单核CPU相比,多核CPU带来了更强的并行处 理能力、更高的计算密度和更低的时钟频率,并大 大减少了散热和功耗目前,在几大主要芯片厂商 的产品线中,双核、四核甚至八核CPU已经占据 了主要地位。:从技术上讲,多核技术的诞生,应当 源于对并行运算优势的理性认识,多核的确可以一 定程度提高程序的计算速度,但是也并不是核越多 越好,需要根据具体应用来客观分析和寻找规律。 多核处理器不同于SMP、MPP、DSM等多处 理器系统,它将多个计算内核集成在一个处理器硅 品元上,从而提高处理能力,特别是多任务能/J, 具有普通单核、单处理器技术所未有的性能优势, 目前已经成为提高处理器件能的主要途径,要发挥 多核处理器硬件的优势,需要从编译器技术、操作 系统及其它系统软件的架构上来加以发掘、多核处 理器的m现实际上是一次计算方式的革命,就像 SMP一样,针列多核处理器也必须使用多线程或 者多进程的并行处理形式才能够得到多核带来的 性能提升。 2007年6月底,全球高性能计算TOP500排
time!s J
Speedu
5结论
本文给卅了在一个在新型架构(多核)和单核 架构下的一个图象处理实例。从计算结果可以看 出,在np相同的时,虽然在多核架构下,可以获
p ldeal
=__—————了7一『:习 =1__——7一——[划 ![么二二二二二二二二
虽然在多核环境下,np=2个的情况下能够计 算m结果,但是为Yx,j比的方便,仍然从np=4
相关主题