课程1:高性能计算发展概述
• 主要特点
– 计算能力vs计算规模 – 先导性研究vs工程应用 武器系统内埋式发射
CFD终极目标:虚拟飞行试验
设计经验 虚拟风洞(CFD)
风洞试验
虚拟飞行试验
计算设备/用户/内容
Today 2015
Source:IDF2012
大数据现象
• “Data are becoming the new raw material of business: an economic input almost on a par with capital and labor” —The Economist, 2010 • “Information will be the ‘oil of the 21st century” —Gartner,2010
并行处理是提高计算机处理性能的核心技术
体系结构的发展: 并行方法的探索
Greatest trend in VLSI generation is increase in parallelism
• 1970 - 1985:位级并行(bit level parallelism)
– 4-bit -> 8 bit -> 16-bit – slows after 32 bit – adoption of 64-bit now under way, 128-bit far (not performance issue)
/~jeff/ece4420/technology.pdf
单处理器的性能增长变化
• VAX: 25%/year 1978 to 1986 • RISC + x86: 52%/year 1986 to 2002 • RISC + x86: ??%/year 2002 to present
算技术最新方向。
– 主要包括:高性能处理机、多处理机系统;集群计算系统、Linux集群系统 配置方法,集群资源管理与作业调度,多线程编程及性能优化等; – 并行编程程序工具:OpenMP、MPI、CUDA、MapReduce等。
• 交流平台
– 2013年高性能计算课程qq群:158463721
ห้องสมุดไป่ตู้ 参考书目:
Source:IDF2012
计算机体系结构的发展
计算机体系结构的发展趋势
• 体系结构的改进将技术创新转变为计算机的处 理性能 • 计算机体系结构历史:
– 电子管、晶体管、集成电路、大规模集成电路
• 超大规模集成电路(Very Large Scale Integration) 的发展阶段可以看做为并行处理的探索过程
处理器功耗
风冷芯片最大功耗的瓶颈 发展的趋势不在提供时钟频率,而转变为每个芯片的CPU数量
Recent Intel Processors
Processors Pentium 4 Pentium M Core 2 Duo Core 2 Quad Core i7(Quad) Core i5(Quad) Pentium Dual-Core Core i3(Duo) 2nd Gen i3(Duo) 2nd Gen i5(Quad) 2nd Gen i7(Quad/Hexa) 3rd Gen i3(Duo) 3rd Gen i5(Quad) 3rd Gen i7(Quad/Hexa) Xeon E5(8-cores) Xeon Phi(60-cores) Year 2000 2003 2006 2006 2008 2009 2010 2010 2011 2011 2011 2012 2012 2012 2013 2013 Fabrication(nm) 180 90/130 65 65 45 45 45 32 32 32 32 22/32 22/32 22/32 22 22 Clock(GHz) 1.80-4.00 1.00-2.26 2.60-2.90 2.60-2.90 2.93-3.60 3.20-3.60 2.80-3.33 2.93-3.33 2.50-3.40 3.10-3.80 3.80-3.90 2.80-3.40 3.20-3.80 3.70-3.90 1.80-2.90 1.10 Power(W) 35-115 5-27 10-65 45-105 95-130 73-95 65-130 18-73 35-65 45-95 65-130 35-55 35-77 45-77 60-130 300
全球气候模拟
• 大气环流模拟
– – – – – – • • • 需求解Navier-Stokes方程 1分钟时间间隔100个浮点运算/网格点对计算的需求 为确保时效需1分钟执行5 x 1011 flops= 8 Gflop/s 以天为单位的7 天天气预报需要 56 Gflop/s 以月为单位的50年气候预测需要 4.8 Tflop/s 以12小时为单位的50年预测 288 Tflop/s 如果提高网格解析度则计算复杂性将呈8x,16x增加 更高的精确预测模型则需要综合考虑大气,海洋,冰川,陆地, 加上地球化学等因素 千年气候模型分析目前无法对此进行有效计算
• • John L.Hennessy, David A.Patterson,贾洪峰 (译者),《计算机体系结构:量化研 究方法(第5版)》 李静梅 (编者), 吴艳霞 (编者) ,《新一代计算机体系结构》
•
• • • • •
杨晓东,陆松,牟胜梅 著,《并行计算机体系结构技术与分析》,科学出 版社,2009年1月 刘鹏,《云计算(第二版)》,电子工业出版社,2011 年5月 曾宇 等著,《高效能计算机系统 -若干关键技术分析》,高等教育出版社, 2010年1月 张武生,薛巍,李建江,郑纬民编著,《MPI并行程序设计实例教程》,清华大学 出版社,2009 Michael J. Quinn著 陈文光, 武永卫等译,《MPI与OpenMP并行程序设计:C语言 版》,清华大学出版社,2004.10 /
高性能计算及应用
任课教师
王云岚 EMAIL : wangyl@
赵天海 EMAIL:zhaoth@
高性能计算研究与发展中心
办公室: 勇字楼3楼 电话:88493434(O)
2
课程目标
• 掌握高性能计算编程工具,解决相关问题 • 课程主要内容:
– 介绍高性能计算系统体系结构、高性能并行程序程序设计方法及高性能计
全球气候模拟
• 应用:
- 主要事件预测(Predict major events, e.g., El Nino) - 用于确定大气散射标准 (Use in setting air emissions standards)
来源: /chammp/chammp.html
高性能计算已经成为复杂系统工程的必备手段
航空高性能计算领域
• 高端需求主要集中在CAE领域
– – – – – – – – 气动力计算 结构计算 气动弹性分析 多学科设计优化 飞行载荷计算 隐身设计计算 稳定性和操纵计算需求 飞行仿真
超音速巡航
大攻角机动
• 其他高性能计算需求
– 数字化装配 – 数字样机
Units of High Performance Computing
计算能力
存储能力
• 计算问题: – f(经度, 纬度, 海拔, 时间) 温度, 气压, 适度, 风速
做法: 域的离散化分解,10公里解析度(Discretize the domain, e.g., a measurement point every 10 km) 给定时间t设计算法预测t +dt的天气(Devise an algorithm to predict weather at time t+dt given t)
• 80年代中期 to 90年代中期: 指令级别并行( instruction level parallelism)
– pipelining and simple instruction sets, + compiler advances (RISC) – on-chip caches and functional units => superscalar execution – greater sophistication: out of order execution, speculation, prediction
– to deal with control transfer and latency problems
• Now: 线程级并行(thread level parallelism)
VLSI三个阶段
Three phases: •Bit-level •Instruction-level •Thread-level
• Engineering
• Business
– Financial and economic modeling – Transaction processing, web services and search engines
• Defense
– Nuclear weapons -- test by simulations – Cryptography
Source:IDF2012
2015 Cloud Vision
• Coexistence of Opportunities and Challenges
Source:IDF2012
Trends to Exascale Performance
• Roughly 10x performance every 4 years, predicts that we’ll hit Exascale performance in 2018-19
• 并行编程的重要性
High performance computing
应用需求
高性能计算与科研,产业…——需求与意义