当前位置:文档之家› 服务双一流建设搭建科研创新高性能计算云平台

服务双一流建设搭建科研创新高性能计算云平台

门 – 应用的交互场景从ssh终端、Web Portal到应用集成环境、GUI图形(ANSYS) – 从课题组统一调配排队使用到个人工作环境的使用
面临的挑战二:技术的发展
• 随着计算机技术的发展,系统结构、操作系统、支撑软件 多种多样
– 系统架构:两路节点、四路胖节点、八路肥节点、GPU节点到双路机群、 四路机群、GPU机群等;从传统的MPI机群到大数据处理机群
• 从2000年上海超级计算中心成立,到目前有国家超算中心(天津、广 州、深圳、长沙、济南、无锡),省级和地区超算中心,各高校超算 中心,院系、课题组计算平台

山东大学高性能计算平台
• 山东大学是国内最早建设高性能计算平台的高校之一
– 2002年8月经山东省科技厅批准成立山东省高性能计算中心,依托山东大学软件学 院,由山东大学和济南市高新技术开发区管委会共同投资建设
工作圈”
思考
• 指导思想:以人为本
– 让想计算的人更方便计算 – 重点解决:“Dependency hell”,为用户提供个性化定制 – 让服务走向用户 – 让参与其中的人都有“获得感”、“存在感”
• 以用户为中心、以应用为根本、以计算和数据为引擎
– 把与计算有关的人和事连接起来,环境即服务(Environment-as-aService)
• 目前是国家高性能计算环境的主要节点,也是教育部的ChinaGrid主 要节点
– 承担了国家十一、十二五国家863和十三五国家重点研发计划项目,以及教育部中 国科研教育网格项目
• 开展化学、物理、材料、能动、生物信息、信息安全及动漫渲染等高 性能计算应用
– 2004年8月数学院王小云院士的团队在平台上完成了对单向散列函数MD5算法安全 攻击的成功实现,实现了国际密码学领域的重大突破
面临的挑战一:计算需求多样性
• 山东大学学科门类众多,涉及计算的学科逐渐增加,计算需 求多样
– 从计算的传统学科理工科,发展到实证科学、医学、药学、人文学科 – 从传统的连续问题离散化的高性能计算(OpenMP、MPI)到离散问题的大数据
、深度学习、统计分析 – 从单纯计算应用到软件调试、优化模型、实验教学 – 大多数处于中、小规模(几百个核),个别(上千核),还有一部分处于入
– 操作系统:centos 6.*, 7.*、ubuntu 12.04,14.04,16.04,17.04,18.04 ,windows HPC server
– 支撑软件:python 2.7,3.4,3.5,3.6、各种compiler、library等
• 大数据:数据量大,代码迁移 • 深度学习:软件版本多,GPU
面临的挑战三:思维和服务模式
• 新技术、新思维、新模式出现
– 互联网:开放、平等、协作、快速、分享,以人为本 – 云计算:资源统一管理和调度,按需提供服务,用户体验 – 移动互联:将计算有关的人和事连接 – 大数据:以数据为中心,为用户精准画像,提供个性化服务
• 有益的尝试
– 天津超算、上海超算的云服务模式,高校计算云平台:上海交通大学、北京理工 大学等
使用面临的问题
• 使用门槛比较高,初入计算比较难,特别是对非计算机专业 • 使用方式单一,用户体验差 • 缺乏用户自己定制、开发的途径,难以实现个性化定制 • 缺少技术交流的环境和应用激励机制 • 只提供单纯的计算,缺乏工作流和对整个科研过程的支持
总结
• 两个难点:运维管理难,用户使用难 • 两个目标:减少运维的工作量,提高使用的灵活性 • 核心:打包与部署分离 • 解决方法:智能微模块 + 容器技术,就如“集装箱” • 引入基于社交通讯的移动应用,打造围绕计算和数据的“
• Ecosystem:生态
– 面向课题生态 – 面向项目生态 – 面向问题生态
平台建设目标
• 围绕学校的高性能计算、云计算、大数据、深度学习、数 据分析统计的科研需求,建设一个基于混合架构、容器和 移动应用技术的计算云服务平台,计算能力达到 380TFLOPS,存储能力为1.6PB,构建“依托学科、专管共 用、开放共享、服务需求” 大型设备的管理和应用体系 ,为学科发展提供支撑,助力科研创新
– HPC in Cloud:公有云,AWS、Azure、阿里云、腾讯云、华为云 – 容器技术:singularity, shifter, udocker, charliecloud, ubercloud
决策面临的问题
• 大平台、小平台的矛盾
– 大平台如何满足不同用户的个性化需求 – 小平台建设分散,人员、空间、设备资源难以整合
• 如何实现“依托学科、专管共用、开放共享、服务需求” • 扩大计算应用领域,加强交叉学科的融合,带动计算相关
学科的发展,提高科研创新能力
运维面临的问题
• 传统的管理模式难以满足应用需求
– 从硬件维护、软件安装部署、作业提交、权限分配、用户记账
• 应用部署存在“Dependency hell” • 运维服务、应用支持人员不足 • 缺乏资源优化分配和应用激励机制 • 收费模式单一
服务“双一流”建设
搭建科研创新高性能计算云平台
--教育科研EaaS模式
山东大学软件学院 山东省高性能计算中心
龚斌
目录
• 平台建设背景 • 面临的挑战和问题 • 平台的建设 • 典型应用场景
建设背景
• 实施国家创新驱动发展战略 • 《新一代人工智能发展规划》和发展大数据战略 • 世界一流大学和一流学科建设, “双一流” • 高性能计算已同理论研究和科学实验一起成为人类探索未
知世界的三大科学手段,被称为支撑科学发现的第三个支 柱。科技进步的重要标志之一,也是国家科技综合实力的 综合体现
建设背景
• 高性能计算近年来发展迅速
– 从2010年11月天河-1排名TOP500第一名到2013年后,“神威太湖之光”连续排名 第一
– 2016、2017年连续两次获高性能计算应用“戈登•贝尔”奖
– 把相关计算的人和人连接起来,生态即服务(Ecosystem-as-a-Service)
• 面向教育科研的EaaS模式
EaaS:以环境(生态)为服务
• Environment:环境
– 计算应用环境:个人,课题组 – 实验实训环境:Linux、DB、network、software – 软件研发环境:深度学习 – 交叉研究环境:生物信息
相关主题