当前位置:
文档之家› 国家临床医学研究中心建设-朱万琳
国家临床医学研究中心建设-朱万琳
人脑连接组学在超算上的应用
大脑本身就是由神经元以及它们之间连接组成的复杂连接系统
十九世纪西班牙人Santiago Ramón y Cajal 第一次确立了神经元学说,即神经组织是由 多个微小的神经元连接组成的,基于这个学 说,现代网络神经科学才蓬勃发展起来。。
1. 大脑是由86亿个神经元已级万亿个神经元之间的连接组成的。 2. 一立方毫米的神经元可以产生1000TB的数据; 3. 当前世界最顶尖的研究,采用纳米级别分辨率的电子显微镜,如果基于人 工来判读,100立方微米大概需要100万小时的人工操作。
人脑连接组学在超算上的应用
脑网络的数学表达:图论 图论的数值计算:基于矩阵计算,可以在基 于共享内存、分布式、异构加速实现; 无向加权网络:对称矩阵 有向加权网络:非对称矩阵 基于核磁影像得到的矩阵:15000x15000
Bertolero, Nature Human Behaviour 2,765-777(2018)
神经元尺度的人脑连接组学
谷歌最近提出一种自动神经元提取算法, 发表在Nature子刊Nature Method上, 能够7天就能完成人类需要花10万小时 的标注任务。如果基于人工来判读, 100立方微米大概需要100万小时的人 工操作,这样大的工作量只能利用超级 计算机自动的去进行。
Januszewski, et.al., Nature Methods volume 15, pages605–610 (2018)
ቤተ መጻሕፍቲ ባይዱ
基于人工智能的多组学联合分析
将基因表达调控、组织表达特异性、信号通路等数据一并作为训练集, 能确定以往研究中未发现的易感基因,并从多个维度计算个体患病风险。
Manolio TA, et al. Finding the missing heritability of complex diseases. Nature. 2009;461(7265):747-53. Isakov O. Inflamm Bowel Dis. 2017;23(9):1516-23.
神经元尺度的人脑连接组学
美国阿贡国家实验室(Argonne) 正在建造的浮点运算速度达到百亿 亿次(E级)的超级计算机Aurora21, 从2007年开始规划,计划2021年 建成,被称为国家的象征与科学领 域改变游戏规则的利器(是我们超 算平台计算能力的2500倍)。其 一个主要任务是用于模拟人脑神经 元之间的连接(人脑神经元连接达 到百万亿规模),将数百万二维脑 图像重构为三维的神经元级别的脑 连接组。
国家临床医学研究中心建设
国家神经系统疾病临床医学研究中心 首都医科大学附属北京天坛医院 朱万琳
基本内容
• 1. 国家中心超算平台介绍 • 2. 超算平台在国家中心的主要应用 • 3. 超算平台在神经系统疾病研究中的展望
国家中心高性能计算平台
1. 国家中心超算平台是2018年九月底完成安装,目前正处于调试、优化,试运行阶段
神经影像研究在超算平台上的应用
例如研究某种疾病病灶位置在某个 人群发病位置的分布,需要把个体 3D磁共振结构像配准到标准空间, 传统工作站上每个人需要7个小时左 右的计算时间,因此在一台四核工 作站上,则10000人左右的研究项 目(比如CNSR3),同时在四个 CPU内核上计算需要700多天计算 时间。而在我们的超算平台上,则 只需要一天就可以算完。
2. 国家中心超算平台从硬件架构上主要包括以下五部分: (1). 通用计算节点:80台(192G内存/台, 2240个计算核心,峰值运算160 万亿次/ 秒 ); (2). 胖节点: 4台( 2TB内存/台, 360个计算核心,峰值运算11 万亿次/秒); (3). GPU计算节点:10台(CPU:292个计算核心,峰值运算能力为21万亿次/秒, GPU:32个GPU卡(8个v100,24个p100),126,976个CUDA运算核心,峰值运算能力 为168.8 万亿次/秒); (4). 并行存储:大容量并行存储系统,4台opara, 16台ostor(可用空间6PB); (5).计算网络:采用100Gbps EDR IB高速互联网络,实现本次所有配置100Gb高速 网卡节点的100Gbps全线速无阻塞互联。
3. 国家中心超级计算机总体计算能力理论峰值为360T Flops,其中CPU计算能力 占总体运算能力53%, GPU计算能力占总体计算能力47%。
国家中心高性能计算平台
国家中心超算平台主要应用内容
• 1. 生物信息学在超算平台上的应用; • 2. 神经系统人工智能在超算平台上的应用; • 3. 神经影像研究在超算平台上的应用; • 4. 人脑连接组学在超算平台上的应用。
人脑连接组学在超算上的应用
基于核磁共振图像重构得到的结构、功能人脑连接网络。
Koenigsberger, Nature Reviews Neuroscience 19, 17-33(2018) Bullmore, Nature Review Neuroscience 10,186-198(2009)
人工智能系统BioMind
BioMind系统基本实现了对急性脑梗死和部分小血管病识别的高准确度
MR-T2*序列
准确度 0.847
MR-DWI序列
准确度 0.80
原始图像
医生标注 人工智能标注
人工智能系统BioMind
BioMind:脑出血的病灶识别率>90%
神经影像研究在超算平台上的应用
例如大脑皮层沟回的提取与计 算,传统工作站上每个人需要 20个小时左右的计算时间,如 果在一台四核工作站上,则 10000人左右的研究项目(比 如CNSR3),同时在四个CPU 内核上计算需要2000多天计算 时间。而在我们的超算平台上, 可以同时分配2000个核的计算 资源(72个双路计算节点), 基于任务并行的方法,则只需 要5天就可以算完。