大数据在医疗行业的应用
Data Characteristics
Data Volume and Quality
Cloud
NAS - SAS and Distributed Storage Human Genome & Drug Discovery
Provisioning Models-Storage & Connectivity Considerations
Data Volume and Quality Data Velocity Data Vulnerability
Provisioning Models-Storage & Connectivity Considerations
Databases DBMS / NoSQL 10GBe Fast Fabric MPP Databases DW Appliances
Security Services Privacy Compliance
Provisioning Models Can Vary by Data Characteristics
16
大数据解决方案的整体框架架构
Data as a Services
HPC / TCP MIC
Virtual Persistence EDW, Marts Real-Time, Cached, Federated Event, Message Distributed
议程
• 医疗与大数据的趋势 • 什么是医疗大数据? • 大数据面临的挑战 • 如何管理和利用大数据 • 案例分享 • 总结与展望
7
医疗大数据简介
数据来源包括哪些?
1. 制药企业/生命科学 2. 临床决策支持 & 其他临床应用 (包括诊 断相关的影像信息) 4. 患者行为/社交网络
3. 费用报销, 利用率 和 欺诈监管
趋势分析:我们正处在医疗行业的一个重要转折点
存储的增长
医疗服务产生的数据总量(PB)
15000 10000 5000 0 2010 2011 2012 2013 2014 2015 Admin Imaging EMR Email File Non Clin Img Research
医疗影像归档
一个医疗系统案例的数据
12
关注数据的价值
大数据存储的考虑 传统存储方式 大规模数据分析 – Hadoop* 海量数据库 – Hive* 大规模备份 – Lustre* 传统解决方案 环境 ERP, CRM, Batch, OLTP-DB
边缘服务器(Edge) 分析 同步 端到端 Machine-to-Machine Source-to-Source
NAS - SAS and Distributed Storage Human Genome & Drug Discovery Databases DBMS / NoSQL 10GBe Fast Fabric MPP Databases DW Appliances
Data Velocity Data Vulnerability
Databases DBMS / NoSQL 10GBe Fast Fabric MPP Databases DW Appliances
Data Velocity Data Vulnerability
Data Sources
Diagnostic Images
Surveillance and Medical Medical Device Devices Streaming Data
丰富的视觉化效果– 安全的数据分析和缓存
14
Compute – Storage & Infrastructure Platforms
大数据解决方案的部署方式(参考)
结构化 数据平台 企业应用工具
遗留系统
Node
; 数据集市 数据挖掘 集成开发工具 IMPORT
企业级数据仓库
Integrated Analytics with Hadoop Support
BI & Predictive Analytics
Existing BI/Analytics with in-database data processing support
Data as a Services
HPC / TCP MIC
Log Files
Text, Video and Audio
Social Media
Medical Records
GIS
Security Services Privacy Compliance
Provisioning Models Can Vary by Data Characteristics
17
Data Sources
Hadoop*
日志 CONSUME 非结构化
Create Map
REDUCE
视觉化工具
社交 & 网络
No-SQL INSIGHTS 内存数据库 SQL
电子表格 应用
传统的文件格 式
录音文件& 笔记等
Web Apps MashUps 关系型数据库
15
大数据解决方案的整体框架架构
Provisioning Models-Storage & Connectivity Considerations
到2020年, 医疗数据将急剧增长到35 Zetabytes, 相当于2009年数据量的44倍 增长
Source: McKinsey Global Institute Analysis ESG Research Report 2011 – North American Health Care Provider Market Size and Forecast 6
数据源 文本-语音-视频-传感器 Requesting Or M2M 通讯 批量 – 商业应用
丰富的视觉化效果– 安全的数据分析和缓存
13
关注数据的价值
大数据存储的考虑 传统存储方式 大规模分析 – Hadoop* 海量数据库 – Hive* 大规模备份 – Lustre* 传统解决方案 环境 ERP, CRM, Batch, OLTP-DB
Data Center Provisioning Discrete Virtual Cloud – As A Service HPC
边缘服务器(Edge) 分析 同步 端到端 Machine-to-Machine Source-to-Source
可行的解决方案体系(示例)
数据源 文本-语音-视频-传感器 Requesting Or M2M 通讯 批量 – 商业应用
我们如何利用大数据创造价值? (示例)
1. 个体化医疗 2. 临床决策支持
3. 欺诈监测得以加强
4. 由生活方式和行为引发的疾病分析
McKinsey Global Institute Analysis
8
医疗大数据相关解决方案
健康信息服务
基础医疗服务 个人健康管理 老龄社会
新兴的医疗服务 应用
临床决策支持
% o f popu lation over age 60
30+ %
25- 29%
20- 24%
10- 19%
0-9 %
2050
WW Average Age 60+: 21%
Source: U nited Nation s “Po pulati on Agi ng 200 2”
医疗费用在不断上升 GDP的占比非常高
Virtual Persistence EDW, Marts Real-Time, Cached, Federated Event, Message Distributed
Data ingestion, Integration and Processing Services
Distributed High Performance Data Processing Hadoop* MapReduce
Applications & Services Visualization – File Structure & Analytical Tools Data Delivery, Operational & Graphical Analytics Data Management & Computational Analytics
Integration Tools
Vertically Integrated Software Intel AIM Suite
Data Characteristics
Cloud
NAS - SAS and Distributed Storage Human Genome & Drug Discovery
本课程演示文稿(PDF)发布在技术课程目录网站: /go/idfsessionsBJ 该网址同时打印于会议指南中专题讲座日程页的上方
3
议程
• 医疗与大数据的趋势 • 什么是医疗大数据? • 大数据面临的挑战 • 如何管理和利用大数据 • 案例分享 • 总结与展望
4
趋势分析: 我们正处在医疗行业的一个重要转折点
个体化医疗
肿瘤基因组学
数据分析及 视觉化处理
类SQL的检索
机器学习
医疗影像分析
数据处理/ 管理
医疗记录
基因数据
医疗影像
分布式平台
存储优化
安全和隐私
影像数据处理加速
9
议程
• 医疗与大数据的趋势 • 什么是医疗大数据? • 大数据面临的挑战 • 如何管理和利用大数据 • 案例分享 • 总结与展望
10
大数据的挑战不仅来自于数据量的增长...