当前位置:文档之家› 如何营造大数据产业生态环境

如何营造大数据产业生态环境


单位:百万美元
12.0%
665.7
935.3 838.8
1038.0
749.0
590.7 522.8
2007
2008
2009
2010
2011
2012
2013
数据来源:BI全球预测2013
228.2
“大数据”分析在重点行业的收入规模 (百万美元)
164.9 130.2 114.7 91.4 68 46.3 30.4 20.3 21.8 80.1 36.6 24.7 6.87.1 5 制 造 业 6 娱 乐 7 专业 服务 8 公共 部门 9 零 售 10 电 信 11 交 通 12 其 他 80 65.2 122.3 97.5 74.3 54.1

数据呈现技术
包括可视化技术、历史流展示技术、空间信息流展示技术等
江苏赛联信息产业研究院
大数据应用市场
全球”大数据”分析市场规模

• • •

基于云计算的大数据分析能力 得到越来越多企业的关注
基于大数据分析,可以支持企业精细 运营,提升管理决策效率。 沃尔玛对销售额、定价和天气及人口 数据比对,选择上架产品; UPS公司根据卡车交货时间和交通模式 优化路线等
越来越多 IT 巨头建立统一的大数据 分析技术,服务于行业客户
178
2010 2013
55.9 38.1

IBM 、 EMC 、 Oracle 大量收购 BI 、分 析类企业
结合新的大数据需求(引入外部数 据),主要服务于传统行业客户的 企业分析

1 能 源
2 金 融
3 医 疗
4 生命 科学
数据来源:Detecon
物联网的快速发展
城市的视频监控 工业设备的状态实时采集 车联网 智慧城市
江苏赛联信息产业研究院
大数据的特征“4V”
每天新增: 7 TB, Twitter 10 TB, Facebook
社交
博客
物联网
101100101001 001001101010 101011100101 010100100101
低价值密度
4. Value
以视频为例,一部一小时的 视频,在连续不间断监控过 程中,可能有用的数据仅仅 只有一两秒。
3. Variety
如今的数据类型早已不是单 一的文本形式,订单、日志、 音频,能力提出了更高的要 求
大数据的价值-对企业
用户洞察
海量数据和消费者需求变化 对企业经营带来巨大挑战
信息化时代,围绕内外用户数
如何营造大数据产业生态环境
江苏赛联信息产业研究院院长
祁晓荔 博士
2013年10月10日南京
目录
1
大数据概念与应用
2
大数据产业生态 大数据产业培育
3
江苏赛联信息产业研究院
大数据背景-数据量快速增加
2011年5月,EMCWorld2011大会主题“云计算 相遇大数据”,抛出了“大数据”(BigData)概念 。 2011年6月,IDC发布年度数字宇宙研究报告《 从混沌中提取价值》(Extracting Value from Chaos) ,提出三点重要论断:根据IDC过去五 年的研究发现,全球数据量大约每两年翻一番; 2010年全球数据量跨入ZB时代;未来全球数据 增速将会维持,预计到2020年全球数据量将达到令
人恐怖的35ZB。

TB
PB
EB
ZB

2011年6月底,IBM、麦肯锡等众多国外机构发 布“大数据”相关研究报告,予以积极跟进。 2011年10月,Gartner认为2012年十大战略技 术将包括“大数据”。 2011年11月底,IDC将“大数据”放入2012年信 息通信产业十大预测之一。
江苏赛联信息产业研究院
江苏赛联信息产业研究院
大数据的价值-对府
大数据的发展,将改变政府的治理模式,向 数据的分析者与分享者转变,催生智能政务。
由数据“收集者”向数据“分析者”转变 由数据“被索取者”向服务“推送者”转变 政府决策由“预报”走向“实报”、“精报”
江苏赛联信息产业研究院
大数据技术:在成本可承受 (economically)的条件下, 通过非常快速(velocity)的 采集、发现和分析,从大量化 (volumes)、多类别 (variety)的数据中提取价值 (value)
大数据是IT领域新一代的技术 与架构
大数据将在多个行业有广泛的 应用;大数据将为企业在市场 营销与科学管理提供的核心支 撑力,应用大数据的能力将是 未来企业核心竞争力的重要组 成部分。
江苏赛联信息产业研究院
大数据涉及的主要技术 核心技术
数据分析技术
主要包括数据挖掘、机器学习等核心技术,涉及关联规则挖掘、 集成学习、遗传算法、神经网络、优化、模式识别、预测模型、 回归、统计、时间序列分析、关联规则学习、聚类分析等。
大数据根源:人、机、物三元世界的融合
数据为中心的传统学科
天文观测获取信息量的速率至 少在1015 bit /周的数量级 高能粒子加速器具有109 张图 片/秒的信息量 分子生物学中DNA、蛋白质分 子长链的刻画
个人与企业的经营活动
社交网络 个人照片、视频 电子商务 B2C/B2B/C2C ... ERP
数据量巨大
1. Volume
全球在2010 年正式进 入ZB 时代,IDC预计 到2020 年,全球将总 共拥有35ZB 的数据量
快速(增长、处理 响应)
2. Velocity
大数据区分于传统数据最 显著的特征。如今已是ZB 时代,在如此海量的数据 面前,处理数据的效率就 是企业的生命
多样性
(结构化数据、半结构化 数据和非结构化数据 )
融合技术
信号处理技术 语义处理技术 大规模分布式存
数据存储与管理技术
主要包括关系型和非关系型数据库技术、数据融合和集成技术、 数据抽取技术、数据清洗和数据过滤技术。
储技术 统计学相关知识
数据处理技术
包括分布式计算技术、内存计算技术、流处理技术、云计算技 术。
社会科学相关知
外部 数据
微博数据
搜索数据 IM数据 SNS数据
据整合成为企业核心竞争力来 源之一
基于大数据的用户立体洞察,
……
电子商务 数据 浏览数据
将为企业带来三大战略价值。
支持精细化营销 支持产品优化和创新 支持新商业模式的拓展
内部 数据
…… 渠道数据
营销服务数据
产品使用数据 网络底层数据
江苏赛联信息产业研究院
相关主题