当前位置:
文档之家› 微软Azure云端大数据解决方案概览
微软Azure云端大数据解决方案概览
中国大数据现状
全球的大数据应用处于发展初期,中国大数据应用刚刚起步
互联网是大数据应用的领跑者
大数据应用加速向传统领域拓展
金融
医疗
大数据应用初级发展阶段特征,各个开发商处于´瞎子摸象µ的尝试阶段 缺少典型性、共性强的大数据应用; 关键技术和分析方法主要依赖国外技术和产品 在´创新³ 开源³ 产品µ的大数据技术链条上贡献度低 中国互联网企业的技术优势难以顺畅地扩散到各行业,行业整合度低
大数据战略价值
数据成为继物质、能源之后的第三大战略资源。大数据提供了认识复杂系统的新 思维、新手段
全体数据
挖掘
近似求解 关联关系
数据量 9ROXP H
速度 9HORFLW\
多样性 9DULHW\
价值 9DOXH
大数据思维
随机样本 精确求解 因果关系
传统思维
数据规模指数级增长,大约年翻一倍,年7%, 年=%,年 预计=%, 是过去年内产生
大 数 据 生 态 发 展 现 状
大数据生态发展现状
基础架构
分析
应用
跨基础架构
数据源
开源
大数据的几个方向
Oracle Exadata
一体机
实时商务智能
内存数据库6$3 + $1 $、0 RQHW' %
IBM Netezza
核心业务系统搬迁
Teradata …
大数据+ DGRRS 0 33 ' % ¬
- 应用可以是任何使 用数据的程序。最 通用的是后端的 web应用调用程序
流数据解决方案
RabbitMQ / ActiveMQ
Stream processin
g
,R7解决方案一般架构
微软预测性维护参考方案
设备
& VLP XODWRU
$]XUH ,R7 6XLWH 预测性维护
: HE0 RELOH $SS
大数据建设思路总结
界定目标
收集和存储初步确定的所 有数据
了解和记录可用数据
采集
探索
建模
增强
使用迭代方法产生分析模 型
设计
用丰富数据来补充初 始数据
分析
数据洞察力
提升
参考资源action
Event Hub /home/features/event-hubs/
SE Asia Singapor
e
China North *
Beijing
East Asia Hong Kong
Japan East Saitama
Japan West Osaka
Australia East New South Wales
已运营 已宣布/未运营 * 21世纪互联运营
Australia South East
Canada East Quebec City
West US Californi
a
South Central US
Texas
East US Virginia
US Gov Virginia
East US 2 Virginia
North Europe Ireland
100+ 数据中心
Brazil South Sao Paulo
Steam Analysis /home/features/stream-analytics/ /documentation/articles/stream-analytics-get-started/ https:///zh-cn/services/stream-analytics/
世纪互联虚拟机,云存储,SQL 数据库三项云服务获得国内首批 可信云服务认证
蓝云 ISO20000/27001 认证
由世纪互联运营的WindowsAzure通过信息安全等 级保护二级评测
安全&管理
Portal
Active Directory
Multi-Factor Authentication
低处理延迟 (sub-seconds)
可支持多个stream的关联 分析,或stream与参考数 据的关联分析
使用近似SQL语言
内置window和join操作 可使用简单的策略配置来 处理事件的乱序或晚到
保证事件的delivery
自动和快速的故障恢复 支持监测和运维警告
事件中心(Event Hub)
Victoria
国际科技本土运营的云服务
2012年11月1日,微软与上海市政府签署了中国具有里程碑意义的 协议,由世纪互联运营中国第一个国际公有云平台。 2014年3月26日,由世纪互联运营的Windows Azure在中国正式商 用2014年4月15日,由世纪互联运营的Office365在中国正式商用 两个平台目前用户数约20,000家
世纪互联: 中国最大的第三方电 信中立互联网基础设 施服务提供商
微软: 向世纪互联授权世界 领先的公有云平台技 术与商用应用技术, 包括 Windows Azure 与 Office 365
上海蓝云: 专注于基于微软技 术的公有云服务的 运营和服务,包括 Windows Azure和 Office 365
可信、安全、国际水准服务
在CCID 中国IT服务年会上获得了 “2014年中国最具影响力云服务 商奖”与“2014年中国云服务解 决方案创新奖”
由世纪互联运营的Windows Azure 提供公有云计算平台服务,包括计算、 存储、数据库、整合及网络化服务
由世纪互联运营的Office 365 提供Office应用、电子邮件、联 机协作、联机会议等服务
Device Device Device
Event Hub
Partition1 Partition2 Partition3
Event Consumer
Event Consumer
Event Consumer
连接数百万设备,吞吐量高达每秒数百万事件
Microsoft Azure Machine Learning
Search
DocumentDB
Tables
混合运营
Azure AD Connect Health
AD Privileged Identity Management
Backup
Operational Insights
Import/Export
Site Recovery StorSimple
微软大数据端到端解决方案
议题
大数据生态现状 微软$]XUH云端大数据 成功案例 问答
Microsoft Azure -- 面向全球基础架构能力
全球24个区域, 19个在线…巨大的计算能力…每年持续增长
US Gov Iowa
North Central US
Illinois
Central US Iowa
Canada Central Toronto
全球3大网络
2倍于AWS, 6倍Google的数据中心区域
G系列 – 全球最大的虚拟机, 32核心, 448GB内存, SSD…
West Europe Netherlands
India West Mumbai
India Central
Pune
China South *
Shanghai
India South Chennai
天气 文字 /图像
大数据建设特点
体量Volume
非结构化数据的超大规模和增长
总数据量的80~90% 比结构化数据增长快10倍到50倍 是传统数据仓库的10倍到50倍
多样性 Variety
大数据的异构和多样性
很多不同形式(文本、图像、视频、机 器数据) 无模式或者模式不明显 不连贯的语法或句义
速度Velocity
Power BI前端展现
牛津计划
人脸识别
人脸检测
多人脸分组
多人脸验证
32个特征点
"faceRectangle":{ "width":228, "height":228, "left":460, "top":125},
"faceLandmarks":{ "pupilLeft":{ "x":507, "y":204}, "pupilRight":{ "x":609.8,
点击流
维基 /博客
移动 广告
WEB2.0
电子商务
ERP/CRM 应付款(企业内部数联据系人)
薪酬
订单追踪
盘存
销售管道
大数据
传感器 /RFID/设备
协作 数字化营销 搜索营销 Web日志 推荐
数据复杂度:多样化与高速度
音频 /视频 日志文件
空间 &GPS协调 数据营销源 电子政务源
目的清洗,为长期ห้องสมุดไป่ตู้存储分区
- HDI和客户代码作为转 换或清除工具被使用, 例如: 整合、标准化 等
- 产生分析前数据(例如: 维度或影响因素、聚合 的大数据等)
- 产生结果集驱动应用或 商业处理(例如: 一个 web站点的产品推荐显 示列表)
- 可能在企业内部或 云端
- 产生结果集驱动应 用或商业处理(例 如: 一个web站点 的产品推荐显示列 表)
微软Azure云端 大数据解决方案概览
张强,首席技术顾问 MD]KDQ# P LFURVRIWFRP 微软(中国)有限公司
议题
大数据生态现状 微软$]XUH云端大数据概览 成功案例 问答
什么是大数据?
Petabyte
Terabyte