当前位置:
文档之家› 华为大数据解决方案介绍(云南移动)
华为大数据解决方案介绍(云南移动)
2011Q2,发布Greenplum HD 2011Q4放弃自研平台,发布HDInsight 2011Q2,LexisNexis Risk Solutions‘ High Performance Computing Cluster will be offered as open source code pitting it against Hadoop. 但是为时已晚,HPCC将被迫 局限在较小的市场。
9
大数据在智慧城市中的应用
日本“N系统”(自动车ナンバー自动読取装置),可以全年无休对道路上行驶的车辆牌照拍照存盘,记录下行
驶的路线与时间。同时在数据库中比对被通缉中嫌犯或窃赃车的车牌号码,如果发现符合,该系统立即通知在
外巡逻的警员(配合携带式接收装置),及时对该车辆进行栏截围捕。另外、东京都警视厅也配合“3D脸部自
宝洁和Netflix,利用它们在线互联网服务获得的用户行为数据,可以深入洞察 用户偏好,从而在新产品、新服务的开发方面带来洞见。
大数据应用领先者的主要特点,一是利用线上洞察,改善客户的线 下体验,二是基于客户的物理位置,进行营销。 通过收集用户在使用产品、服务的过程中的产生的数据,可以方便 的检测到产品设计中存在的问题,从而作为改进的基础,这是大数 据应用的主要场景之一。比如一些银行考虑收集自营电商、门户网 站的点击流数据,作为客户偏好分析的一个输入。
享,来进一步发挥好信息的价值和创造力。这个工程推进以后,工行的整个营销品质、客户服务品质、风险管
理、流程优化、内部管理,会得到根本性的提升,对管理理念、经营思想也会带来全面的影响和提升。要将大
数据体系和信息化银行建设作为全行未来创新发展的一项重要任务。
美国银行,基于客户的地理位置进行实时报价
In another emerging-technology example, the bank is considering combining geolocation with its Bank Amerideals merchant-funded rewards program to deliver offers to customers in real time while they are in a particular store, such as Baby Gap.
欧美半数以上的企业在2012年开始启动大数据相关项目, 其中约有45%以上的企业在当年看到收益。 Telefornica发布了名为Smart Steps的服务,通过移动电 话的群体信息让其他公司、公众部门可以得知手机群体 的移动特征。
2012年大数据应用领先企业的特征是利用线上获得客户行 为数据来优化线下体验和ቤተ መጻሕፍቲ ባይዱ于客户地理位置展开营销活动
3
大数据发展历史
华为在SmartCare解决方案中集成Hadoop、流处理、MPP DB 并在2012年推出大数据解决方案平台产品家族FusionInsight
IBM推出大数据系列产品InfoSphere BigInsights, Streams Aster Data Hadoop创始 Hadoop在 Vertica 人根据谷歌论 Yahoo实验 ParAccel 文创建原型 室完成孵化 Greenplum 2003 2005 2006 2008 EMC收购Greenplum,与MapR合作,推出Greenplum HD
消费者不再是一堆毫无差别的数字交易事务,或者是一个Cookie文 件,或者一堆交易历史或者人口学数据,他们是具有切实差别的真实 存在的个体。
For banks, the combination of huge volumes of data suddenly available to the organization and the new types of data they have access to (aside from account-specific or transaction data, they can also now look at unstructured data such as call center logs, geospatial information, and social media activity) presents a great potential to add much-needed context to the bank-to-customer relationship.
,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。网络上每一笔搜索,网站上每
一笔交易,敲打键盘,点击鼠标的每一个输入都是数据,整理起来分析排行,它的功能可不仅仅止于事后被动了解市场,
搜集起来的资料还可以被规画,引导开发更大的消费力量。
Data-intensive computing:Data-intensive computing is a class of parallel computing applications which use a data parallel approach to processing large volumes of data typically terabytes or petabytes in size and typically referred to as Big Data. Computing applications which devote most of their execution time to computational requirements are deemed compute-intensive and typically require small volumes of data, whereas computing applications which require large volumes of data and devote most of their processing time to I/O and manipulation of data are deemed data-intensive.
《TCS Big Data Global Trend Study 2013》
8
应用领先者特点:基于多源数据的客户洞察
大数据应用领先企业更显著的引入了半结构 化数据,以及引入以前没有使用的数据源
半结构化数 据引入的多 少,是领先 者与落后者 之间的主要 差别
通过引入客服数据、客户浏览网站的点击流数据、客服 消费行为发生的时间、空间数据,可以全面刻画客户
2013年7月21日星期日
华为大数据解决方案介绍
FusionInsight Hadoop
1 2 3 4 5
大数据定义和发展历史 大数据在其他行业的应用
大数据在运营商的应用与挑战
FusionInsight Hadoop企业版介绍
FusionInsight Hadoop成功实践
2
业界大数据定义
大数据(英语:Big data[1][2]),或称巨量资料、海量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具
1 2 3 4 5
大数据定义和发展历史 大数据在其他行业的应用
大数据在运营商的应用与挑战
FusionInsight Hadoop企业版介绍
FusionInsight Hadoop成功实践
6
企业大数据应用的三种模式
“卸载”模式
卸载模式是指 在一些应用明确,不涉及实时复 杂SQL运用,数据量超大的场合, 采用大数据NoSQL技术来替换传 统的关系数据库加存储阵列的体 系。 在一些数据来源不变的场合(尤 其金融行业),在不需要数据库事 务的保护下,对ETL过程进行处理。
“全量洞察”模式
全量洞察模式是指 以往由于系统性能、时间、成本 等多方面的考量,客户洞察计算基 于少部分样本,比较依赖复杂的模 型和经验。由于大数据计算平台的 出现,可以基于拥有的全量数据进 行分析,从而可以在短时间内对很 多模型进行全量计算,降低对复杂 模型的依赖,通过实践反馈来验证 和选拔有效的模型。 业界已经证明,大量数据加简单 模型,要比部分数据加复杂模型, 要来得有效。
动辨识系统”辨识人貌鉴定,警察如需调查案情之时,就能够调出数据库数据,进行交叉比对,筛选出可疑的
犯罪目标。
10
大数据在金融行业的应用
工行新任行长易会满提出未来工作五大设想
易会满指出,工行经过多年的发展,已经建成了国际领先的IT系统并积累了海量的经营数据。下一步工行将重
点关注在大数据背景下如何建设信息化银行,利用海量的结构化、非结构化数据,通过集中、整合、挖掘、共
HP收购Vertica
2010、2011
4
技术趋势:封闭平台日渐路窄,开放创新势不可挡
传统大数据平台公司被迫开源,大公司 加入Apache Hadoop开源生态系统
2010Q2发布InfoSphere BigInsights
开源生态系统继续保持活力, 相关创新日趋加速
2008Q3Facebook贡献Hive项目,成为Apache社区正式项目 2013Q2宣布秋季将会开源Presto,新的高性能数据分析引擎 贡献测试套件YCSB,并行计算调度框架YARN
IDC 《Buyer Conversations:Westpac's Journey into Big Data — From Transactional Data to Big Data Analytics》
“新数据”引 入的多少, 是领先者与 落后者之间 的主要差别
《TCS Big Data Global Trend Study 2013》
“新数据”模式
新数据模式是指 将以往已经收集,但是没有纳入 模型的数据纳入模型,参与分析。 将以前认为没有收集价值的数 据,收集起来,参与分析。 将以前无法收集的数据,采用最 新的技术,加以收集,比如呼叫中 心的交流记录。