当前位置:文档之家› 1.1 大数据时代已经来临——对传统运营商的冲击和挑战

1.1 大数据时代已经来临——对传统运营商的冲击和挑战

课前提问
• 1、什么是大数据,大数据有哪些特征, 广西移动有多少数据? • 2、什么是数据挖掘,大数据和数据挖掘 有什么区别和联系? • 3、大数据和数据挖掘技术,对于智慧运 营与精准营销有什么作用?
目录
1、什么是大数据?
2、大数据的典型行业应用 3、国外运营商大数据挖掘典型案例 4、国内运营商大数据挖掘典型案例 5、大数据对智慧运营的意义及其主要问题
大数据的营销案例 一、未卜先知怀孕案例
塔吉特:比父亲更早知道女儿怀孕 曾经有一位男性顾客到一家塔吉特超市店中投诉,商店竟然给他还 在读书的女儿寄婴儿用品的优惠券。这家全美第二大零售商,会搞 出如此大的乌龙?但经过这位父亲与女儿进一步沟通,才发现自己 女儿真的已经怀孕了。
提问: 为什么塔吉特能知道这个用户怀孕了?必须有哪几个关键环节 A:用户数据收集 B:怀孕特征库 C:怀孕潜在用户筛选
大数据的主要价值
互联网公司日益重视大数据的应用
通讯、购物、社交、电子商务等业务产生 的数据在互联网上呈爆炸性增长 困扰互联网公司最大的难题是如何更加了 解他的客户:“你是谁,你想要什么?” 互联网公司首先尝试大数据技术分析用户 行为,深入洞察客户,促进互联网业务发 展
即时通讯
网络购物
抽样邻域理论
能效优 化
获取融合 挖掘与分析 可行性 劣质容忍 理论
结构化数据资源
表示度量
定量度量
能耗复 杂性
数 据 获 取
能耗机 半结构化/非结构化数据资源 理
大规模多源异构数据
大数据医疗应用
医疗行业产生的数据量 主要来自于PACS影像、B 超、病理分析等业务所产 生的非结构化数据。人体 不同部位、不同专科影像 的数据文件大小不一, PACS网络存储和传输要采 取不同策略。面对大数 据,医疗行业遇到前所未 有的挑战和机遇。 医疗行业大数据应用场 景非常多,右图仅以临床 操作和研发为例,展示医 疗行业大数据应用场景。 对于公共卫生部门,可 以通过过覆盖全国的患者 电子病历数据库,快速检 测传染病,进行全面的疫 情监测,并通过集成疾病 监测和响应程序,快速进 行响应。 医疗数据透明度
–2010年全球数据量达到 1 ZB –2011年全球数据量达到 2 ZB –2020年将可能达到 1000 ZB
• “数据太多,知识太少”
– 传统数据分析方式无法进行辨 析和处理,只有“大数据应用” 才能从数据汇聚到知识生成
*注:
1 1 1 1 ZB = 1024 EB EB = 1024 PB PB = 1024 TB TB = 1024 GB
Velocity 速度
• 1s 是临界点.
• 对于大数据应用而言,必须要在1秒钟内形成答案,否则处理 结果就是过时和无效的.
• 实时处理的要求,是区别大数据引用和传统数据仓库技 术,BI技术的关键差别之一.
Value 价值
• 挖掘大数据的价值类似沙里淘金,从海量数据中挖掘稀疏但珍贵的信息.
• 价值密度低,是大数据的一个典型特征.
阿里集团(1/2)-基于大数据的六大营销利器
阿里巴巴的企业愿景是要做分享数据的第一平台,知道你是谁,知道
你想要什么
淘分享(跟随
日 购 )UV300万 日商品分享200万 日GMV2
聚划算
日UV100万 日GMV1000万
明星店铺(活动)
日UV100万 每日参与活动人数100万 活动覆盖人数超过500万
• 大量的不相关信息 • 对未来趋势与模式的可预测分析 • 深度复杂分析(机器学习、人工智能Vs传统商务 智能(咨询、报告等) 实时分析而非批量式分析 • 数据输入、处理与丢弃 • 立竿见影而非事后见效
价值密度Value
速度Velocity
“大量化(Volume)、多样化(Variety)、快速化(Velocity)、价值密度低(Value)”就是 “大数据”的显著特征,或者说,只有具备这些特点的数据,才是大数据。
IBM智力问答机器人Watson
• Watson收集了2亿页知 识文本数据,并基于 Hadoop MapReduce并 行处理集群进行了数据 分析,采用了优化的并 行体系结构和优化的知 识和自然语言算法,可 在1秒内完成对大量非 结构化信息的检索,并 实时回答知识竞赛问 题。
地理分析:户外广告、付费搜索评估
麦肯锡全球研究机构发布,认为 大数据是 创新、竞争和生产力的下一个前沿领域 ,
数据将会给社会带来更大的价值。
什么是半结构化/非结构化数据( Variety )
大数据与传统数据的差异( Variety )
传统数据主要来自于业务运营支撑系 统、企业管理系统等,比如财务收入 、业务发展量等结构化数据; 大数据主要来源于互联网、移动互联 网等,比如图片、文本、音频、视频 等非结构化数据。
淘宝达人
资深购物达人1000人 每日优质网评500篇
SNS营销平台(店铺主页+基于关系的口碑传播)
阿里集团(2/2)-面向外部用户的收费数据产品
大数据行业应用
契合度
值得关注行业 用户 应有特点与大 数据的契合度 及应用可能性 综合较高
大数据时代的背景
20世纪90年代,数据仓库之父的Bill Inmon就经常 提及Big Data。
2011年5月,在“云计算相遇大数据”为主题的EMC World 2011 会议中,EMC 抛出了Big Data概念。
什么是大数据?
6
大数据的4V特征
Volume (体量巨大)
数据量将增长几百倍 巨量数据存储技术 大部分是非结构化数据 非结构化数据处理技术
上网行为数据 视频文件
传统数据
客户资料 财务数据 订单数据 物资数据 产品数据 客户账单 ……
传统数据的数据量足够大时,我们也
把它称之为大数据,比如信令、DPI 数据等。
实时监控视频
结构化数据、非结构化数据定义:结构化数据是能够用数据库 二维表来逻辑表达的数据;其他为非结构化数据。
大数据
价值密度由高到低
大数据的时代背景
大数据时代的背景
半个世纪以来,随着计算机技术全面融入社会生活,信息爆炸已经积累到 了一个开始引发变革的程度。它不仅使世界充斥着比以往更多的信息,而且其 增长速度也在加快。互联网(社交、搜索、电商)、移动互联网(微博)、物 联网(传感器,智慧地球)、车联网、GPS、医学影像、安全监控、金融(银 行、股市、保险)、电信(通话、短信)都在疯狂产生着数据。
大数据的营销案例 一、未卜先知怀孕案例
关键环节二:数据模型建立 Andrew Pole想到了Target有一个迎婴聚会(baby shower)的登记表。 Andrew Pole开始对这些登记表里的顾客的消费数据进行建模分析,不久就 发现了许多非常有用的数据模式。比如模型发现,许多孕妇在第2个妊娠期 的开始会买许多大包装的无香味护手霜;在怀孕的最初20周大量购买补充钙、 镁、锌的善存片之类的保健品。最后Andrew Pole选出了25种典型商品的消 费数据构建了“怀孕预测指数”,通过这个指数,Target能够在很小的误差 范围内预测到顾客的怀孕情况,因此Target就能早早地把孕妇优惠广告寄发 给顾客。
Target取得的成就: 根据Andrew Pole的大数据模型,Target制订了全新的广告营销方案, 结果Target的孕期用品销售呈现了爆炸性的增长。Andrew Pole的大数据分 析技术从孕妇这个细分顾客群开始向其他各种细分客户群推广,从Andrew Pole加入Target的2002年到2010年间,Target的销售额从440亿美元增长到 了670亿美元。
大数据的4V特征
体量Volume
非结构化数据的超大规模和增长 • 占总数据量的80~90% • 比结构化数据增长快10倍到50倍 • 是传统数据仓库的10倍到50倍
多样性Variety
大数据的异构和多样性 • 很多不同形式(文本、图像、视频、机器数据) • 无模式或者模式不明显 • 不连贯的语法或句义
14
不同“看”数据的方式( Variety )
可视:结构化资料 15%
DB/DW
未视:半/非结构化数据 85%
主管们看的 战情数位仪表板 ,其实是残缺的 …
谁最先发现大数据的价值?

传统企业难以理解消费者

以新浪微博、facebook为代 表的互联网公司天然的了解 网民
海量数据早已涌现,但是从海量数据中挖掘价值,始于互联网公司!
远程病人监控
临床操作
临床决策支持系统
比较效果研究
预测建模
研发
疾病模式的分析
提高临床试验设计的统计工具和算法
大数据已经成为现代企业的核心竞争力
自身服务提升:亚马逊每天生成630万份订单,大数据帮助亚马逊提高 对客户的洞察力,随时跟踪用户需求变化。
识别客户 区分客户 快速适配
对外提供业务:淘宝每天活 跃数据量50TB,提供各种行 业分析报告(顾客的特征、 什么最好卖、行业的竞争对 手、广告投放的效果、我的 顾客的行为…..)
大数据的营销案例 一、未卜先知怀孕案例
关键环节三:建立和用户沟通渠道 那么,顾客收到这样的广告会不会吓坏了呢?Target很聪明地避免了这 种情况,它把孕妇用品的优惠广告夹杂在其他一大堆与怀孕不相关的商品优 惠广告当中,这样顾客就不知道Target知道她怀孕了
大数据的营销案例 一、未卜先知怀孕案例
塔吉特在和顾客沟通过程中采用了哪种营销方式 A:电子邮件 B:直邮 C:电话营销 D:数据库营销
大数据的营销案例 一、未卜先知怀孕案例
关键环节一:数据信息记录 一家零售商是如何比一位女孩的亲生父亲更早得知其怀孕消息的呢?每位 顾客初次到塔吉特刷卡消费时,都会获得一组顾客识别编号,内含顾客姓 名、信用卡卡号及电子邮件等个人资料。日后凡是顾客在塔吉特消费,计 算机系统就会自动记录消费内容、时间等信息。再加上从其他管道取得的 统计资料,塔吉特便能形成一个庞大数据库,运用于分析顾客喜好与需 求。 每个ID号还会对号入座的记录下你的人口统计信息:年龄、是否已婚、是 否有子女、所住市区、住址离Target的车程、薪水情况、最近是否搬过 家、钱包里的信用卡情况、常访问的网址等等。Target还可以从其他相关 机构那里购买你的其他信息:种族、就业史、喜欢读的杂志、破产记录、 婚姻史、购房记录、求学记录、阅读习惯等等。乍一看,你会觉得这些数 据毫无意义,但在Andrew Pole和顾客数据分析部的手里,这些看似无用 的数据便爆发了前述强劲的威力
相关主题