我们正处在一个信息大爆炸的年代,主要表现在大量信息的产生并以数字化的方式被记录下来。
信息技术的普及造就了信息大爆炸的年代。
大量的信息可以帮助人们更好地决策;但是同时因为信息太多了,如何找到有用的信息又变成了一件难题。
这里,啤酒与尿布的故事就给了我们很大的启发。
沃尔玛拥有世界上最大的数据仓库系统,为了能够准确了解顾客在其门店的购买习惯,沃尔玛对其顾客的历史购物行为进行购物篮分析,想知道顾客经常一起购买的商品有哪些。
沃尔玛数据仓库集中了其各门店的详细原始交易数据,在这些原始交易数据的基础上,沃尔玛利用数据挖掘方法对这些数据进行分析和挖掘,却有了一个意外的发现:婴儿尿布和啤酒有很高的相关度,即跟尿布一起购买最多的商品竟然是啤酒!这是数据挖掘技术对历史数据进行分析的结果,反映数据内在的规律。
接着,沃尔玛派出市场调查人员和分析师对这一数据挖掘结果进行调查分析。
经过大量实际调查和分析,揭示了一个隐藏在尿布与啤酒背后的美国人的一种行为模式:在美国,一些年轻的父亲下班后经常要到超市去买婴儿尿布,而他们中有30%~40%的人同时为自己买一些啤酒,产生这样的原因是:美国的太太们常叮嘱她们的丈夫下班后为小孩买尿布,而丈夫们在买尿布后又随手带回了他们喜欢的啤酒。
按常规思维,尿布与啤酒风马牛不相及,若不是借助统计学上的数据挖掘技术对大量交易数据进行挖掘分析,沃尔玛是不可能发现数据内在这一有价值的规律的。
数据挖掘是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。
这一过程也是质量管理体系的支持过程。
在实用中,数据分析可帮助人们作出判断,以便采取适当行动。
数据挖掘的应用之一就是关联规则,通过对大量数据的分析,找到两个或几个总是同时发生的事件。
所以我们可以看到统计学的应用正是用数据挖掘价值的最强有力的工具!
然而,书中还提到了这样的故事,是说关联的时效性:有些关联只发生在特定时间。
7-11便利店,某位员工订货错误,酸奶从3瓶变为30瓶,为了完成销售,将酸奶拿到面包盒饭陈列区,销售一空。
从此7-11便将酸奶与快餐搭配陈列提高销量。
这就是带有时效性的商品关联,如果不及时关注,一天的酸奶销售量很快就
会被一个星期,一个月的销量所平均,从而无法发现规律。
另一个故事是说某海滨地区的7-11便利店发现周末上午切片面包脱销,按照常识,认为是旅游人士购买,或者是家庭当做早餐,便利店应该丰富切片面包种类,实际观察发现,购买者用于钓鱼当做鱼饵,所以便利店特地开发了廉价切片面包。
这又为我们阐述了统计学非常有用但不是万能的的重要观点。
所以数据挖掘不能替代现场观察,任何时候都要有现场第一的工作态度,眼见为实,不要轻易被数字所欺骗。
另外,我们也可以考虑其他形式的关联,比如天气与商品的关联,温度与商品的关联,
一位资深海外统计学家说过,统计就和柴米油盐酱醋茶一样,存在的时候并不是很突出,一旦不见了,人生就是黑白的。
就像我们购物时拿到的购物小票,我们通常会把它丢掉,但这上面的数据对于商场的却是一笔不可忽视的财富。
这足以可见统计学的重要性。
那么统计学能够为社会带来什么呢?我们可以如何利用统计知识带来更高的效益呢?
首先,就拿我喜欢的篮球来说吧。
篮球运动中也可以利用数据挖掘获得效益。
NBA 新任总裁亚当-萧华在2014年为每座球馆都装上了摄像机来测量每个球员的每个动作,了解各个球员的优势和薄弱点。
这些悬挂在球馆顶部的跟踪摄影机可以捕捉球员场上的移动数据,生成了数千兆的数据资料,这些数据对于录像师和训练师来说就是潜在的至关重要的情报信息,利用这些数据做出最好的决策、打法、球员安排等。
通过扩大大数据算法、机器学习技术的应用和新视觉呈现方法的设计,来把数据转化为有价值的信息,让教练甚至普通的观众都能够看懂,最后帮助优秀的团队获得胜利。
另外,我平常会在淘宝上买一些化妆品和服饰。
淘宝网店也使用了数据挖掘提高利润。
卖家可以在用户的评论中寻找真实有用的信息作为参考,当这样的意见占多数时,卖家就需要考虑对自己的产品等方面进行改善。
根据淘宝网庞大的数据库,可以获得会员对各类商品点击量的数据,经分析可以知道买家的偏好,并以此对他们进行这些偏好物品的定时提醒,刺激购买,同时唤醒激活一些沉睡会员,为淘宝平台带来更多用户。
淘宝数据帮助店主了解行业状况?目标群体在哪?年龄结构?性别构成?上网时间?购买时间?淘宝店主通过对于自己销售的产品
的特性与这些信息结合,设置首页的滚动宝贝,选择其中的黑马宝贝打造爆款。
利用数据关联分析套餐促销。
其次,转化率是店铺运营的重要数据指标,让顾客不仅看,还要购买,所以需要优化流量组成来源,提高转化率高的流量。
第三,对购买客户的信息资料进行归纳分类,分析客户性别、年龄段、作息时间、购买习惯、购买方式、购买途径、居住地区分析出一般客户、重要客户、黄金客户属性特点,降低促销成本。
第四,寻找重复购买的客户,向这些人推销主打品或热销品。
以上都是对于卖家在销售过程中的数据分析与利用,然而数据分析并不只能在此处有所利用。
通过每一时间段的销售数据,卖家可以预测销售量。
库存数量、库存周期以及资金流转周期等,避免货物囤积,资金流转困难等问题。
统计学的数据来源于生活中的每一个小细节,这就要求我们善于观察。
就像沃尔玛的创始人一样,不断去发现一些微小却意义重大的细节并对其进行研究。
统计学的应用同时也依赖于科学技术。
技术工具的发展为统计学的应用提供了可靠有效的技术支持。
使得出的信息更可靠,更有利用价值。
最后一点要说的,就是不能盲目模仿。
在其他国家成功的案例在我们国家只能够作为参考依赖种种技术,Netflix将巨大的数据池变为生产力,根据数据技术推导出《纸牌屋》的关键要素,喜欢BBC剧、大卫·芬奇和凯文·史派西的用户存在交集,用1亿美元买下一部早在1990年就播出的BBC电视剧《纸牌屋》的版权,请来导演大卫·芬奇(David Fincher),并由老戏骨凯文·史派西(Kevin Spacey)担当男主角。
Netflix孤注一掷,最后置之死地而后生,备受关注。
它用事实告诉资本市场,数据不是花架子,而是地道的生产力。
Netflix的故事,对于中国视频网站而言着实励志。
他们与Netflix所面临的境遇相似。
由于版权价格提升,国内知名的视频网站们,诸如优酷土豆、搜狐视频、乐视网、爱奇艺近两年也纷纷打造自制剧。
关键是如何制作自制剧?国内视频网站意识到数据的重要性,也积累了大量数据。
比如乐视网通过分析用户收看时间,在今年推出午间自制剧场。
此外,即便是有了数据,中国的流媒体公司还不敢像Netflix那样将宝押在一部剧上,因为中国的付费市场尚未成熟,目前还主要依赖广告盈利,无法完全将用户需求作为中心。
除此以外,一位视频行业的人士指出,在中国基于用户数
据做出分析的同时,还要考虑广电审核的要素,一些领域与题材类型都要稍微收拢,
啤酒与尿布效应带来不可思议的基础是统计学,大数据时代,各类数据就像是矿藏一样蕴藏无限的价值,但是如果人们不使用工具将其开采提炼,他就失去了价值。