当前位置:文档之家› 《大数据时代》读书笔记

《大数据时代》读书笔记

“凡是过去,皆为序曲”
《大数据时代》读书笔记
2014年2月20日 sunjinshuang
各章节内容摘要与感想
第一部分大数据时代的思维变革
1.不是随机样本,而是全体数据--更多
通过GOOGLE预测流感流行趋势和Farecast系统预测机票价格等例子说明了大数据时代分析数据立足于海量数据分析的重要性,而非传统的取样分析,并且阐述了在很多领域曾经不被重视的混杂数据在大数据时代而产生了新的商业价值的案例,只有从思想上改变了原始的数据分析方法,重视大数据思维方式,才能更好的发现生活中更具价值的信息和商机。

2.不是精确性,而是混杂性--更杂
在“小数据”时代,采样最基本、最重要的要求就是减少错误,保证质量,因为收集的信息量较少,所以要保证记录下来的信息要尽量精确。

但在大数据时代,很多时候数据的量变会产生质变,如果依然沿用以前的分析方法,可能会和更多有价值的信息失之交臂,只有容忍不精确性,拥抱混杂性,以一种高屋建瓴的思维方式跳出传统思维模式,才有可能发现更多平凡数据中隐藏的“宝藏”。

3.不是因果关系,而是相关关系--更好
知道“是什么”就够了,没必要知道“为什么”。

在大数据时代,我们不必知道现象背后的原因,而是要让数据自己“发声”。

本节通过列举了亚马逊网站的书评团队输给图书推荐系统、蛋挞与飓风用品捆绑销售、客户购买行为与怀孕预测、纽约沙井盖与爆炸事故预测等众多经典案例来阐述在生活中很多时候我们并不需要寻找事物之间的因果关系,而只要知道了相关关系就足够给我们的生活和工作带来有价值的信息,人们必须转变在以往的日常生活中,习惯性地用因果关系来考虑事情的思维,才能在大数据
时代更好的认知自己和这个世界。

第二部分大数据时代的商业变革
1.数据化:一切皆可“量化”
“数据”(data)一词在拉丁文里是“已知”的意思,也可以理解为“事实”。

信息化的发展其实就是一场逐渐将世界转化为数据的革命,在将世间万物运转过程中所“散发”的特征量化为数据的过程中,其所具有的的商业价值也就如泉水般源源不断的涌现出来,文中莫里的航海导航图的研制和日本教授通过研究司机不同坐姿的臀部经压力传感器数据化后所孕育出的新型产业链,着实让人眼前一亮,大呼数据化研究的不可思议。

如今的信息技术变革重点在“T”(技术)上,而不是在“I”(信息)上。

现在,是时候把聚光灯打向“I”,开始关注信息本身了。

2.价值:“取之不尽,用之不竭”的数据创新
节选:
我们所处的时代之所以与众不同,是因为数据的收集不再存在固有的局限性。

技术已经发展到一定程度,大量信息可以被廉价地捕捉和记录。

数据经常会得到被动的收集,人们无需投入太多精力甚至不需要认识这些数据。

而且,由于存储成本的大幅下降(在过去的50年中,数字储存成本大约每2年就削减一半,而存储密度则增加了5000万倍),保存数据比丢弃数据更加容易。

这使得以较低成本获得更多数据的可能性比以往任何时候都大。

不同于物质性的东西,数据的价值不会随着它的使用而减少,而是可以不断地被处理。

这就是经济学家所谓的“非竞争性“的好处:个人的使用不会妨碍其他人的使用,而且信息不会像其他物质产品一样随着使用而有所耗损。

数据就像一个神奇的钻石矿,当它的首要价值被发掘后仍能不断给予。

它的真实价值就像漂浮在海洋中的冰山,第一眼只能看到冰山的一角,而绝大部分都隐藏在表面之下。

3.角色定位:数据、技术与思维的三足鼎立
从商业角度描绘了大数据价值链的三种角色定位:
•基于数据本身的公司
•基于技能的公司
•基于思维的公司
并依此讲述了3种定位不同的公司的核心竞争力、未来发展前景和商业模式的转变所带来的新的挑战和商机。

作者对未来公司体系结构和经营模式有了大胆的设想,认为大数据是决定未来企业的核心竞争力,对各个行业将会起到决定性的影响,谁首先掌握了大数据技术和思维,进行了深入的变革,谁就会最先受益并在此后的竞争过程中遥遥领先。

文中的一个观点让人印象颇深:“行业专家和技术专家的光芒都会因为统计学家和数据分析家的出现而变暗,因为后者不受旧观念的影响,能够聆听数据发出的声音“。

第三部分大数据时代的管理变革
1.风险:让数据主宰一切的隐忧
2.掌控:责任与自由并举的信息管理
最后一章主要是讲大数据时代的到来带来的个人隐私、公共安全、司法公正方面的风险问题,通过数据的公开和共享,个人信息将越来越容易被利用,个人隐私的保护将变得不堪一击。

甚至通过大数据分析预测,将将要犯罪之人绳之以法所面临的道德风险问题,一一进行讨论分析。

但就如核工业技术和生物工程学领域的发展一样,人类总是先创造出可能危害自身的工具,然后才着手建立保护自己、防范危险的安全机制,在这方面,大数据也和其他领域的新技术一样,机会的到来也伴随着风险。

但作者也在书中讨论了应该如何建立一种安全的机制去管控不可预知的风险问题,甚至设想了一种新的职业--“大数据算法师”,对数据利用的风险进行评估和提供相关分析算法的解决方案这一职业进行了描绘。

虽然大数据技术和思想能帮助我们更好地进行已有的工作,但大数据也并非万能的,人类的创造力、直觉、天赋和灵感远非机器所能取代。

大数据为我们提供的不是最终答案,只是参考答案。

相关主题