大数据——计算思维的前线
朱子卿17122812
(2017年12月23日)
文献信息
康路晨. 《一本书读懂大数据时代》.民主与建设出版社, ISBN 978-7-5129-0562-6, 2015.4
文献概述
本书主要从大数据的诞生发展历史、相关技术、处理大数据的一般思维(主要为计算思维)、生活中的应用实例、大数据的价值及其利弊等多个方面介绍了大数据时代。
主要为有关大数据的概念普及与有关应用案例的详解,是一本普及大数据基本知识的书。
收获体会
因为书籍体量较大,故以精读“处理大数据的思维”部分为主、略读本书其他部分为辅的方式阅读了这本书,了解到了大数据时代的一些特征以及计算思维在大数据处理方面的一些应用,以下为收获和体会:
(一)大数据的特征
1.巨大:大数据的定义即无法在一定时间内用常规方法抓取管理或处理的数据。
大数据顾其名而思其意,便是数量巨大的数据。
2.体量类型繁多:信息时代,社会的每一个角落都在不断产生着各种各样的数据,这些数据各不相同,类型繁多,因而十分复杂。
3.价值密度低:不同于传统数据,大数据因其庞大复杂的特征因而难以用一般手段挖掘其价值。
4.时代性:大数据之所以大,是因为随着社会发展,数据产生的速度不断加快,这个过程是从古至今都有的,而大数据时代之所以最近才诞生,则是因为科学技术的进步,计算机互联网引导的信息技术的迅猛发展,我们处理数据的能力不断提高,因而巨量的数据才有了价值,对大数据的研究与利用才能成为一个时代性的主题。
(二)计算思维在大数据时代的应用
计算思维在大数据领域的应用主要有四个方面:
一是模型化,程序化的思想。
面对复杂庞大的数据,对大数据价值的挖掘必须化繁为简,去粗存精。
一般的大数据处理模式是“获取→储存→分析→利用→再获取”的循环,在获取时抓取有潜在价值的数据,分析中找出数据之间的相关性并提炼出有价值的一些信息,再利用这些信息更好的指导实践,并运用这些信息改进获取数据的方式,如此反馈循环,达到高效率地处理大数据的目的,这种程序化模型化的思想是一种典型的计算思维。
二是抽象化,简单化的思想。
现实中的各种事物之间相互作用影响,故产生
的数据之间的关系也十分复杂,若按照传统数据处理方法探寻数据之间的因果关系则十分繁杂缓慢,而大数据思维则摈弃了对因果关系的探求而重点关注数据间的相关性通过把由各种复杂因素产生的数据看成一些简单的对象,通过对比、分类的方式来获取其背后的价值,这种抽象化,简单化的思想也是一种典型的计算思维。
三是数据化,量化的思想。
大数据思维认为万事万物的特征皆可被量化,通过估算,数据化的一些手段,可以把一些感性的对象或者难以收集的数据利用起来,得到传统手段难以发掘的价值。
四是人工和计算机合作处理问题的思想。
庞大的数据光靠人工根本无法分析,而仅凭机械的工作也难以得出有价值的信息,故将人的决策和战略思维与计算机强大的计算功能结合起来,大数据才得以成为价值雨与财富。
以上就是我这两周阅读此书所得到的收获。