大数据与云计算的区别与关系胡经国一、大数据与云计算的区别大数据与云计算是两个有着本质区别的科学概念和范畴。
它们主要在其定义和特点(特性或特征)以及体系架构、理论技术、服务模式和应用领域等方面都具有本质的区别。
对此,本文作者已经或将要作专文论述,在此仅例举一二。
1、定义区别根据著名的麦肯锡全球研究所给出的定义,大数据是指一种规模大到在获取、存储、管理、分析方面大大超出传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低4大特征。
而云计算则是指一种基于互联网的计算模式;通过这种模式,共享的软硬件资源和信息,可以按需求提供给计算机和其他设备。
2、定义范围区别从二者的定义范围来看,大数据要比云计算更加广泛。
大数据这一概念从2011年诞生以来,已历经8个年头。
中国从积极推动两化融合到深度融合,也有14年之久。
再者,从各地纷纷建设大数据产业园可以看出,中国极其看重大数据的发展契机。
3、作用区别云计算改变了IT,而大数据则改变了业务。
当然,大数据必须有“云”作为基础架构,才能得以顺畅运营。
4、目标受众区别云计算是CIO(Chief Information Officer,首席信息官——一种新型的信息管理者)等所关注的技术层;而大数据则是CEO(Chief Executive Officer,首席执行官)所关注的业务层产品。
二、大数据与云计算的关系1、大数据与云计算的关系概述通常,人们把大数据与云计算的关系比着一个硬币的两面。
云计算是大数据的IT基础,而大数据则是云计算的一个杀手级应用。
云计算是大数据成长的驱动力;而另一方面,由于数据越来越多、越来越复杂、越来越实时,因而就更加需要云计算去加以处理。
所以,二者之间的关系是相辅相成的。
30年前,存储1TB数据的成本,大约是16亿美元。
如今,1TB数据存储到“云”上,只需要不到100美元。
但是,存储下来的数据,如果不用云计算进行挖掘和分析,那么就只是僵死的数据,没有太大价值。
目前,云计算已经普及并成为IT行业的主流技术。
其实质是在计算量越来越大以及数据越来越多、越来越动态、越来越实时的需求背景下被催生出来的一种IT基础架构和商业模式。
个人用户将文档、照片、视频、游戏等海量数据上传到“云”中永久保存。
企业客户根据自身需求,可以搭建自己的私有云,或托管、或租用公有云上的IT资源与服务。
这些都已经不是什么新鲜事。
可以说,“云”是一棵挂满了大数据的“苹果树”。
2、大数据需要云计算技术⑴、大数据与云计算密不可分如上所述,从技术上看,大数据与云计算的关系就像一枚硬币的正反面一样密不可分。
大数据必然无法使用单台计算机进行处理,必须采用分布式计算架构。
它的特色在于对海量数据的挖掘。
但是,它必须依托云计算的分布式处理、分布式数据库、云存储和/或虚拟化技术。
而且,大数据不采用随机分析法(抽样调查)这样的捷径,而采用对所有数据(海量数据)进行分析处理的方法。
大数据常常与云计算联系在一起。
因为,实时的大型数据集分析,需要分布式处理框架来向数十、数百或甚至数万台电脑分配工作。
可以说,云计算充当了工业革命时期的发动机的角色,而大数据则是电。
云计算思想的起源是麦卡锡在20世纪60年代提出的:把计算能力作为一种像水和电一样的公用事业提供给用户。
如今,一种行之有效的模式出现了:云计算提供基础架构平台,而大数据应用则运行在这个平台上。
业内人士像这样形容这两者的关系的:没有大数据的信息积淀,云计算的计算能力再强大,也难以找到用武之地;而没有云计算的计算能力,则大数据的信息积淀再丰富,也终究只是“镜花水月”。
⑵、大数据需要的云计算技术那么,大数据到底需要哪些云计算技术呢?举例来说,比如虚拟化技术,分布式处理技术,海量数据的存储和管理技术,非关系型数据库、实时流数据处理、智能分析技术(类似模式识别以及自然语言理解)等。
大数据与云计算两者相结合之后会产生如下效应:可以提供更多基于海量业务数据的创新型服务;通过云计算技术的不断发展降低大数据业务的创新成本。
3、大数据处理需要云计算技术配合人们研究大数据,或是利用大数据技术,其战略意义并不在于是谁掌握了多么庞大的大数据信息,而是在于谁能否将已经捕捉到的那些含有一定意义的海量数据通过专业化处理,将其变成一种数据信息资产。
这正是大数据分析所要达到的真正目的。
谁都不能否认,也不可能被否认,大数据既是一种科技,也是一种资产。
既然大数据是一种资产,那么如何利用大数据这种资产最终实现盈利,才是运用大数据的关键。
可是,将大数据加工成为有增值的资产,并不是一件轻而易举的事情。
⑴、大数据分析处理离不开云计算技术从某种观点上看,没有云计算技术,就不没有大数据的分析处理和利用。
大数据技术与云计算技术的关系,就像是一只手的手心和手背,是绝对密不可分。
因为,分析处理大数据是无法用某一台计算机来完成的。
它必须需要采用计算机分布式架构。
处理大数据的特色,就在于对那些海量数据进行分布式数据挖掘。
但是,这种分布式大数据挖掘,还必须依托计算机分布式处理。
因为,计算机分布式数据库或是云存储以及计算机虚拟化技术,可以支撑起对大数据相关技术处理的能力。
⑵、云计算技术将大数据处理变为现实大数据蕴含的资产性质,通过云计算技术得到了实实在在的验证。
由此而引出来的效果,就是让很多人都对大数据有了更多的关注或重视。
比如专家认为,可以用大数据来形容某家公司所创造的那些大量非结构化数据和半结构化数据,但是不能将这些数据下载到关系型数据库中进行处理。
因为,这样会在分析数据中浪费较多的时间或是金钱。
专家主张,大数据分析必须要跟云计算技术紧密联系在一起。
只有这样,才能将大数据的价值变成资产性的价值,并将大数据处理真正变成一种现实。
4、大数据有助于进一步明晰云计算的价值大数据有助于进一步明晰云计算的价值。
在云计算这一概念刚被提出来的几年里,许多政府、企业、行业用户对其应用价值一直存在着疑虑。
然而,随着大数据异军突起,云计算的价值又一次受到公众的关注。
由于云计算帮助解决了大数据无法进行抓取、管理和处理的问题,给予了它不同以往的存储和计算能力,使得其结果获取更快速、分析更智慧。
可以预见,在未来云计算将成为大数据应用分析最活跃的舞台。
同样,大数据为云计算大规模与分布式的计算能力,提供了应用的空间,解决了传统计算机无法解决的问题,从而,进一步明晰了云计算的价值。
5、大数据与云计算的关系非比寻常大数据需要新的处理模式,才能具有更强的决策力、洞察发现力和流程优化能力,来适应海量、高增长率和多样化的信息资产。
大数据这个强大的数据库,拥有三层架构体系,包括数据存储、处理与分析。
简而言之,数据需要通过存储层先存储下来;之后,根据要求建立数据模型体系,进行分析产生相应价值。
这其中缺少不了云计算所提供的中间数据处理层强大的并行计算和分布式计算能力。
据了解,云计算的历史比大数据更加绵长。
它是继1980年从大型计算机到客户端服务器转变之后的一种巨变。
根据美国国家标准与技术研究院的定义,云计算是指一种按使用量付费的计算模式。
这种模式提供可用、便捷、按需的网络访问。
同时,进入可配置的计算资源共享池,即可快速提供资源,减少交互所需的步骤和时间。
云计算可以实现每秒10万亿次的运算;能够模拟核爆炸,分析市场发展趋势,预测气候变化等。
专家认为,云计算与大数据具有如同手心手背的关系,二者不可或缺,相辅相成。
没有大数据,云计算什么都不是;而没有云计算,则成就不了大数据。
由此可知,大数据与云计算之间的关系非比寻常。
无论在资源的需求上,还是在资源的再处理上,都需要二者共同运用。
这也难怪不少地区在做出相关产业规划时,都会同时推进大数据与云计算建设。
这也显示出,一方马虎必会影响另一方的发展。
因此,与其计较大数据与云计算之间怎么区分,还不如将它们规划在一起,让云计算为大数据提供强大平台,而以大数据分析得出的结论完成云计算的价值。
6、大数据成功应用依靠云计算大数据与云计算的关系在于,大数据的成功应用除了“大”,还有三个必要条件,即:实时在线、对事件的全面描述以及产生差异化的效果。
云计算使得这三个必要条件得以满足。
首先,云计算使人们可以随时随地使用存储和计算,使大量数据得以及时被采集和分析。
手机上APP 应用云的服务,就是一个云计算的例子。
由于存储和计算成本的降低,云计算起到了实时在线的作用。
从而,使得更多的人愿意使用云服务,大数据的“雪球”由此可以滚动起来。
云计算的另一个好处,是可以实现大规模的数据整合。
当今世界并不是为了大数据应用而准备的。
因为,大量数据集散落在不同地方,以不同方式存放,其拥有者也是不同的人。
在云计算条件下,很多大规模数据整合的问题都会得到解决。
当大家数据放在一起时,数据整合的门槛会大幅降低。
因此,大数据也会像核聚变一样,产生成倍的效果。
将大数据的应用比作一辆辆“汽车”,支撑起这些“汽车”运行的“高速公路”就是云计算。
正是云计算技术,在数据存储、管理与分析等方面的支撑,才使得大数据有了用武之地。
由此可见,没有互联网就没有云计算,没有云计算模式就没有大数据处理技术。
云计算时代会有更多的数据存储于“云端”。
数据是资产,“云”是数据资产保管的场所和访问的渠道。
7、大数据与云计算的关系会越来越密切如果再找一个可以跟大数据并驾齐驱的IT热词,云计算无疑是跟大数据关系非常密切的一个词语。
很多人在提到大数据的时候总会想到云计算。
虽然大数据与云计算并不是一个东西,但是二者之间有着千丝万缕的关系。
云计算相当于我们的计算机和操作系统,将大量的硬件资源虚拟化之后再进行分配使用;而大数据则是我们要处理的数据。
云计算是大数据的处理器的最佳平台。
云计算与大数据密切结合是二者未来共同发展的一大趋势。
这种发展趋势将使二者的关系越来越密切。
2019年9月11日编写于重庆2019年9月17日修改于重庆。