当前位置:文档之家› “大数据时代的海量存储”总结报告

“大数据时代的海量存储”总结报告

“大数据时代的海量存储”总结报告
经过几周的学习,我们逐渐了解了大数据时代的存储技术的发展,通过各小组的介绍,初步了解了各种存储器的原理、应用和发展历程。

这些知识也许不是那么精深,但对我们来说是一种启蒙,在学习这些知识的过程中,我们也学会了一种学习方法,这对我们未来的学习生活将会有莫大的帮助。

下面就针对这几周的学习,对所掌握的知识和自己的思考进行一个总结。

一、各存储介质
1.磁盘
磁盘的基础是一个个磁片,磁片里有扇区和磁道。

扇区是存储的最小单元,一
个扇区里只能存一个文件的数据,这意味着即使文件没有占用扇区的所有空间,
也不能存放其他文件了,而大的文件可能要占用多个扇区,因此在使用磁盘的
过程中,要经常进行碎片整理,使磁盘的空间能得到有效的利用。

磁道则是决
定磁盘存储量的因素。

一般来说,硬盘和软盘都是磁盘。

①软盘:由单片磁盘构成,存储量小,容易物理损坏,但作为最早的移动存储
介质,在历史上占有无法磨灭的地位,也为早期的文件转移提供便利。

②硬盘:由多个磁片组成,因此存储量大了许多,通过磁头将数据传输出去,
在计算机系统里属于外存,需要驱动器才能被识别和使用,能永久地
存储数据,在现阶段依然被广泛的运用在各个领域。

③移动硬盘:将硬盘小型化,通过USB接口与电脑连接,传输数据,相对U
盘来说,容量也大了许多,为当代生活提供了便利。

2.U盘
U盘,全称USB闪存盘。

它是通过识别浮动栅中电子的有无来判断二进制的0
和1,以此来存储数据。

因为它的电子可以长时间存在,所以数据可以保存在
U盘内。

因为U盘小巧轻便、价格便宜、存储量大、性能可靠,所以受到了欢
迎,成为当代移动存储介质中的重要一员。

不过因为技术和结构的限制,它在
电脑中的读写速度仍比不上移动硬盘,但抗物理损坏能力强于移动硬盘,算是
各有千秋,为人们的数据转移带来了方便。

3.固态盘
固态盘有两种,一种是基于闪存的,另一种则是基于DRAM。

用闪存作为介质
的固态盘一般擦写次数为3000次左右,而因为它的平衡写入机制,在实际运
用中,它几乎是可以无限利用的,读写速度又远超机械硬盘,所以现在大多数
笔记本电脑都将光驱的位置用来放置固态盘,使电脑性能得到了提高;而利用
DRAM的固态盘虽然速度也很快,但是需要一个独立电源来保存它里面的数据,
因此相对于前者来说,它有些不便,是一种非主流的固态盘。

4.光盘
光盘是用聚碳酸酯做成基板,通过激光烧录后来进行数据记录,虽然以现在的
眼光来看,光盘的使用有着种种不便,但是在以往为半结构化和非结构化的数
据的传输做出了巨大的贡献。

但近年来,大多数笔记本电脑放弃了光驱,换上
了固态盘,光盘也逐渐退出了历史的舞台。

二、海量存储器
1.磁盘存储阵列
这是通过将大量磁盘组合在一起,并进行分组,从而满足人类对大量数据的存
储需求。

各个磁盘会组合成RAID阵列,根据不同的需求,可以组合成不同功
能的阵列,使得阵列更为可靠,比如说RAID 0,RAID 1,RAID 0+1等。

同时,
它也具有多个借口,这大大提高了数据传输的速度。

它也是大数据时代的存储
基础,也使得计算机的计算性能得到了充分的利用。

2.存储服务器
这是为特定目标而设计的服务器,因此会有一些与常规服务器不同的配置。


具有比一般服务器更多的内部磁盘,也会具有一些特殊的功能,如存储管理软
件、高灵活性的额外硬件、更多的网络接口等,以便于用户进行数据管理和数
据传输。

3.DAS
DAS即开放系统直连式存储,通过服务器的主机操作系统进行数据的IO读写
和存储维护管理,为企业的数据管理带来了很大的帮助。

但是,随着数据量的
逐渐增大,它的局限性逐渐体现出来,在数据的备份和维护方面,当数据量达
到数百GB后,管理员的维护工作越来越难以完成,对硬件的要求也越来越高。

而且直连式存储与服务器主机之间靠SCSI通道连接,SCSI的ID是有限的,这
一点也局限了DAS的功能。

4.NAS
NAS指网络附属存储,也成为“网络存储器”,它是一种专用数据存储服务器,
在局域网上占有自己的节点,其他设备通过网络进行访问和数据管理。

它以数
据为中心,将存储设备和服务器分离,从而集中管理数据,释放带宽、降低成
本、提高效率。

它还支持多种计算机平台,使它的使用更加便利。

可是因为接
在网络上,所以它的速度会受到网络流量的影响,在有些时候会有不利之处。

5.SAN
SAN指存储区域网络,它是通过FC交换机,将服务器和存储设备连接起来,
建立的一种专用存储网络。

它的网络是专为存储建立的独立于TCP/IP协议的专
用存储网络,因此传输速度很快,一般可以达到2GB/S到8GB/S,大大提高了
效率。

同时通过交换机,它可以连接任意的存储设备和服务器,扩展性极佳。

而且SAN采用了光纤接口,传输速度快,且光纤最高可达十公里,这样使得物
理上分离的设备能得以连接,这是很大的一个优势。

虽然光纤信道的架构成本
较高,但它在企业级数据管理方便仍有巨大的优势,未来前景较好。

三、虚拟存储
虚拟存储是指将多个不同类型、独立存在的物理存储体,通过软、硬件技术,集成转化为一个逻辑上的虚拟的存储单元,集中管理供用户统一使用。

这个虚拟逻辑存储单元的存储容量是它所集中管理的各物理存储体的存储量的总和,而它具有的访问带宽则在一定程度上接近各个物理存储体的访问带宽之和。

在进行作业的时候,我们可以将部分作业装入主存,另一部分放在磁盘里,当需要时再将其余部分放入主存,使得我们在一定程度上可以摆脱一定要编写小于主存容量的作业的限制。

其实,它就是一种逻辑存储器,使得系统的带宽得到了很大的提高,容量也得以增大,方便了我们的作业。

四、云存储
云存储是在云计算概念上延伸和发展出来的一个新的概念,是一种新兴的网络存储技术,它将大量数据存储在大容量设备里,通过互联网提供服务,使得任何人能随时随地通过任意能连网的设备对数据进行处理。

这一技术使得存储管理可以
自动化和智能化,将所有资源整合在一起,提高了存储的效率和存储空间的利用率,未来可能主要应用在在数据备份、归档等方面,也为需要服务的用户带来了便利,降低了成本。

可是它也有一些不足之处,除了对网络带宽的消耗之外,存储在云端的数据在事实上是可以被管理员读取的,虽然有着操守和道德方面的制约,但仍不能保证用户的隐私能得到有效的保护;另一方面,如果服务器的安全性能不够好,用户的数据也可能会遭到黑客的盗取,对用户的权益造成侵害。

虽然它有着很好的未来前景,但这些方面也需要我们关注。

五、存储系统
1.文件系统
它是命名文件及放置文件的逻辑存储和恢复的系统。

通过它,我们才能在计算
机里对数据进行便捷地操作,具体地说,它负责为用户建立文件,存入、读出、
修改、转储文件,控制文件的存取,当用户不再使用时撤销文件等。

2.数据库系统
数据库由数据库管理系统统一管理,数据的插入、修改和检索均要通过数据库
管理系统进行。

它是适应数据管理需要而发展起来的一种系统。

一般来说,它
运行可靠,通过系统管理员的维护,使得数据库里的数据能被任何有权限的人
使用,提高了效率,从而降低了相关成本。

3.海量数据存储系统
它泛指非关系型的数据库,是伴随着大数据发展而诞生的,它的产生就是为了
解决大规模数据集合多重数据种类带来的挑战,尤其是大数据应用难题。

它不
同于传统数据库的架构,而是针对大数据时代进行了改变。

它拥有异步复制、无共享架构、弹性可扩展等特点,解决了当前的一些问题。

现在它的技术正在
逐渐发展,在未来也必然占有重要的地位。

六、个人总结
随着大数据的逐渐发展,新技术的逐渐出现,一些技术可能将会被淘汰,而有些设备和技术仍在其特定的领域发挥着作用。

从历史的角度来看,需求和技术是在共同发展的,而新技术可能是基于对以往技术的改进,也可能是一种新思维,那么我们就需要去广博的学习,去获取更多的知识。

以上知识虽然只是与大数据时代的存储相关的一些浅显的知识,但它就像第一块砖,有了它,我们才能继续进步,去逐步了解和学习与大数据有关的信息和知识,最后铸就大厦。

更重要的是,我们从这门课中学到的学习方法和思维方式,对未来也有着很大的帮助。

希望我能从这一小步开始,继续学习更多的知识。

2017年10月8日。

相关主题