当前位置:文档之家› 浅析大数据时代的数据安全问题

浅析大数据时代的数据安全问题

浅析大数据时代的数据安全问题
作者:沙蕊
来源:《经营管理者·上旬刊》2016年第10期
摘要:随着云时代的来临,大数据(big data)也吸引了越来越多的关注。

数据量在迅速增长,大数据时代已经到来,同时,数据安全问题不可避免的已经成为了人们所共同关注的问题。

关键词:大数据数据安全措施
物联网、云计算、移动互联网等新技术的发展,使得智能手机、平板电脑、计算机及遍布地球各个角落的传感器,成为数据来源和承载方式。

根据估算,互联网的数据量呈现每两年翻一倍的速度增长,大数据时代已经到来。

然而这些数据中“非结构化数据”占据很大比例,往往不能被传统的数据库所采用,但是,这庞大的数据仍旧是我们所珍惜的“宝藏”,或许未来的某一天它们将会成为“新石油”。

大数据的发展将进一步扩大信息的开放程度,这样导致了隐私数据或敏感信息时常出现泄露,使得用户数据得不到安全保障,因此如何保障数据安全,并与大数据发展的新特点、新挑战相适应,是我们需要研究的课题。

一、大数据的相关知识概述
大数据(big data),或称巨量资料,指的是所涉及的资料量规模巨大到无法通过目前主流软件工具,在合理时间内达到撷取、管理、处理,并整理成为帮助企业经营管理决策更积极目的的资讯。

大数据具有以下几个基本特征:
1.数据体量巨大。

大数据时代,无论是传感器、移动设备,还是智能终端和网络社会等都在无时不刻的产生数据,数量级别由最早的TB发展至PB,甚至是ZB,统计数据量成千倍级别上升。

据统计,2015年全球產生了接近8ZB的数据量,预计到2020年全球以电子形式存储的数据量将达到40ZB。

而在2015年年底,根据互联网数据中心的统计全球数据量已经达到了7910EB。

如果将这些数据都刻在DVD上,那么把这些DVD碟片堆叠起来就可以从地球到月球6个来回还要多。

2.数据类型多样。

当前大数据的发展不仅在数据量上呈现出快速增长的态势,在数据类型多样上也越发丰富。

根据数据类型多样性的特点可大致上分成结构化数据和非结构化数据。

过去数据多以二维结构呈现,但随着互联网、多媒体等技术的快速发展和普及,视频、音频、图片、邮件、HTML、RFID、GPS和传感器等产生的非结构化数据已经占据了数据总量的80%以上,而这些多类型的数据需要更高要求的数据处理能力。

3.产生价值密度低。

分析大数据的最终目的是获取价值。

大数据本身类似于“金矿”,通过人们的融合分析可以从中获取意想不到的价值信息。

尤其是目前商业的竞争日益激烈,许多企
业都将数据视为自身不可缺少的新资产,都在试图追求数据的最大化价值。

然而,真正有价值的数据密度一般很小,为了寻找到有价值的数据,人们需要在海量的数据中挖掘分析。

例如一段时长1个小时的监控视频,其中有用的数据可能仅占一两秒。

4.云计算为大数据提供实时应用环境。

面对大数据时代的到来,云计算从容应对,是信息化发展的必然趋势。

云计算为大数据提供最基本的生存基础,降低了大数据管理的复杂度,为大数据提供实时应用环境。

基于云计算的大数据框架,利用集群的威力高速运算和存储,实现了一个分布式运行系统,以流的形式提供高传输率来访问数据,适应了大数据的应用程序。

而且,随着数据挖掘、语义引擎、可视化分析等技术的发展,人们可从海量的数据中深度解析、提取信息,掌控数据增值的“加速器”。

二、大数据的安全问题
1.大数据加大隐私泄露问题。

大量数据的汇集、集中存储更容易成为被发现或攻击的目标。

对于某些敏感数据的使用权和所有权缺乏明确界定。

个体隐私问题未加入到大数据分析的规则中,加大了用户隐私泄露的风险。

2.云计算数据隔离和访问控制问题。

不同用户的虚拟机之间、不同用户之间产生隔离、访问权限控制保护要求。

安全防护手段的更新升级速度需要与数据量非线性增长步调一致,方可保障大数据的安全。

3.大数据成为APT攻击目标和载体。

APT是黑客以窃取核心资料为目的,针对客户所发动的网络攻击和侵袭行为,具体很强的针对性、计划性、潜伏性和持续性。

大数据挖掘和分析技术更容易被黑客利用成为攻击手段,更容易获得更准确信息,发起攻击机会更多。

大数据价值的低密度特性使安全服务的分析变得更困难,传统的实时检测技术更难聚焦。

近年来,通过在互联网上发生的用户账号信息失窃等连锁反应,黑客将目标盯上了大数据,黑客的攻击造成数据量的失窃更加巨大。

三、大数据的安全措施
1.大规模电子文档加密及密钥管理。

在大规模电子文档一个文档一个密钥的加密保护过程中,海量数据催生出海量密钥。

在电子文档高并发、高速随机访问过程中,为了解决密钥生成、加密文件与密钥一致性、密钥长期存储、秒更新等问题,需要采用安全、有效的密钥分层和分级管理技术。

2.多租户云数据存储隔离。

通过为用户划分独立的逻辑存储区,来实现租户之间的数据隔离,提高租户私有数据的安全性。

当租户申请数据存储区时,通过调用运营商提供的存储软件接口,并根据用户ID标示,为用户划分特定的虚拟存储区域,每个租户的存储区域是相对独立的。

数据隔离技术同时提供密钥管理,支持租户对私有空间数据的加解密,并支持对租户私有空间的数据擦除,还可以在数据服务层利用数据服务接口对数据进行授权访问和异常检测。

3.云数据服务访问控制技术。

云数据服务访问控制技术可有效检测针对数据服务的内部攻击,过滤服务攻击行为,以防止服务被滥用和假冒调用,保障服务调用过程的安全和服务的可用性。

云数据服务访问控制技术,使用钩子技术拦截该数据服务请求,根据授权库和策略库中的安全策略,对数据服务请求进行鉴别与授权检查、协议符合性检查(服务参数合法性检查)、攻击过滤,并对数据服务请求进行统一的安全审计。

只有通过上述检查的数据服务请求,才能获取正确的数据并返回给相应的应用。

4.大数据安全态势智能分析。

大数据的数据访问伴随着海量的安全事件,如何向用户进行很好的展示以及挖掘大数据的内在价值是数据安全管理员面临的一项重要工作,也是体现数据安全管理中心的核心价值所在。

一是对数据从生产到销毁整个生命周期进行“全景式”复现。

数据安全引擎在执行过程中产生的审计事件,包括用户合法操作、非法操作,均被记录并上传到数据安全管理平台。

二是数据安全管理平台对所有事件进行分析、整理,形成单独数据个体的追踪数据流。

通过“从点到线再到面”的处理,以友好的图形界面展示,数据个体的生命周期流转轨迹都可以很方便地被查看、追溯。

针对整个数据平台可提供不同维度检索、统计。

三是管理平台内置数据分析组件,尅对热点数据进行整理、挖掘,如单个数据个体安全威胁是否会扩散到其他数据个体或整个数据平台,通过智能分析处理,可以给管理员提供建议。

当今,信息已成为国家和社会发展的重要战略资源。

大数据转化为信息和知识的速度与能力成为这个时代的核心竞争力之一,将直接影响国家安全和社会稳定。

大数据面临的数据安全问题不容忽视,只有安全措施到位时,大数据才可以真正成为这个时代的驱动力。

作者简介:沙蕊(1989-),女,2011年毕业于西北政法大学计算机技术专业,助理工程师。

相关主题