在P2P系统支持数据保密P2P简介:P2P网络环境中,成千上万台彼此连接的计算机都处于对等的地位,整个网络一般来说不依赖专用的集中服务器。
网络中的每一台计算机既能充当网络服务的请求者,又对其它计算机的请求作出响应,提供资源和服务。
通常这些资源和服务包括:信息的共享和交换、计算资源(如CPU的共享)、存储共享(如缓存和磁盘空间的使用)等。
系统已经很成功的用于大规模数据共享。
然而,共享的敏感数据,如在在线社交网络,不适当的访问控制,可能对数据隐私造成不良影响。
数据可以被每个人都访问以及用于一切商业目的(例如,通过对数据主人的喜好或道德进行营销或其他一些活动)。
:希波克拉底数据库(HDB)提供了解决这个问题的有效方案,通过对隐私保护进行目的访问控制的整合。
7.1简介递给他人的权利。
根据OECD(经济合作与发展组织),数据隐私要包含以下几点:收集限制,目的规范,使用限制,数据质量,安全防护,公开性,个体参与性,责任性。
根据这些原则,我们强调目的规范性,它声明了数据拥有者可以指定他们的数据被收集,存取,使用的目的。
网络蓬勃发展。
许多社区利用在线社交网络分享专业和非专业的数据。
专业的在线社交网络如Shanoir。
它的设计是为了神经系统科学来存储,分享,搜索,显示神经影像数据。
或者如medscape,它的设计是为了医学社区分享医学经验和医疗数据。
当然,也有一些针对大众和业余爱好者的不同领域的非专业的在线社交网络,比如Carenity,它的设计是为了帮助医学研究。
另一个例子是DIYbio,它的设计是为了使生物学更易于接近,给普通科学家,生物学业余爱好者,生物工程师来分享他们的研究成果。
最著名的在线社交网络,Facebook,拥有数亿的用户,允许大量的朋友在他们之间分享各自各样的个人信息。
p2p,云计算承诺提供几乎无限计算资源(如CPU,存储,网络),可以提供给用户以最小的管理工作。
数据被存储在数据中心,是典型地非常大的服务器集群方案,通过基础设施供应商如亚马逊操作,谷歌和IBM操作。
(a)弹性,因为额外的资源可以被分配以处理不断增长的需求,(b)易于维护,这是由云提供者管理,(c)可靠性,得益于多个冗余站点。
这使云计算适合OLSNs。
(a)用户需要信任的提供者和他们的服务器,(b)供应商可以利用社区信息赚取利润(例如,分析,市场营销,广告);(c)用户可能会发现供应商审查他们的数据。
特别的,(a)很难实现,因为云存储可能被外包到其他供应商,产生连锁转包商,这是很难跟踪的。
p2p提供了一个完全分散化的基础设施。
非常流行的P2P应用的例子,可以在网络(例如,Skype的),搜索引擎(例如,YaCy),内容共享(例如,BitTorrent的)和OLSN中找到(例如,流散)。
P2P系统的特点:(a)分散存储和控制,所以没有必要信任一个特定服务器;(b)可用性和容错能力。
(C)数据可用性和可扩展性,即可存储和管理大量的数据,(d)自主性,可以随意加入和离开网络。
P2P的解决方案理论上是正确的解决方案。
对等体可以是参加者或协作组织,同时保持完全控制其(本地)数据和应用程序的完全可共享。
尽管有这些优势,P2P系统提供有关数据隐私的担保任然是有限的。
为此,P2P系统提出几个举措,以确保隐私安全,如OceanStore,Past和Freenet。
然而,这些解决方案仍然是不够的。
管理数据共享,对可信的用户的特定的目的和操作,在当前的P2P系统,如果不增加新的服务是不可能实现的。
数据库已将基于目的的隐私保护引入进来,这允许用户指定的他们的数据被访问。
适用于P2P系统的HDB可以带来强劲的保密性支持。
医生和科学家分享他们自己的医疗记录,科学家与患者和医生交流自己的研究成果。
如果他们的访问目的是为了在一个特定的疾病的研究那么科学家们就有机会获得病人的病历。
医生有机会获得研究成果,为自己的病人提供治疗。
在这种情况下,有必要产生新的P2P服务,防止用户披露,访问或破坏敏感数据,鼓励患者(科学家),根据他们的隐私分享他们的医疗记录(相应结果)。
7.2 P2P系统的数据隐私网络通常分为两大类:纯的和混合的。
在纯P2P网络中,所有的对等体是相等的并且它们可以分为结构化和非结构化的。
在混合P2P网络中,一些对等体作为其他一些对等体的专用服务器,并有特定的任务执行。
P2P覆盖在一个特设方式上且数据的放置与他们的组织形式完全无关。
每个对等体都知道它的邻居,但不知道他们拥有的资源。
许多流行的应用程序以非结构化网络运营,如Napster公司,Gnutella的,Kazaa的,以及Freenet。
在这些系统中,内容共享而无需从中央服务器下载。
P2P系统的初步研究出现了基于分布式哈希表(DHT方法)解决方案,其中散列函数的键值映射到每个对等体。
数据以键值对的形式存储。
P2P网络包含一些给其他对等体端提供的服务。
这些服务可以是数据索引,查询处理,访问控制,元数据管理等。
我们区分以下3种对等体:请求者:请求数据的对等体。
服务器:存储和提供数据的对等体。
拥有者:拥有和共享数据库的对等体。
7.2.1分布式数据存储系统的隐私问题一般,这些系统的用户需要以下隐私保证:数据存储:数据对业主可用。
数据保护,防止未经授权的读取:服务器不具备阅读它们存储的数据的能力。
数据抗的损坏删除保护:服务器不具备损坏或删除它们存储的数据的能力。
一个对等体不向其他拥有的数据的对等体提出要求。
past,OceanStore,Mnemosyne 是使用这些技术的系统的典型的例子。
Past是一个大型的,基于互联网,全球存储工具,它提供了可扩展性,高可用性,持久性和安全性。
它依赖于Pastry,并使用智能卡,自证明数据,以认证为基础的信任,以保护数据远离恶意服务器。
OceanStore是合作的基础设施,可提供一个一致的,高可用性的,耐用的安全存储工具。
它依赖于Tapestry和使用对称加密和访问控制技术来保护数据隐私。
Mnemosyne是一个提供高水平隐私的存储服务,它通过使用共享的分布式存储大量的隐藏数据。
它依赖于Tapestry,并使用隐写数据。
这使得保护数据免受恶意读取。
7.2.2海量数据共享系统的隐私海量数据共享系统主要是由这类用户在使用(a)想要分享数据的用户,(b)想要从该系统请求和下载数据的用户,(b)可能是这种系统被周知和使用的主要原因,特别是在多媒体文件分享上。
与数据存储系统的一个重要区别是,在大规模的数据共享方面数据被大量复制。
在这种类型的系统中,用户搜索数据和用户相关的隐私保证。
1.数据保密保证是:数据存储:数据提供给授权的所有者和请求者数据保护,防止未经授权的读取:服务器不具备阅读它们存储的数据的能力。
数据抗损坏、删除保护:服务器不具备损坏或删除它们存储的数据的能力。
一个对等体不向其他拥有的数据的对等体提出要求。
有限的披露:不提供给未经授权的请求者数据。
2.用户隐私的保证(通常称为匿名保证)有:用户不会在系统中被其他对等体监测。
用户的行为自由不受系统的限制。
用户免受身份盗用保护。
在大规模的数据共享系统中数据隐私保证类似于在分布式数据存储系统中,唯一的区别是有限披露。
正如前面所说,数据隐私可以通过如访问控制,信任管理,数据加密和数字校验技术来保护。
这里的差异是请求者的潜在数量。
另一方面,用户隐私可以得到保护使用不同的匿名技术。
然而,确保用户的隐私可能会导致数据隐私的不良影响。
用户希望保护他们的数据隐私,而剩下的行为匿名自由,从而增加侵犯他人的隐私数据的风险。
这个循环可能是我们在保证数据和用户隐私的系统里没有发现的主要原因。
保护数据隐私在海量数据共享系统中数据隐私可以用下面的系统图示。
办公共享点工作区,以前被称为的Office Groove,是一个设计团队(即工作区)内的文档协作用的桌面应用程序。
它是基于一个部分集中式P2P系统。
每个用户都有工作空间的私人编辑副本。
工作区的拷贝通过网络以P2P方式同步。
办公共享点工作区使用访问控制,信任和加密技术,以保护数据隐私。
Piazz是一个数据管理系统,使XML文档可以以分布式和可扩展的方式共享。
它是基于非结构化的P2P系统。
虽然Piazz的目标,重点是数据共享,而不是数据隐私,Piazz的创作者提出了新技术以一个受保护的形式发布一个数据,从而强制数据隐私。
OneSwarm是一个P2P服务,为用户提供了对他们的数据隐私的明确控制权,让他们决定如何将数据共享。
它依赖于BitTorrent和旨在提供隐私保护的数据共享。
为了保护数据隐私,OneSwarm使用非对称加密,访问控制,信任和沟通匿名。
其他系统解决审查问题,这可能对数据隐私产生影响,因为这是审查数据制度的一个原因。
在一些系统中,例如作为Usenet新闻,任何人谁看到一个消息可以发布取消消息来删除它。
许多系统已经提出抵制审查。
Dagster是合法的抗审查的出版计划,对网页非法数据,使检查员不能删除反感内容的同时移除受法律保护的内容。
Tangler是基于交织数据的抗审查的出版计划。
新公布的文件是依赖于以前发布的版本。
这种依赖性,被称为纠缠,为用户提供了一些激励,以复制和存储文件块。
因此,数据块耐审查。
数据隐私不被充分保护,因为任何用户都可以访问这些数据。
保护用户隐私。
在海量数据共享系统中用户隐私可以用下面的系统图示。
他们大多使用匿名技术匿名的发布和共享。
Freenet是一个免费的P2P系统,以确保匿名文件共享,浏览和发布。
它为用户提供了行为自由,保证他们的匿名。
Freenet有它自己的基于密钥的路由协议(类似于一个DHT),使用对称加密技术,为了保证用户的隐私,用户和通信都匿名。
SwarmScreen是用于P2P系统的隐私保护层,通过模糊处理用户的网络行为破坏社区标识。
SwarmScreen依赖于BitTorrent,由于用户行为可以通过她的兴趣推断,SwarmScreen用户连接到其他用户感兴趣的社区时,它可以掩饰该用户的兴趣和其行为。
许多系统如蚂蚁P2P和MUTE已被提议作为匿名P2P文件共享软件。
他们使用匿名,以使用户不被追踪,掩饰她的身份以及正在发送/从别人接受的内容进行加密。
抗审查系统,如Dagster和Tangler通常使用匿名技术来隐藏用户身份。
因此,它不可能对属于一个特定的用户的数据执行检查。
7.7结论本章给出了目前P2P系统中的数据保密性的解决方案的概述。
我们的现有解决方案的评价是基于技术的用于保护数据和用户的隐私(例如,访问控制,匿名性,信任,加密技术),并保证私密性(即防止未授权读取,损坏和删除,有限披露,匿名保证,拒绝联性,并且内容的否认)。
这一分析表明,虽然希波克拉底的数据库(HDB)的概念被越来越多的关注,但是,由于OECD的指导方针,它没有被用在P2P系统中。