当前位置:
文档之家› 大数据下的隐私保护PPT精选文档
大数据下的隐私保护PPT精选文档
个人相关信息:属于准标识符(Quasi-identifier),如年龄、性别、种 族、职业、公司、遮挡的图片等,并不与任何PII直接联系在一起;
个人属性信息:是把个人准标识符进一步泛化的模糊信息,如青年 隐性隐私 人(或20-30岁)、南方人、白领、照片剪影等等。
注:1) 准标识符信息虽然不能直接指向具体的人,但是把这些条件组合在 一起,还是很有机会匹配到确定的个体,从而有隐私风险。 2) 用进一步泛化的模糊用户属性解决“Quasi-identifier”的问题,也就 是把能够辨识出个体的信息“虚化”,确保符合属性的个体有足够多的数 量,从而无法准确与个体关联,这就所谓的k-anonymity概念。
②个人的信用和财产状况,包括信用卡、电子消费卡、上网卡、上 网帐号和密码、交易帐号和密码等。个人在上网、网上消费、交易 时,登录和使用的各种信用卡、帐号均属个人隐私,不得泄露。
③邮箱电址,不少用户不愿将之公开。掌握、搜集用户的邮箱并将 之公开或提供给他人,侵犯了用户的隐私权。
④网络活动踪迹。个人在网上的活动踪迹,如IP地址、浏览踪迹、活 动内容,均属个人的隐私。
服务提供商要担当
有义务保护用户数据 不得滥用用户资料
2020/5/23
12
加强隐私保护研究
研发隐私保护技术
割断用户数据与用户辨识信息的联系,尽量不直接使用个人辨识信 息。例如产生随机数R替代个人辨识信息PII (类似于TSMIIMSI);
对数据进行必要的 分割和拆分,尽可 能去除不同数据项 的关联性,去除数 据内容与个人辨识 信息的联系;
2020/5/23
7
需要保护的隐私
在网络环境,部分隐私就关呼个人数据的权利问题。所谓个
人数据,是指用来关联个人基本情况的一组数据资料
①个人登录的身份、健康状况。在申请上网开户、免费邮箱以及申 请服务商提供的其他服务时,服务商往往要求用户相关信息,服务 商有义务和责任保守个人秘密,未经授权不得泄露。
密码后,删除了部分用户资料,而云平台并未备份用户数据导致了 用户数据的丢失,并致使用户Gmail和Twitter账号被盗 2014.8,美版“艳照门”iCloud数据外泄 2014.10,摩根800万客户资料泄露
斯诺登事件
貌似有信誉的商家如政府不靠谱, 用户的安全需要自己把握
人肉搜索事件
对隐私造成巨大威胁且防不胜防
⑤个人的图片和音像。通过图像识别技术,搜索引擎可以准确定位 到人,并找到与之关联的其他资料
⑥其他。从部分已知信息挖掘关联出一系列个人其他资料(喜好习惯
、生活规律等)。
8
例: 网上晒照片造成隐私泄露
某明星在上晒出居室照片被定位
通过分析照片 GoogleEarth 微博等各种信息
人肉搜索事件
流行病学家发现,Facebook、Twitter这类社 交网站和谷歌等网络搜索引擎,对于流感传 播情况的了解,比世界卫生组织(WHO)或美 国疾病控制与防御中心(CDC)等官方机构的 报告来得还快。
通过Twitter上的数据,可提前八天预报。
大数据时代的安全
2020/5/23
5
典型的安全事件
云计算为代表的新型计算资 源可以为大众提供廉价服务
有效保护隐私?
很难!
2020/5/23
11
保护隐私该做什么
用户自我保护意识
慎用云存储:上传重要、敏感数据尤其小心 不要随意注册:很多网站要求填写个人信息 小心玩社交网:朋友圈内的资料难保不被泄露 尽量不提供个人辨识信息,如网购送货到指定地点
系统类事件
2010.9, 发现Google员工利用职权查看了多个用户的隐私数据 2011.3, Google邮箱再爆大规模用户数据泄漏,涉及15万用户 2011.4, Amazon的EC2云计算服务被黑客租用,对Sony PlayStation
网站进行了攻击,造成了大规模用户数据的泄露 2012.8,苹果公司的iCloud云服务受到黑客攻击,黑客暴力破解用户
2020/5/23
9
例:k-匿名技术
通过属性泛化实现模糊信息
2020/5/23
10
例:k-匿名技术的效用
k-匿名技术唯一解,至 少增加求解的难度。
大数据时代的现状
存在“取之不尽,用之不竭” 的关联数据、关联方程
搜索引擎和各种数据挖掘、 数据分析、数据关联技术
建立混合云框架, 结合私有云和公有 云形成兼顾云计算 优点有可以对敏感 数据重点保护的有 效机制;
……。
2020/5/23
13
隐私感知的混合云分割存取技术
1. 合理利用公有云和私有云资源,在两者之间合理分配计算任务,既充 分利用公有云的资源、又有效保护用户隐私并保留数据的效用;
2. 两类隐私信息区分处理:数据记录本身包含的隐私信息,以及数据记 录之间关联关系蕴含的隐私; 3. 分割中,相对独立的数据分配给独立的云平台计算,减少云间通讯。
大数据下的隐私保护
陈克非 kfchen@
2014.11.12
西安、贵阳行
网上订机票引出的事
无处不在的大数据
网络应用,移动终端,穿戴设备,。。。 个人数据可以随处采集
例: Google预测流感趋势
2009.2.19,Nature上刊登了一篇关于
Google预测flu trends的文章。
隐私是什么?
隐私一般是指仅与特定人的利益或者人身发生联系且权利人
不愿为他人所知晓的私人信息、私人事务和私人领域。
隐私泄露的关键是某些数据、信息与个人发生关联,而作为
个体的人则通过特定的个人标识信息信被准确锁定
显性隐私 个人辨识信息PII(Personal Identifiable Information):用户的姓名、 手机号、身份证号、电子邮箱、住址、图片等;
针对隐私云数据的分 割存取需求,建立一 个基于混合云的大规 模数据存取框架,该 框架由一个私有云和 多个公有云组成,以 充分发挥公有云丰富 且廉价的计算资源的 优势。
2020/5/23
私有云
敏感数据 非敏感数据1
...
非敏感数据n
公有云1
公有云n ...
混合云架构设计
14
隐私感知的混合云分割存取技术