当前位置:
文档之家› Ch16V2 商务智能社会影响与发展-商务智能方法与应用(第2版)-刘红岩-清华大学出版社
Ch16V2 商务智能社会影响与发展-商务智能方法与应用(第2版)-刘红岩-清华大学出版社
John 男 72.8.10 11002 中
女 表6156.9.2.6公开6的18选02民信息 低
Emily 女 68.1.2 61021 中
姓名 Tony John Peter
性别 男 男 男
生日 72.2.7 72.8.10 68.1.2
邮编 11001 11002 11002
Lily 女 68.10.3 61032 中 Laura 女 65.6.8 61801 高 Connie 女 65.9.6 61802 低
Principles and Applications of Business Intelligence
Chap 16:商务智能社会影响与发展
Principles and Applications of Business Intelligence
商务智能方法与应用(第二版)
第16章 商务智能社会影响与发展 Lecture 16: Social Impacts and Development of BI
性别
生日
邮编
收入
男
72.2.7
11001
高
男
72.8.10
11002
中
女
68.1.2
21021
中
女
68.10.3
21032
中
女
65.6.8
61801
高
女
65.9.6
61802
低
6
Principles and Applications of Business Intelligence
Chap 16:商务智能社会影响与发展
Chap 16:商务智能社会影响与发展
k-匿名( k-anonymity)
▪ 由Samarati和Sweeney 于1998年提出,是一种被广泛认可的一种保护隐私的方 法。
▪ 假设包含用户隐私信息的数据存放于表T(A1, A2, …, An)中,其中Ai是该表的第i
个属性。例如,公司拥有客户的个人信息,为了隐私保护的考虑,这些信息不包 括名字、社会保障号码等能够直接标识个人的属性,但是含有性别、生日、邮编 等信息,以及隐私信息,如收入,如表所示。
3
Principles and Applications of Business Intelligence
Chap 16:商务智能社会影响与发展
AOL数据集隐私泄露事件
▪ 2006年美国在线(AOL)的一个实验室发布了一个供学术界研究的搜 索日志数据集:
该数据集包含了65万个AOL用户的2千万个查询,是这些用户在2006年3个月 中的搜索记录,包括提交了什么查询,点击了哪些页面等。
4
Principles and Applications of Business Intelligence
Chap 16:商务智能社会影响与发展
实现隐私保护
▪ 一方面需要业界的行业规范和相应法律法规的制定,另一方面,也可 以研究如何对数据进行处理,屏蔽用户的真实信息,在不泄露用户隐 私信息的基础上合理使用数据。
Chap 16:商务智能社会影响与发展
16.1商务智能中的隐私保护
▪ 商务智能通过收集、分析大量数据发现其中隐含的知识,为企业决策 提供支持。
例如,通过收集客户的行为数据,可以发现用户的兴趣偏好,为其提供个性化 服务,提高客户满意度,增加企业利润。
▪ 但是,这些数据被善意利用的同时,也有可能泄露用户的隐私。
通过分析搜索日志可以发现用户的搜索意图,进行搜索推荐、准确的广告投放 等。
▪ 数据集公布不久,就爆出了一个编号为4417749的用户的真实身份被 发现的事件。该用户在3个月期间提交了许多有关自身患病症状以及 所养宠物的查询。通过这些查询定位出了她的居住地,找出她的真实 身份,从而泄露了她的个人隐私。
Chap 16:商务智能社会影响与发展
k-匿名的原理
▪ 将隐私表中的部分属性进行概括或隐匿,以便使具有相同准标识符取 值的人数多于1个,达到k个(k>1)。
▪ 给定包含n个属性 A={A1, A2, …, An}的隐私表T,由m行元组构成,即 T={t1, t2, …, tm},其中ti是第i个元组,即表的第i行。设ti[Aj]代表元组 ti中属性Aj的取值。
▪ 如果表T中任一个元组tT,对于任意一个准标识符Q={B1, B2, …, Bl }A,都存在另外(k-1)个元组{s1, s2, …, sk-1}T,满足t[Bi]=sj[Bi],其 中i=1, 2, …, l,j=1, 2, …, k-1。此时该表T称为k-匿名表。
刘红岩 清华大学经济管理学院
1
Principles and Applications of Business Intelligence
主要内容
16.1 商务智能中的隐私保护 16.2 移动商务智能 16.3 云商务智能
Chap 16:商务智能社会影响与发展
2
Principles and Applications of Business Intelligence
隐私信息通过连接操作被泄露
表16.1 客户信息
性 生日 邮编 收入
别
男 72.2.7 11001
高
男 72.8.10 11002
中
女 68.1.2 21021
中
女 68.10.3 21032
中
女 65.6.8 61801
高
表16.3 病人和选民信息连接后的表 姓名 性 生日 邮编 收入
别 Tony 男 72.2.7 11001 高
Emily 女 68.10.3 21021
Lily 女 65.6.8 21032
Laura 女 65.9.6 61801
Connie 女 72.2.7 61802
7
Principles and Applications of Business Intelligence
Chap 16:商务智能社会影响与发展
▪ 对数据处理的方法包括加密、添加噪音或扰动等。
▪ 在数据挖掘领域,隐私保护也是一个研究领域。针对关联规则、分类 、聚类等分析技术,研究如何在保护隐私信息的情况下,最大限度地 保证挖掘结果的有效性。
5
Principles and Applications of Business Intelligence
隐私表与公共表
▪ 含有隐私信息的表为隐私表,公开发布的表为公共表。
▪ 隐私表中的属性分为敏感属性和非敏感属性,其它属性为非敏感属性 。
▪ 利用隐私表与公共表一些相同的属性连接后可以唯一地识别出至少一 个人的属性组称为准标识符(quasi-identifier),一个隐私表的准标 识符可能有多个。
8
Hale Waihona Puke Principles and Applications of Business Intelligence