当前位置:
文档之家› 隐私保护数据发布(PPDP)
隐私保护数据发布(PPDP)
• 使用脱敏数据
• 使用脱敏后的数据就可以进行数据挖掘
• 使用非敏数据
• 使用公开的非敏数据就可以进行数据挖掘
隐私泄露方式
• • • • Record Linkage Attribute Linkage Table Linkage Probabilistic attack
隐私保护方式
• 基于泛化和隐匿技术
隐私保护数据发布(PPDP)
宋鹏举
数据属性分类
• 显式标志(EID)
• 包括:银行卡号,身份证号等信息
• 准标志(QID)
• 可以潜在标识的信息,包括性别、年龄等信息
• 隐私(SA)
• 包括:
• 非隐(NSA)
• 不在上述三种之内,可以公开的信息
数据使用方式
• 使用真实数据
• 必须使用真实数据才能进行数据挖掘。在此 情况下,在挖掘算法中建立隐私约束规则, 避免隐私泄露。
• K-anonymity • L-diversity • T-closeness
• 基于有损连接的分割技术 • 其他技术
• 微聚集技术 • 加密技术 • 干扰技术
隐私攻击模式和隐私保护算法
度量标准
• 数据的失真率 • 数据的可用性 • 隐私保护度
具体的度量方式
• 最小信息缺损度量 • ILoss度量方法
• 用于度量隐私的保密程度
• 可辨识标准度量算法 • 其他度量方法
• 隐私保护/数据效用折中度量方法
应用场景
• 静态数据集中发布
• 一次性统一发布数据
• 动态• 将不同数据提供商的数据整合后统一发布
• 社会网络数据发布
• 有不同的机构发布数据