附录A(资料性)电信大数据分类类目表A.1用户身份相关数据(A类)用户身份相关数据包括用户身份标识信息和用户网络身份鉴权信息。
表A.1A类数据类目表A.2用户服务内容数据(B类)用户服务内容数据包括用户服务内容数据和联系人信息。
表A.2B类数据类目表表A.2B类数据类目表(续)A.3用户服务衍生数据(C类)用户服务验证数据包括用户服务使用数据和设备信息。
表A.2C类数据类目表A.4企业运营管理数据(D类)企业运营管理数据包括企业管理数据、业务运营数据、网络及IT系统运维数据和合作伙伴数据。
表A.3D类数据类目表附录B(资料性)电信大数据共享场景B.1数据共享形式大数据提供的形式分别为:原始数据、脱敏数据、标签数据和群体数据,以上形式的具体描述为:a)原始数据,是指数据的原本形式和内容,未作任何加工处理。
b)脱敏数据,是对各类数据所包含的自然人身份或网络身份标识、用户基本资料等隐私属性进行模糊化、加扰、加密或转换后(如:对身份证号码进行不可逆置换,但仍保持相应格式)形成的无法识别、推算演绎(含逆向推算、枚举推算等)、关联分析不出原始用户身份标识等的新数据。
c)标签数据,是对用户个人敏感属性等数据进行区间化、分级化(如:消费类信息仅区分高、中、低三级等)、统计分析后形成的非精确的模糊化标签数据。
模糊处理达标基线是:仅根据模糊化标签属性,无法推理计算匹配到具体个人;且标签数据无法精确描述具体个人实体的任何敏感特征。
d)群体数据,即群体性综合性数据,是由多个用户个人或实体对象的数据进行统计或分析后形成的数据。
如:群体用户位置轨迹统计信息、交易统计数据、统计分析报表、分析报告方案等。
根据群体数据,应无法推演、无法与其它数据关联间接分析出个体数据。
群体数据中不应包括任何用户身份标识等敏感信息。
B.2场景基本分类与安全措施要点电信数据使用场景基本分类及安全措施要点如表B.1所示。
表B.1场景基本分类与安全措施要点B.3位置类场景B.3.1机构选址与门店客情分析服务机构选址服务场景如表B.2所示,仅提供分析报告,可能会用到的数据包括自然人身份标识、用户基本资料、消费信息和账单、网络设备及IT系统支撑数据这四个子类的群体数据,以及位置信息子类的标签数据和群体数据。
不建议在军队驻地附近区域提供机构选址与门店客情分析服务;如军队驻地属于商圈,确需提供分析服务的,需经组织机构的信息安全管理责任部门审核,仅提供脱敏后的标签数据和群体数据,并需与业务合作方签署保密协议。
表B.2机构选址服务场景空白:不提供;◑:部分提供;●:全部提供。
B.3.2城市规划与交通线网规划城市规划服务场景如表B.3所示,仅向城市建设规划部门和交通规划部门提供分析报告,报告为群体数据;针对区域内人口实时监控,如相关区域有党、政、军驻地,需将人员职业类型泛化脱敏或剔除,不提供驻地基站的经纬度和位置信息;如需委托第三方开展数据分析挖掘的,需经组织机构的信息安全管理责任部门审核,仅提供脱敏后的标签数据,并与业务合作方签署保密协议。
表B.3城市规划服务场景空白:不提供;◑:部分提供;●:全部提供。
B.3.3路网状态实时监测与公共交通调度路网监测服务场景如表B.4所示,仅向城市交通管理部门和公交管理部门提供数据统计服务(基于地图网格区块),提供的统计数据不涉及人员身份类型。
如相关部门要委托第三方开展数据分析挖掘的,需经组织机构的信息安全管理责任部门审核,仅提供脱敏后的标签数据(不提供人员身份相关信息、不提供用户设备信息),并与业务合作方签署保密协议。
表B.4路网监测服务场景空白:不提供;◑:部分提供;●:全部提供。
B.3.4公共区域安全监测公共监测场景如表B.5所示,仅向公安、应急办、综合治理等政府部门为公共安全保障、应急情况处置提供精准数据服务。
相关需求需经过组织机构所在省、直辖市通信管理机构和政府机构共同审核。
表B.5公共监测场景空白:不提供;◑:部分提供;●:全部提供。
B.4征信类场景B.4.1金融信贷金融信贷场景如表B.6所示,仅向金融机构或金融机构授权委托的第三方提供数据服务,需签署保密协议;针对第2、3级满足要求开放的数据,按照用户同意选择原则,需最终用户授权,提供授权信息,明确授权期限,组织机构需定期对授权信息的真实性进行审核,超出授权期不提供服务。
基于授权码和授权协议反馈结果,为避免数据过度开放(第三方转售),在对用户自然人身份对A1-1、用户基本资料A1-3信息进行比对后,提供相应标签数据。
表B.6金融信贷场景表B.6金融信贷场景(续)空白:不提供;◑:部分提供;●:全部提供。
B.4.2信息验真服务信息验真场景如表B.7所示,仅向合作机构或合作机构授权委托的第三方提供验真服务,需签署保密协议;信息验真需最终用户授权,提供授权信息,明确授权期限。
验真过程需合作机构提供手机号码、身份证、姓名三项信息,如果三项信息连续三次校验错误,不再提供验真服务;校验结果基于授权码输出,结果为一致、不一致或不存在。
基于授权码和授权协议提供数据服务;为避免数据过度开放(第三方转售),仅允许用户自然人身份对A1-1、用户基本资料A1-3信息进行比对,提供比对后结果。
表B.7信息验真场景空白:不提供;◑:部分提供;●:全部提供。
B.4.3消费者评级消费评级场景如表B.8所示,仅向合作机构或合作机构授权委托的第三方提供服务,需签署保密协议;提供的第2、3级满足要求开放的数据,按照用户同意选择原则,需最终用户授权,提供授权信息,明确授权期限,组织机构需定期对授权信息的真实性进行审核,超出授权期不提供服务。
表B.8消费评级场景表B.8消费评级场景(续)空白:不提供;◑:部分提供;●:全部提供。
B.4.4企业征信企业征信场景如表B.9所示,仅向具有征信资质的机构提供服务,需签署保密协议;提供的第2、3级满足要求开放的数据,按照用户同意选择原则,需最终用户授权,提供授权信息,明确授权期限,各单位需定期对授权信息的真实性进行审核,超出授权期不提供服务。
针对用户消费或信用级别发生变化,用户产生违规记录,如需向第三方提供,需要保证信息的准确性,并及时更新,避免引起法律纠纷。
基于授权码和授权协议提供数据服务;为避免数据过度开放(如第三方转售),对用户自然人身份A1-1、用户基本资料A1-3信息进行比对后,提供相应标签数据。
提供消费信息和账单C1-3、违规记录数据C1-5的脱敏数据、标签数据、群体数据。
表B.9企业征信场景空白:不提供;◑:部分提供;●:全部提供。
B.5广告传媒类场景B.5.1传统传媒效果评估传媒评估场景如表B.10所示,针对户外广告展板、电子广告牌以及其他传统广告媒体的传播效果难以评估的问题,根据传统传媒所属位置,结合位置周边的基站信息,对广告发布期间的途经,广告发布媒介的关注用户进行数据分析,判断广告传播媒体的目标客户送达率和匹配度,向传媒机构提供分析报告,报告中无自然人身份标识、网络身份标识、用户基本资料,仅涉及群体数据。
表B.10传媒评估场景空白:不提供;◑:部分提供;●:全部提供。
B.5.2程序化广告投放广告投放场景如表B.11所示,通过大数据处理技术自动完成,在用户毫无感知的时间内,完成广告投放过程,包括整合海量数字媒体资源、多屏整合和跨屏联动、用户位置、终端等信息、用户品牌偏好匹配、广告受众细分、广告动态竞价、广告投放等,帮助品牌在合适的时间、合适的设备上将合适的广告信息传递给合适的目标用户,精准触及目标受众,实现个性化精准营销,打破传统广告位粗放式营销,提升广告转化率。
合作方要具有互联网广告或代理投放资质;对外提供服务基于用户设备或网络身份进行标识,不提供自然人身份标识,不允许提供自然人身份和用户设备、自然人身份和网络身份关联关系。
组织机构可以自行或委托第三方在移动方的大数据平台租户环境进行分析挖掘,输出相应的用户标签。
标签类型和内容需要经过组织机构的信息安全管理责任部门审核。
表B.11广告投放场景GB/T XXXXX—XXXX附录C(资料性)电信大数据安全技术C.1数据源鉴别数据源鉴别是指在数据采集阶段对数据的被采集方和采集方进行身份鉴别,保证数据来源和去向的可靠性,防止数据泄露或数据中混入虚假数据。
具体实现方式如下:a)开启双向鉴别,同时鉴别数据源和数据采集方的身份,保证数据来源和去向的合法性;b)通过IP地址、MAC地址、机器名、用户名等信息标识身份信息;c)身份鉴别方式包括基于用户所知、用户所有、用户特征的鉴别方式,可以根据业务场景灵活选取;d)认证成功或失败均需在日志系统中记录,便于后续审计。
C.2数据识别数据识别是指在数据采集、存储阶段,利用敏感数据自动识别机制识别出数据中的敏感数据,依据数据分类分级方法将数据标识为不同的类别级别,为后续的数据使用、共享阶段提供防护依据,降低数据泄露风险。
具体实现方式如下:a)支持敏感数据定义,即可以配置敏感数据的匹配规则,当数据扫描时有数据匹配到该规则,该数据即判定为敏感数据;b)支持数据识别方式配置,具体识别方式包括基于数据内容的正则匹配、基于数据列名的匹配、基于数据特征的匹配等;c)支持黑白名单配置,运维人员可以手动配置黑白名单,以提升数据识别效率;d)数据识别需要考虑对线上系统的冲击,不能对正常业务有较大影响。
C.3数据脱敏数据脱敏是指按照脱敏规则对敏感数据进行数据的变形,实现在不泄露敏感数据的前提下保障业务的正常运行。
具体实现方式如下:a)能针对不同用户和不同敏感数据设置不同的脱敏算法;b)支持动态添加或删除脱敏算法,同时确保系统平滑升级,应用无需中断;c)支持配置用户查询特定数据库特定表、特定列的脱敏算法;d)所选择的脱敏算法具有一定的安全性、健壮性,不易被破解或还原;e)数据脱敏之后不影响业务连续性,不对系统性能造成较大影响。
C.4数据加密数据加密技术在数据存储、数据传输等阶段使用,具体实现方式如下:a)根据数据的敏感级别,采取差异化存储方式,对级别较高的数据采取加密存储。
具体的数据加23GB/T XXXXX—XXXX24密存储方法包括应用层加密、加密网关、文件级加密、基于TDE技术的加密等,其中:1)应用层加密指应用系统可调用加密API对敏感数据进行加密,由应用系统自行管理密钥体系;2)加密网关指在应用系统和存储系统之间增加安全代理服务,对存储数据的访问经过该安全代理服务,在此服务中实现数据加解密、存取控制等安全策略;3)文件级加密指对数据存储的载体从操作系统或文件系统层面进行加解密;4)基于TDE技术的加密指在数据库系统主程序启动时加载扩展的TDE插件,在数据写入存储介质前使用TDE插件加密数据,实现数据的加密存储。
b)安全传输过程可采用TLS/SSL协议进行数据加密传输,也可采取建立VPN加密传输通道方式进行安全传输;c)具体加密方法及实现按照GB/T36624—2018执行。