附录A
(资料性附录)
基础电信企业数据分类示例
根据基础电信企业业务运营管理和数据安全管理特点,将企业数据分为用户相关数据和企业自身相关数据两大类,表A.1和A.2分别给出了这两大类数据的详细分类示例。
表A.1 用户相关数据分类示例表
表A.2 企业自身相关数据分类示例表
附录B
(资料性附录)
基础电信企业数据分级示例
按照数据对象的重要敏感程度,将基础电信企业网络数据资源分为四个安全级别,各个安全级别包含的数据子类示例如表B.1所示。
表B.1 数据分级示例表
附录 C
(资料性附录)
基础电信企业数据分类分级标识方法
自动化数据分类分级标识过程可以通过如下五个环节。
C.1 制定企业数据分类分级策略
企业通过参考数据分类分级相关的国家、行业标准以及企业自身的管理制度制定符合企业自身数据特点和数据安全管理要求的数据分类分级保护策略,制定出数据分类目录。
C.2 定义数据模型
根据企业数据分类分级的策略,针对不同类型、不同级别的数据的特点,定义数据模型。
数据模型可以通过如下几种方式定义:
a)关键字、正则表达式等形式,以实现邮箱、身份证号、银行账号、电话号码等明显特征数据。
b)数据指纹技术,以实现对批量数据的指纹索引化处理。
c)机器学习算法,以实现对大批量数据的训练后的建模分析,此种数据模型定义方式需要提供批
量的敏感数据样本数据供建模分析。
C.3 分类分级策略与数据模型关联
参考企业数据分类分级保护策略将数据模型划归至不同的数据类别与数据级别,即将数据与数据分类、数据分级策略建立关联,以支持后续的数据自动化分类分级。
C.4 利用工具对目标数据资源自动化识别
结构化数据和非结构化数据的自动化识别方式如下:
a)结构化数据识别:
1)利用可控权限账号,接入数据库,通过查询指令结合数据安全模型,进行结构化数据自动化
静态识别。
2)识别数据库协议并解析流量数据,通过数据安全模型结合特征分析和机器学习,进行结构化
自动化数据动态识别。
3)梳理业务流,特征分析和机器学习分析业务会话,进行结构化自动化数据动态识别。
b)非结构化数据识别:
1)对接应用服务器、文件管理服务器等,利用全文检索技术,通过NLP、数据清洗和机器学习
(可结合大数据分析技术),实现文本数据识别;
2)对接(通信协议、网络爬虫等)应用服务器、文件管理服务器等,利用属性识别技术,通过
图像识别和机器学习,实现图像数据识别;
3)对接(通信协议、网络爬虫等)应用服务器、文件管理服务器,利用属性识别技术,通过语
音识别和机器学习,实现语音数据自动化识别;
4)建立大数据分析技术,对企业源数据进行整合,实现有监督和无监督机器学习,以实现海量
数据动态识别。
C.5 数据分类分级索引标识
通过自动化数据分类分级工具扫描发现不同数据类型、不同数据级别的数据之后,给这些数据按照分类分级策略进行索引标识,标记数据项的类别和级别,以便后续数据安全防护过程中匹配不同类型、不同级别的安全防护措施。