国外数据治理模型比较(来源:图书馆论坛, 2018-06-19)摘要:[目的/意义]深入探析国外数据治理模型的构成要素、治理特点、优势与不足等,为我国数据治理模型的构建提供理论基础与实践参考。
[方法/过程]采用文献调研和网络调查法,对比分析国外4个典型数据治理模型,总结优劣之处。
[结果/结论]国外数据治理模型各具特色,结合对比分析的结果,遵循由明确治理模型的原则与目的到理论回归实践的逻辑思路,从数据治理原则与目的、数据治理利益相关者、数据治理技术与系统、数据治理要素关系四个视角提出建议,以期为我国的数据治理模型构建提供借鉴与参考。
引言继十八届三中全会首次提出国家治理体系和治理能力现代化之后,十九大对此进一步提出了明确的要求。
由于国家治理体系体现的是数量与结构,治理能力体现的是品质与能力,而治理体系是一项系统工程,所以在治理体系和治理能力建设方面,应重结构提品质,分类细化治理,通过实现国家治理体系和治理能力现代化,实现其它目标。
同样的,在学术界,通过实现数据治理,将提升数据管理,确保数据质量,形成开放共享的新局面等。
研究人员指出数据治理是决策、职能以及操作流程有机组合的系统,并且人们对这些数据资产承担责任W。
而构建一个数据治理模型,能为组织的数据治理工作提供直观清晰的操作指南与行动方针[2]。
一、数据治理模型概述通过对国内外文献及相关网站的广泛调研,发现国外数据治理始于2004年在企业管理中的探讨[3],2005年后陆续有学者对其展开研究,讨论数据治理在企业、政府等领域发挥的影响与作用[4_6]。
国内数据治理的研究大多集中在计算机、行政学以及金融等领域。
包冬梅在借鉴国外数据治理模型框架的基础上,首提我国高校图书馆数据治理框架CALib[7]。
此外,国内己有多位学者从数据治理的内涵、要素、模型等角度进行述评,指出体系、模型等的设计是未来研究的重点方向,治理实践是其最终目的[8_9]。
通过在Web of science数据库中检索"data governance"相关的论文,发现国外研究集中在案例分析方面,指出行业或企业缺乏数据治理这一事实。
例如,调查发现西澳大利亚警察枪支管理系统和卫生信息系统存在很多数据问题,数据管理人员对本系统数据的准确性没有信心,无法落实数据责任,这两个案例强调非常真实的数据管理问题,相关学者指出这些问题不是规则或技术造成的,而是由于缺乏完善的数据治理[10]。
在第五届欧洲信息管理与评估会议中(European Conference on Information Management and Evaluation,简称ECIME),研究人员调查中小企业对数据治理的看法,以及数据治理模型是否适用于中小企业等问题。
结果显示,尽管许多模型具有适应性和可扩展性,但缺乏可操作性,无法满足许多中小企业的要求。
更需关注的是,大多数中小企业不承认数据的内在价值,没有将数据视为具有支持其业务流程的系统而独立存在。
显然,随着大数据浪潮的推进,数据治理却并未普及,组织中缺乏数据治理的现象依然大量存在,组织各阶层管理人员对数据治理的重视程度依然欠缺。
学术界对数据治理研究的透彻与全面,并不能代表组织机构愿意接受理论,使用模型。
宄其根源,数据治理难以落实的原因可归纳为以下几点,首先组织内部的不同团体之间缺乏沟通与协调,导致数据信息滞留。
其次,组织人员对数据资产无责任意识,无法确保数据质量,没有重视数据治理等。
因此,构建数据治理模型是必要的,同时模型的可操作性和实践意义也值得关注。
目前在国外己有数据治理模型中,提及较多的是数据治理协会(The Data Governance Institute,DGI)数据治理框架(模型)⑽,以及国际数据管理协会(The Data Management Association,DAMA)数据治理框架(模型)[13]。
DGI数据治理模型包括规则与协同工作规范、人员与组织架构、过程三大部分及10个子部分。
该模型的特点是将治理流程融入模型之中,以流程箭头的形式标识出治理顺序。
此外,该模型条理清晰,重点突出,回归研究问题的本质,回答了5W 问题(WHY、WHAT、WHO、WHEN、HOW)。
DAMA数据治理模型通过两个子模型共同构建:功能与环境要素。
该模型的核心意义在于解决数据管理功能与环境要素之间的匹配问题。
这两种模型,因其全面性和逻辑清晰的特点,被研究人员广泛借鉴和引用,但不容忽视的是,数据治理模型不能忽略的特点是行业特征性,即组织唯一性。
上文提及的CALib框架[7](模型),基于这两种模型,以立方体的形式,多角度概述了我国高校图书馆数据治理的着陆点以及评价机制。
本文通过网络调研和文献阅读,将国外较少提及但具有鲜明特征的数据治理模型进行对比研究,这四个模型分别具有全面性、简洁性、变化性与可重复性的特征,笔者期望通过分析四个模型的治理特点及相关要素,为我国数据治理模型的构建提出参考建议。
二、国外数据治理模型调研管控风险,降低成本,增加收益,实现价值,这些是每个组织的目标和驱动因素。
而数据治理的真谛即为如此。
组织所有的努力最终都会落实到这些普遍价值中。
倘若参与者对目标、策略、过程等不清楚,则很难实现组织的最终价值。
制定管理活动的规则体系,沟通复杂模糊的概念及其逻辑关系,可以确保人们的劳动得到应有的价值回报。
随着时间推移,由于数据质量下降,数据系统支持业务流程,追求组织目标的能力降低,导致组织成本增加,收益减少。
管理层试图在操作层面解决这些问题将无法正常工作,添加更多的数据或数据系统来修复这些问题只会使其更糟。
因此,解决这类问题不是依靠更多的技术、系统或数据,而是数据治理。
数据治理不代表技术功能,而是由业务驱动,搭建管理人员和技术人员之间的桥梁,而治理模型代表了一种状态,即解决当今信息资产妥协问题所需的未来状态。
1、ISACA数据治理模型国际信息系统审计协会(Information Systems Audit and Control Association,简称ISACA)是全球公认的信息科技管理、监控的领导组织。
ISACA从行政资助、文化、管理指标、培训与意识培养四个角度,全覆盖构建了如图1所示的数据治理模型[14]。
由图1可知,ISACA数据治理在组织资助的前提下,以组织的愿景和使命,组织利益以及具体目标,共同确定数据治理的策略或目标。
经由此类过程,数据治理模型的定位将会更精准,更扎根于组织本身。
由于治理是灵活的,可以根据组织需求适当扩大或缩小治理范围,所以其模型不应是"死板"的,在可控的范围内进行调整是模型的特点。
该模型的另一特点是充分体现了人的能动性与主导作用,全程参与到数据治理过程中。
此外,模型采用顶层设计,基层实施的方法,秉持简单实用的原则,只在需要的地方进行治理,不将额外的步骤加入简单的过程中,确保模型的所有环节都为整个组织增值。
在模型建构的背景中,ISACA指出倘若治理难易程度较高,管理层和实际操作人员都会选择绕道而行,这与治理的初衷背道而驰。
如果将治理定制化,治理模型充分体现人的主导作用,治理各阶层的人就会感觉获得所有权,这更有助于数据治理模型的实行。
在数据治理合规性方面,该模型从政策、标准以及内部质量保证三方面着手。
合规性的设置遵循了内外结合的原则,在响应各地区政府政策的前提下,紧跟行业标准,完善内部质量保证,从而提升整个模型的效能,达到数据治理的目的。
图1ISACA数据治理模型[14]2、HESA数据治理模型高等教育统计局(Higher Education Statistics Agency,简称HESA)是英国收集、分析和传播高等教育定量信息的官方机构,提出了如图2所示的数据治理模型[15]。
HESA强调数据治理模型和组织的设计与管理结构密切相关,同时指出每个组织应根据各自侧重点,对通用模型进行适当修改,即"特色化"。
因此在该模型中,HESA将数据治理团队与法律、安全、人力资源等团队置于并列位置,共同受数据治理委员会指导。
其次,授权给数据管家、业务人员和数据用户等。
HESA指出治理模型在一定程度上构成了"为所有人公平获取数据"的概念,数据应被视为组织资产,而不是一个孤岛。
故该模型数据治理的范围包括:①确保数据安全,管理良好,确保组织面临的风险可控;②防止和纠正数据错误,作为计划持续改进的一部分;③衡量数据质量并提供检测和评估数据质量的改进框架;④制定标准记录数据及其在组织内的使用情况;⑤作为数据相关问题/变更的升级和决策主体。
由图2的主体部分可知,数据治理呈现一种层层递进的态势,在数据治理模型中,需要定义和分配一些关键角色。
图2HESA数据治理模型[15]HESA首提大学数据受托人(university data trustee),指出大学数据受托人对数据管理的战略协调负责。
但实质上,大学数据受托人是一名高层数据管理人员,例如校方规划处处长等。
这与利益相关者理论下美国伊利诺伊大学数据银行[16]的角色分配有异曲同工之处。
大学数据受托人担任治理职务,确保数据管理活动得到优化,从而配合和支持战略目标的达成。
除此之外,从模型的整体结构可知,组织的数据治理,既离不开操作层面的管理,也离不开政策层面的指导。
因此政策指引是数据治理模型中必不可少的一部分。
笔者认为,政策指引包括两部分,其一是基于数据生命周期的数据管理过程的政策,该政策应嵌入治理过程内部;其二是纵观治理全过程的宏观层面政策。
HESA模型中的"指导"与"授权"步骤正是这种政策的具体表现。
HESA指出,构建模型的同时会定义和分配一些关键角色。
重要的是,分配的是角色,而不是工作,数据治理过程应是一个整体,模型将这个过程清晰化、具体化。
3、Mustimuhw Information Solutions数据治理螺旋模型Mustimuhw Information Solutions是加拿大一家计算机软件公司。
研究发现,随着时间的推移,人们的需求和能力不断变化和发展,治理模型将随着扩张和改进的迭代循环而发展壮大。
因此,该公司认为数据治理应以螺旋模型呈现間(如图3),以反映模型的动态和不断演变的性质。
由图3可知,Mustimuhw Information Solutions数据治理螺旋模型始于数据治理的愿景和原则。
数据治理模型根植于人们对数据治理和核心指导原则的愿景,这些核心指导原则为组织的数据治理提供了全面的方法和维护。
随着模型的螺旋形发展,该模型的第二个核心要素是治理结构,即治理的概念、组织结构、相关角色与责任。
在这部分中,模型将数据从两个维度进行划分,首先分为国内和国外数据;其次再将数据分为四部分:企业、文化、人力、地产与资源。