政务大数据分析与可视化应用白皮书DataHunter大数据事业部2019年3月26日目录1“智能+”背景下的政务大数据 (3)2 政务大数据的典型应用场景 (3)2.1 推动公共服务的创新 (3)2.2 强化社会预测 (4)2.3 推动社会治理与监管 (4)3 政务大数据系统的建设标准以及原则 (4)3.1 构建统一的政务数据汇聚平台 (4)3.2 优化政务数据共享与治理机制 (4)3.3 搭载数据分析等敏捷的上层应用 (5)4 政务大数据平台架构参考 (6)5 基于政务大数据的数据分析平台建议 (7)5.1 对数据分析与治理单独立项,建立统一的数据仓库 (7)5.2 部署敏捷的数据分析应用 (7)5.3 完善数据可视化展示体系 (8)6政务大数据平台数据分析与可视化展望 (9)6.1向基于人工智能的增强分析功能演进 (9)6.2自然语言处理和对话分析将应用于政务服务领域 (9)6.3 政务数据分析将向公众开放一部分服务 (9)7 关于DataHunter (10)1“智能+”背景下的政务大数据从2016年起,政府工作报告连续提出互联网+、数字经济、智能+这三大理念。
作为“互联网+”的升级迭代,2019年政府工作报告提出的“智能+”,要求各个行业要更加深入的利用大数据、人工智能等新兴技术,与传统产业深度融合,这体现了基于数字革命的人工智能技术对社会生产的全新赋能。
在电子政务领域,“智能+政务”要求政府机构要充分利用物联网、云计算、移动互联网、人工智能、数据挖掘、知识管理等技术,提高政府办公、监管、服务、决策的智能化水平,形成高效、敏捷、便民的新型政府,来推动智慧政务的实现,从而激发社会创新、更好地为群众服务。
在电子政务从“互联网+”到“智能+”的演进过程中,大数据将扮演着重要作用。
通过推动政务大数据的全面应用,可以跨系统、跨平台、跨数据结构地进行协同合作,同时也促进政务资源的整合并解决的信息孤岛的问题,盘活数据资产,提升政府公共服务能力等政务能力的建设。
同时,通过政务大数据的利用,可以促进政府和公众互动,让政务的流程与机制更加透明,帮助政府进行社会管理和解决社会难题,建立公众与政府间的沟通渠道,推进政府信息资源进一步开放共享,开发利用效率倍增,提升为民服务能力,促进经济社会快速发展。
2 政务大数据的典型应用场景从本质上来讲,政府大数据具有强烈的公共服务属性,其承载着人口、教育、交通、环境、公共资源、公共安全等重要的数据,而且随着信息化的发展,这些数据从广度与深度上都在不断增长。
通过对于这些数据的利用,能够增强公共服务的针对性、提高公共治理的精准性。
总体来说,政务大数据的典型应用场景包括以下几个:2.1 推动公共服务的创新在发展过程中,传统电子政务逐渐暴露出信息孤岛、数字鸿沟、网络安全威胁、互联网治理水平低以及行政效率不高等问题,难以支撑起公共服务的创新。
而在彻底实现了数据的云化与统一之后,部门壁垒与数据割裂将被打破,数据最终得以互联互通,数据资产实现再利用。
通过构建基本公共服务海量数据采集、汇集、分析体系,打造连接、弹性供给、高效配置的载体,有利于推动基于政务大数据的公共服务创新,实现城乡建设、人居环境、健康医疗、社会救助、养老服务、劳动就业、社会保障、质量安全、文化教育、交通旅游、消费维权、城乡服务等领域的大数据应用示范。
2.2 强化社会预测通过人工智能、虚拟云计算、神经网络模型、机器算法等进行数据挖掘,从而发现事物间的相关关系,进而预测事件发生的概率,这是大数据方法论的核心思想,也是构建智慧政府的关键。
以交通领域为例,通过相关数据与云计算和位置大数据结合分析,为政府决策以及居民出行提供及时有效的数据支撑,提升城市交通治理能力。
2.3 推动社会治理与监管由于我国面临着向市场机制全面转型的过程,公共服务的监管体制方面仍有许多需要完善之处。
通过在社会治理与监管过程中引入政务大数据,除了有助于对于实现全过程的监管(包括服务主体、服务的及时性与充分性、服务质量等),主动查究违法违规行为;还有利于实现公共服务评估结果应用的监管,对于公共服务进行量化评价,并将其作为政绩的重要方面纳入考核,使监管工作真正落到实处。
3 政务大数据系统的建设标准以及原则3.1 构建统一的政务数据汇聚平台政务数据汇聚平台应该由基础设施、平台支撑、数据接入、数据存储、大数据管理和政务大数据应用等主体部分以及安全管控体系、运维监控体系、标准规范体系和安全运维体系等辅助部分构成。
平台面向政务数据汇聚、整合、共享、应用的需求, 充分利用大数据技术体系的优势, 围绕关系型数据、电子文件、地理空间数据、时序型数据等各类结构化数据和非结构化数据的存储和计算要求, 为政务大数据存储、分析提供基础技术支撑平台。
在汇聚和整合各部门政务数据的基础上,可以 统一为各类平台和业务应用系统提供数据共享的支撑保障服务, 并对服务运行情况统一监管。
3.2 优化政务数据共享与治理机制在政务大数据共享的推进过程中,普遍存在着“不愿共享”“不敢共享”“不能共享”等难题。
其原因不仅在于缺乏标准体系的支撑,采取的处理技术、应用平台各异,数据库接口也不互通;还在于缺乏政务数据的共享管理机制,导致很多部门出于数据泄露、职责不明晰等原因,不愿意将本部门的数据及时共享。
要解决这一问题,除了进行统一的政务数据汇聚之外,还需要建立数据共享机制,如果是可以透明共享的数据, 平台将直接把数据推送至相关的需求部门;如果是有特定条件共享的数据,可以建立数据的申请以及分发机制,需要部门在发起数据共享申请后,汇聚平台根据所申请业务信息的数据共享类型, 启动相应审批流程。
在数据的共享与治理过程中,还需要特别重视数据安全问题。
政府部门需要针对政府数据广泛应用的背景和安全需求,以政府内部人员和业务系统为主要管理对象,将大数据系统的帐号权限集中管理、集中认证、集中鉴权和集中审计作为切入点,集中管理业务系统和运维操作人员对大数据系统的访问操作和审计日志,保障大数据系统的安全。
3.3 搭载数据分析等敏捷的上层应用政务大数据平台的作用除了体现在政务数据的汇聚、共享、管理组织之外,还体现在政务数据服务层面。
通过在各政府部门数据汇聚的基础上,部署数据分析、数据展示等上层应用,可以为政府部门提供政务数据统计、网络舆情监控与引导、公共服务需求预测、部门绩效考核、社会治理态势感知、公共安全管理等服务,从而推动公共服务的进一步创新。
在政务数据应用的部署过程中,需要满足敏捷性以及可管理性这两大需求。
敏捷性是指数据分析等政务数据应用应该是可以统一的服务入口与平台,进行便捷获取与应用,需求部门无需具备丰富的专业技能,也无需掌握数据建模等底层知识,就可以通过自助式分析等方式来敏捷实现数据应用;可管理性是指这些政务数据应用需要处于严格的管理之下,这些管理包括权限控制、集中认证、审计溯源等多种方式,以确保政务数据得到合理的应用。
4 政务大数据平台架构参考政务大数据平台总体上可以用四个字概括:采、存、管、用。
“采”,也就是数据采集,通过数据交换共享平台从郑州市各个局委办以及下属县区获取各种异构源数据;“存”,也就是数据存储,将采集到的数据分门别类存储到结构化数据库、分布式文件系统等存储设备中;“管”则是市政府大数据局要对这些数据进行管理,包括元数据、模型、数据标准、以及数据安全、审计脱敏等进行统一管理;“用”,则是指数据的应用,一方面如何实现高效的“一口办理”来简化企业和百姓的办事流程;另外一方面强化分析研究与实践运用,实现政务数据资产价值的深度挖掘,来为智慧政府提供辅助决策同时,开发各类便民应用,实现公共资源优化配置和服务水平提升。
目前,很多政府部门通过大数据平台的搭建以及数据攻坚等行动,在“采”、“存”、“管”方面奠定了坚实的基础,同时在“一口受理”以及业务交换方面都取得了一定的成效。
但是政务大数据由于价值密度大,存储的都是国家的核心数据,其本身就是一个资源宝库。
因此基于大数据的“数据分析”才是政务大数据的重中之重。
数据分析通过将“数据”加工成为“数据资产”,来挖掘数据的潜在价值,从而为智慧政府以及社会应用提供辅助决策和各种应用。
5 基于政务大数据的数据分析平台建议5.1 对数据分析与治理单独立项,建立统一的数据仓库政务大数据平台汇聚了各类结构化数据和非结构化数据,不仅来源不同、而且质量参差不齐,这些数据并非全部适用于数据分析。
通过对于数据分析与治理的单独立项,可以完成数据的采集、汇聚以及预处理工作,并结合不同实际应用场景建立数据仓库,将数据标签化,并重点提供区域的人口数据、经济发展数据、劳动就业数据、社会治理数据等重要、高质量的结构化数据,通过相应API接口方便上层应用调用。
5.2 部署敏捷的数据分析应用通过部署Data Analytics 数据分析平台等敏捷BI(商业智能)应用,能够将数据分析能力广泛下沉到各级部门与政府工作人员,通过横向或是纵向的数据分析,增强政务数据的相关洞察,提供更精准、更具时效性的政务服务。
具体来说,在政务大数据平台部署数据分析应用可满足如下需求:l为工作汇报与公文流转提供便捷的工具:Data Analytics等数据分析应用可以支持自助式、探索式的数据分析,政府工作人员随时根据工作需要制作分析报告并根据实际需要配置统计分析条件,实现数据的自动、实时、动态分析,降低了工作负担,可以便捷地生成数据报告,为工作汇报提供支持。
l为政务决策提供支撑:通过敏捷式数据分析应用,可以实现以政务服务为驱动的实时化、智能化、科学化数据分析,生成相应的数据洞察,为政府部门高效管理、科学决策提供数据支持。
l为公共服务创新提供依据:在引入了敏捷的数据分析应用之后,政府部门可以通过数据指标体系的建立,以及数据测试方式的使用,直观的观测到特定的政务应用上线之后,相关反馈数据(如群众投诉量、满意度、业务办理量等)的变动情况,从而进一步完善并推动政务应用的创新。
5.3 完善数据可视化展示体系在数据分析完成之后,通过DataMAX 数据大屏展示平台等工具将这些数据进行可视化展示也至关重要。
其可以围绕各类政务业务主题,整合相关业务形成的复杂多样的海量数据,以地图、图表、动画等形式直观展现,提供全方位的业务数据聚合、整理、分析、展示和互动。
其不仅是政府部门以及人员接收数据洞察的重要渠道,也是增强对外展示的一扇窗口。
具体来说,在政务大数据平台搭建 DataMAX 等数据可视化平台有以下重要意义:l全流程政务数据监测:对于政务业务进行全流程监控,可满足各级部门及业务人员进行数据监控及分析展示需求,增强态势感知能力、及时处理异常事态。
l促进政府与公众关系:通过多屏展现政府工作、相关政策等信息,有效提升了公共服务效率和用户体验,促进了政府与社会大众的和谐关系;l增强政府公信力:通过对于政府创新成果的展示,有效推进创新型政府、服务型政府的相关建设工作,增强政府执行力和公信力,促进国家治理体系和治理能力的现代化。