全员人口数据库数据核查平台清理规则说明及用户操作手册一. 总体规则 (3)二. 用户登录 (4)A. 规则 (4)B. 创建登录帐号 (5)a.添加用户: (5)b. 修改用户 (6)c.删除用户 (7)C. 登录步骤 (7)三. 数据展示分析 (8)A. 规则 (8)B. 数据库组成分析 (9)C. PIS库居民个案展示 (11)D. 全员库居民个案展示 (13)三. 数据修复 (14)A. 按家庭修复 (14)B. 身份证不规范数据清理流程 (15)定义 (15)清理规则 (16)人工修复步骤 (16)C. PIS独有数据清理流程 (19)定义 (19)清理规则 (19)人工修复步骤 (20)D. 不一致的数据清理流程 (21)定义 (21)清理规则 (21)人工修复步骤 (22)E. 重复数据清理 (25)定义 (25)清理规则 (25)人工修复步骤 (26)四. 其他功能 (29)A死亡人口 (29)B. 迁出人口 (30)C. 难以修复的数据 (31)D.重复数据清理 (32)(E)不一致数据清理 (32)(F)PIS独有数据清理 (32)(G)身份证不规范数据清理 (32)五. 导出Excel (33)总体规则数据核查分为以下几步来完成:∙建立全员库。
全员库根据最新的人口数据结构而升级,能包含和表达以前所没有的信息,可以看作是原PIS库的升级版。
∙将公安户籍库的数据(2011年)程序全部导入全员库。
∙将PIS库与公安户籍库比对,符合条件的,程序自动导入全员。
需符合的条件包括:∙有正确的身份证号码∙根据身份证号码能在公安户籍库中找到对应的,姓名一致的记录∙在全省的PIS库的范围内无重复∙若是PIS独有而户籍库没有的数据,根据身份证号调用最新的公安身份证查询接口,看能否找到相应数据,若找到,也符合条件。
∙PIS独有而户籍库没有的数据,若是新生儿,且其父母已经满足条件的,则该新生儿也满足条件∙对接出生平台,将在PIS中没有的,但其父母在PIS中存在的新生儿,且满足上述条件的,导入全员库∙不满足条件的,手工清理入库。
PIS数据若不满足上述规则,不能直接入全员库,需要人工核查确认。
核查的数据内容包括上图红色方块的内容。
而黄色方块内容是直接进入全员库的。
用户登录A. 规则将为每一个市县、每一个乡镇以及部分的村居委分配登录帐号。
分配规则是:1.省为每一个市县分配一个登录帐号。
2.每个市县为自己的乡镇和部分村居委分配帐号,帐号名必须全省唯一。
3.每个帐号只能看到自己所管辖区域内的数据,也只能添加自己所管辖区域内的帐号。
B. 创建登录帐号点击系统管理,菜单里的用户管理。
可以添加新用户、修改和删除原有用户a.添加用户:作为系统管理员可以创建两类角色:本级别以下的系统管理员和地区管理员。
1、创建系统管理员:b. 修改用户点击修改,跳转到此页面点击修改后提示大茂3用户修改成功c.删除用户1、点击“删除”按钮,跳转到此页面点击删除后,提示万宁2删除成功C. 登录步骤打开浏览器,在地址栏内输入以下网址并按回车键:http://59.212.128.73:8080/population/homehttp://59.212.128.73:8080/population/legin进入当前页面,并在页面上输入用户名和密码,默认密码为123456输入用户名、密码进入首页,以下页面以账号“兴隆1”登录为例数据展示分析A. 规则数据展示分为宏观展示和微观(个案)展示。
宏观展示包括数据库组成分析,微观展示包括PIS库和全员库的个案展示。
其中,在宏观展示里有核查总进度的实时跟踪,该指标与清理任务的考核相关,应给予足够重视。
B. 数据库组成分析数据库的组成分析展示数据库的概况,包括以下三个方面:a.核查总进度核查总进度就是一个进度条,表示当前已完成任务的百分比。
其中分母是所需要清理的数据总量,包括四项清理任务所需要清理的记录总数(不是人口总数),并且排除了已死亡、已迁出且难以修复的人口。
分子就是在分母基础上已经清理完成的记录总数。
当达到100%时,说明清理全部完成。
b.核查总进度核查进度条上,有四块不同颜色的进度条,对应了我们需要处理的四种类型的数据,每当我们完成了一条清理任务后,对应的数字将会减少,直到为0,就说明该区域的清理任务都已经完成了。
同样,这里的数字也排除了已死亡、已迁出且难以修复的人口。
c.全员库概况通过全员库概况可以很清晰的看出全员库数据的组成。
注意,这里是全员库,而不是PIS库,所以PIS库有部分数据(特别是PIS独有的数据,主要是外省流入人口和新生儿),在这个库里找不到,有待核查入库。
组成主要分以下几项:PIS导入人口——已经从PIS导入全员库的人口。
PIS库与户籍库共有,尚未导入的人口——PIS有,在公安户籍库中也有,但是因为数据不规范,需要清理,所以暂未入全员库。
户籍库独有人口——因为户籍人口是全部进入全员库的,所以全员库会包括一些PIS 里没有的数据,这可能是PIS没有录入的实有人口,也可能是流出到外省的户籍人口。
出生平台导入人口——从出生实名里导入的,PIS里没有登记的新生儿。
不过这部分新生儿的父母在PIS里都是能找到的。
点击PIS导入人口蓝色部分可查看具体PIS导入人口数据细分分布。
PIS导入人口包括两部分:PIS和户籍库共有已导入的人口——PIS和户籍库共有,且数据无质量问题,符合规范的,或者手工清理过的,都会导入全员库。
PIS独有已导入的人口——一部分PIS独有的数据也会预先导入进来,例如新生儿。
后期清理,确认的独有实有人口,也会包含在这里。
C. PIS库居民个案展示点击页面上的“数据展示分析”按钮,选择下拉菜单中的“居民个案展示(PIS库)”按钮,可以进入PIS库居民信息查看界面,可以根据姓名、身份证号码、户籍地地址、现居住地地址查到PIS库居民信息。
点击查看详情可查看PIS库居民信息详情,包括基本信息以及附属信息。
(无户籍信息,有家庭信息、生育史、流动轨迹、妊娠史等)家庭成员信息这里,可以查看历史家庭成员信息。
例如:对于出嫁女,看到的家庭成员信息肯定是现时和丈夫在一起的家庭,若要查看未出嫁前和父母生活在一起的家庭情况,请点击“查看历史家庭成员信息”。
D. 全员库居民个案展示全员库与PIS库的个案展示界面相似,不同的是全员库这边初始只有户籍信息,而暂无家庭、生育等附属信息。
PIS数据清理完一条,就会导入到全员库一条,导入过来的数据就能看到家庭、生育等附属信息了。
数据修复A.按家庭修复数据清理,应按照家庭单位去修复。
因为在清理数据时,确认真实与否,是以家庭为单位的,家庭里若一个成员是真实数据,整个家庭基本都是真实数据,应该是整户入库。
并且,在做上门核查时,也是以家庭为单位上门核查的。
1、点击“按家庭修复”,选择“查看”2、进入家庭修复详细列表。
家庭修复详细列表里,列出了家庭成员的信息,以及每个家庭成员所对应的户籍信息(若有的话)。
在家庭成员信息中,列出了数据的质量问题以及对应的修复操作。
A.身份证不规范数据清理流程定义所谓身份证不规范,应包含以下两层含义:∙身份证号码为空。
∙身份证号码不为空,但身份证校验失败。
比如有很多新生儿数据用出生证做身份证号码,这是肯定会校验失败的。
未迁出,未死亡,且有依据修复(家庭成员在户籍库中)对这部分数据,只有补全身份证才能进入全员库。
清理规则1.通过与公安户籍库进行对比,若发现在户籍库中有户籍户成员与PIS库里的家庭户的该成员对应,则用户籍库里的身份证号码修复PIS库里的相应数据。
这是由程序自动做的,已经修复了部分身份证不规范的数据。
2.通过与新农合的数据进行对比,若发现在新农合中有新农合成员与PIS库里的家庭户的该成员对应,则用新农合里的身份证号码修复PIS库里的相应数据。
这是由程序自动做的,已经修复了部分身份证不规范的数据。
3.剩下的数据,需要入户调查后,人工修复。
4.对于这部分入户调查数据,通常是将名单导出excel,让基层人员拿着名单去做调查。
导出excel请见第五章.导出Excel。
人工修复步骤在家庭成员列表中,找到身份证不规范的数据点击“修复”链接后进入,身份证不规范修复页面如果需要修复对象姓名,需要点击“修改姓名”按钮进行姓名的修复信息中显示出来接下来修复身份证号码,点击界面上的“录入身份证”按钮,进行身份证的修复工作将在PIS基本信息中显示出来,并同时修复性别,出生日期点击“修复后导入全员库”按钮,完成此条不规范身份证的修复(若为“本地人口且未曾入公安户籍”、“越南人”“香港人”等,是否能点击“修复后导入全员库”按钮,来完成此条不规范身份证的修复?)C. PIS独有数据清理流程定义PIS独有数据,需满足以下几个条件:∙身份证规范∙根据身份证到公安户籍库中查找,没找到对应数据∙未迁出,未死亡,且有依据修复(家庭成员在户籍库中)对于这部分数据,需要确认其真实性,是否是本地区的实有人口。
若是,则需要导入全员库。
清理规则1.因为公安户籍库是2011年的,对于近几年的新生儿数据,只要父母在PIS库和户籍库中都存在,则这部分独有的新生儿数据会自动导入全员库。
2.剩余的未死亡未迁出,且有依据可修复的数据,会留待人工修复。
人工修复步骤如果该居民信息已核实,点击“导入”PIS库独有导入成功后,显示修复成功如果该居民信息无法确认,选择“丢弃”D. 不一致的数据清理流程定义不一致的数据需满足以下条件:∙有身份证号码,且规范∙根据身份证,能在公安户籍库中查找到对应的数据∙姓名与公安户籍库不一致∙未迁出,未死亡对于这部分数据,需要修复PIS这边错误的身份证号码,并导入全员库。
清理规则1.程序智能判断是否是错别字造成的不一致(如公安户籍库里是李芸,在PIS库里是李云)。
若是,自动修复并导入全员库。
2.剩下不一致数据,姓名差别较大,需要人工确认,是姓名错了还是身份证错了,并作出修复。
修复完成后会自动导入全员库。
人工修复步骤点击“修复”链接进入居民个案修复页面左上角显示的是PIS库基本信息右上角显示的是全员库基本信息左下角显示的是PIS库家庭信息点击户籍家庭信息按钮后在右下角显示全员库户籍家庭信息具体修复步骤,分为可修复和无法修复。
第一种:可修复这里有两种情况:(1)、若是身份证号码错误,直接修改身份证号码若身份证号码错误,点击“修改身份证号码”,输入身份证号码,修复身份证。
点击成功修复,确认修改后的信息将导入全员库。
(2)、若是姓名错误,点击“同步”按钮若PIS库无法确认居民信息正确与否,点击“户籍家庭信息”,查看李雪芳的户籍信息查看家庭,可以确认户籍信息是正确的,所以点击同步:修复对象基本信息变为:点击成功修复,修改后的信息导入全员库第二种情况:无法修复居民信息暂时无法确认,点击无法修复跳转不一致居民信息处理失败页面,提示“确认该居民记录暂时无法修复”E. 重复数据清理定义重复数据需满足以下条件:∙身份证在PIS库中对应多条数据∙这个重复是在全省的数据范围内判断的,所以重复数据会比PIS里的更多。