当前位置:文档之家› 第七章 资料处理

第七章 资料处理


21世纪思想政治教育专业系列教材
第二节
矩阵式问题的编码 非常 同意 说法1 说法2 1 5 表2 同意 2√ 4
数据编码
说不准 3 3√ 不同意 4 2 很不 同意 5 1
说法3
说法4
1
5
2√
4
3
3
4
2√
5
1
社会调查方法
21世纪思想政治教育专业系列教材
第二节
矩阵式问题的编码
数据编码
表1该题中列出了4个小问题,数据库里面就设置4个变量,其代码可以 分别设置为B121、B122、B123、B124。B12是总问题代码,B12后面接 着的数字是矩阵里面各子问题的代码。 在资料回收之后,首先需要对回答进行后编码,特别是对于一些具有 定序层次答案的态度问题,编码时还要特别注意它的方向性。在上例 中,对于倾向于生儿子的看法,我们按1=非常同意,2=同意,3=说不 准,4=不同意,5=很不同意来赋值;而对倾向于生女儿的看法,我们 则按5=非常同意,4=同意,3=说不准,2=不同意,1=很不同意来赋值。 这样,矩阵中四种看法的具体赋值情况如表2 这样,矩阵中的子问题B121、B122、B123、B124的编码值分别是2、3、 2、2。在数据录入时,把编码值2、3、2、2录入数据库中的相应位置 即可。
社会调查方法
21世纪思想政治教育专业系列教材
第三节
数据清理方法举例
数据录入和清理
数据质量抽查:假设某个个案的数据在“文化程度”这一变量 上输错了,问卷上填答的答案是2(初中),编码值也是2,但 数据录入时却记录成了3(高中或中专)。由于3这个数值在有 效的编码值范围内,因此,有效范围清理方法检查不出这一错 误。同时,这一变量与其他变量之间又没有前述“性别”与 “怀孕次数”、“独生子女”与“兄弟姐妹的个数”那样的逻 辑联系,因此逻辑一致性清理方法也检查不出这一错误。 检查这类输入错误的唯一办法就是拿着一份一份的原始问卷, 一个答案一个答案地进行校对。这较为费力,抽查然后估计错 误率就是较好的解决办法。
实地审核
•特别及时,且效果较好; 但调查工作的组织和安 排要特别仔细,调查员 个人处理各种情况的能 力要比较强。
社会调查方法
21世纪思想政治教育专业系列教材
第一节
原始资料的审核与复查
资料的复查的含义及做法 •所谓资料的复查,指的是在调查资料收回后,由其他 人对所调查的样本中的一部分个案进行第二次调查, 以检查和核实第一次调查的质量。 复查的基本做法是:由研究者自己或者由研究者重新选择另外 的调查员,从原来的调查员所调查过的样本中,随机抽取 5%~10%的个案进行调查。一方面核实原来的调查员是否真的对 个案进行过调查(有的调查员会由于各种原因自编自填问卷答 案,而实际并没有发送给被调查者或访问被调查者);另一方 面可将两次调查的结果进行对比,以检查第一次调查的质量。
社会调查方法
21世纪思想政治教育专业系列教材
参考书目
1. 袁方.社会研究方法教程.北京:北京大学出版社,2004 2. 风笑天.社会学研究方法.3版.北京:中国人民大学出版 社,2009
3. 仇立平.社会研究方法.重庆:重庆大学出版社,2009
社会调查方法
21世纪思想政治教育专业系列教材
思考题目
社会调查方法
21世纪思想政治教育专业系列教材
第二节
矩阵式问题的编码 表1 非常 同意
数据编码
同意 说不 准 不同意 很不 同意
B12请对下列说法发表意见 非常 1.只有生儿子才能传宗接 代

2.生儿子是名气,生女儿 是福气
3.不孝有三,无后为大 4.生男生女都一样,女儿 也是传后人 √


社会调查方法
逻辑一致性清理:比如,在一项对青年夫妇进行的社会调 查中有这样一对相倚问题,其过滤性问题是:“你们有孩 子吗?”答案为“有”(编码为1)和“没有”(编码为 2)。而后续性问题是:“请问你们的孩子今年多大了?” 那么,对于那些在前一问题中回答“没有”的人(即编码 为2的人),在后一问题中的回答却不是空白,这时肯定 是出了问题。
社会调查方法
21世纪思想政治教育专业系列教材
第二节
多 项 选 择 题 的 编 码
数据编码
A31在下列伦理关系中,您最重视哪些关系?(限选4项并排序) 最重视(1),第二重视(2),第三重视(6),第四重视(12) (1)父母与子女(2)夫妇(3)兄弟姐妹(4)同事或同学(5) 上级或下级(6)师生(7)与自然的关系(8)个人与社会(9) 个人与政府(10)个人与工作单位 (11)网上关系(12)朋友 该题中需要排序的答案的数量为4,数据库里面就设置4个变量, 其代码可以分别设置为A311、A312、A313、A314。A31是问题代码, A31后面接着的数字是表示重要性程度的序号代码。A311用来指代 最重视的关系,A312用来指代第二重视的关系,依此类推。A311、 A312、A313、A314的编码值分别是所选答案的预编码值,即1、2、 6、12
社会调查方法
21世纪思想政治教育专业系列教材
第三节 数据录入和清理
数据清理的方法 有效范 围清理
数据清 理的方 法
数据质 量抽查
逻辑一 致性清 理
社会调查方法
21世纪思想政治教育专业系列教材
第三节 数据录入和清理
有效范围清理 逻辑一致性 清理 • 其基本思路是 依据问卷中的 问题相互之间 所存在的某种 内在的逻辑联 系,来检查前 后数据之间的 一致性。 数据质量抽查
1. 资料的实地审核与集中审核各自有哪些优点与缺点? 2. 按照本章介绍的问卷数据录入方式,在计算机上分别进 行尝试,并比较各种录入方式的特点。 3. 找一份实际社会调查的原始数据,按照本章所介绍的方 法,对其进行有效范围清理和逻辑一致性清理。
社会调查方法
21世纪思想政治教育专业系列教材
社会调查方法
21世纪思想政治教育专业系列教材
社会调查方法
主编 风笑天 副主编 龙书芹
社会调查方法
21世纪思想政治教育专业系列教材
第七章 资料处理
本章内容
原Байду номын сангаас资料的审核与复查
数据编码
数据录入和清理
社会调查方法
21世纪思想政治教育专业系列教材
第一节
原始资料的审核与复查
资料审核的含义
资料审核是资料处理工作的第一步。它是指研究者对调查所收 集到的原始资料(主要是问卷)进行初步的审查和核实,校正错填、 误填的答案,剔除乱填、空白和严重缺答的废卷,其目的是使得原 始资料具有较好的准确性、完整性和真实性,从而为后续的资料整 理、录入和统计分析工作打下较好的基础。 资料审核工作包含两方面的内容:首先是检查出问卷资料中存 在的问题,接着是重新向被调查者核实。 资料审核工作主要有两种不同的做法。一种是实地审核;另一 种是集中审核
社会调查方法
21世纪思想政治教育专业系列教材
第二节 数据编码
编码就是给调查问卷中的每个问题及其答案赋予一个 数字作为代码。
单项选择题的编码在调查问卷的设计中就已经将答案的代码确定好了。
编码 A1你的性别: 1男√ 2女 A2你的年龄: 28 周岁 A3你的文化程度: 1.小学及以下 2.初中 3.高中及中专√ 4.大专及以上 A4你的婚姻状况: 1.未婚 2.已婚√3.离婚 4.其他 1 28 3 2
社会调查方法
21世纪思想政治教育专业系列教材
第二节 数据编码
多项选择题的编码
问卷里的一个多项选择题在数据库里要转换成多个变量,变量的数 量由该题的备选答案的数量决定,有多少个备选答案,就有多少个 变量。每个备选答案的预编码(问卷设计时拟定的编码)就是相应 变量的代码。然后对每一个答案进行“1”、“0”编码,即被选择 的答案编码为“1”,未被选择的答案编码为“0”。 举例,见本书140页
社会调查方法
21世纪思想政治教育专业系列教材
第二节
编码手册
数据编码
由于社会研究的样本规模通常达到成百上千,而一份问卷中又包 括好几十个问题,这样问卷编码的任务往往十分繁重,需要多人共同 完成。为了减少编码工作的误差,保证编码数据的质量,研究者需要 编制一份编码手册(也称编码簿)发给编码员,每个编码员则按照编 码手册的要求,统一进行编码。在编码手册中,研究者将编码的项目 和问题一一列出,逐一规定它们的代码、宽度、栏码、简要名称、答 案赋值方式及其他特殊规定等。整个编码手册的格式要规范统一,指 示要明确,且容易理解,便于操作。
• 对于问卷中的任 何一个变量来说, 它的有效编码值 往往都有某种范 围,而当数据中 的数字超出了这 一范围,可以肯 定这个数字一定 是错误的。
• 人们往往采用随机 抽样的办法,从样 本的全部个案中抽 取一部分个案,进 行这种形式的校对 工作。用这一部分 个案校对的结果, 来估计和评价全部 数据的质量。
社会调查方法
21世纪思想政治教育专业系列教材
第三节
数 据 清 理 的 方 法 举 例
数据录入和清理
有效范围清理:如果在数据文件的“性别”这一变量栏 中,出现了数字5或者7、8等,我们马上可以判定这是错 误的编码值。这种错误可能发生在原始问卷的填写上; 发生在编码员对问卷的编码结果上或数据录入过程中。
社会调查方法
21世纪思想政治教育专业系列教材
第三节 数据录入和清理
数据的录入方式及工具
数据录入的方式主要有两种:一种是直接从问卷上将编好码的数据输入 计算机;另一种是先将问卷上编好码的数据转录到专门的登录表上,然 后再从登录表上将数据输入计算机。 直接从问卷上输入数据的优点是避免了再次转录中可能出现的差错,其 缺点是录入时要不断地翻动问卷,录入的速度相对要慢一些。将问卷上 的数据先转录到登录表上,再输入计算机的做法,虽然可以使得计算机 录入员比较方便,速度也相对较快,但它却要冒增加差错的风险。 数据的录入既可以采用诸如ED、WordStar、WPS、Word等一般的编辑软 件,也可以采用专门的数据库管理软件,如dBase、FoxBASE、FoxPro等。
相关主题