当前位置:文档之家› 第八章 数据处理方法

第八章 数据处理方法

第八章 数据处理方法
关键词:调查资料整理、问卷验收和 审核、事前编码和事后编码、数据录 入、统计分组和汇总、变量数列、集 中趋势、离散趋势、百分数、统计图、 统计表
思考题:
1. 调查资料整理有什么意义?其基本步骤是 2. 3. 4. 5. 6.
怎样的? 哪些有问题的问卷可以进行失缺数据处理? 处理的的方法有哪些? 问卷编码与量表设计中的记分有何区别? 开放型问题是怎样编码的? 对社会现象变量值的分析,为什么要集中 趋势与离散趋势相结合?试举例说明。 应用百分数时应注意哪些问题?
字或字母来区别答案之间的不同,数字 的大小和字母的顺序没有实际大小或先 后的意义。 2. 记分则主要适用于态度量表或需要累加 总分的问题答案,它会明确规定注有不 同编码的答案的不同得分。
3、不同答案所记的分数一般与所编号 码是不一样的,但在强度等级型答案中, 编号与记分可以是一致的。 4、对于封闭型问题为主的问卷,一般 都采用事先编码方式,而记分则多采用事 后记分,问卷中只说明记分的办法。 编码时要注意的其他问题(P283)
作业: :
1. 您所在专业学生结构及动态分析 2. 试调查一定数量的男生和女生的每月生活
费支出情况,比较男女生每月生活费支出 的集中趋势和离散趋势及其构成情况。
一、调查资料整理
(一)调查资料整理的意义
调查资料整理,就是根据调查研究的目 的,运用科学的方法,对调查所获得的资料 进行验收、审核、分类、汇总等初步加工, 使之系统化和条理化,并以简明规范的方式 反映调查对象总体情况的工作过程。
三、文字资料的整理与数字资料 的分组及汇总(略) 四、集中趋势和离散趋势描述 (略) 五、统计图表(略)
六、统计分析中的百分数描述
1、概念和类型
百分数是将对比基数定为100而计算出来的 相对数,用%表示。最常见的有:
结构相对数 动态相对数 比较相对数 进度相对数
百分数的变形有系数、倍数、成数、千分 数等。
事后编码是指问卷调查实施完成后,给那 些事先没有编码的答案编上一个代码的编码方 式,主要适用于封闭型问题的“其他”项和开 放型问答题。 事后编码的具体做法: 第一步,列出答案 第二步,合并答案 第三步,进行编码 第四步,记录编码 例见P282—283
问卷答案的编码与量表答案的记分是不 同的:
1. 编码适用所有问题的答案,它只是用数
(二)数据录入
1. 首先要对问卷进行编号 简单编号 分类编号 2. 要发给每位录入人员一份清楚的编好码的问
卷、编码本和电脑记录格式说明等。 3. 问卷数量不是很多或录入工作量不大时,可 采用双机或两次录入的办法,以检验录入数 据的差错情况。 4. 最好采用能进行逻辑识别和检查的数据录入 软件系统,让明显有误的答案代码录不进去。
(二)问卷资料的验收
1. 填写问卷回收登记表; 2. 对回 Nhomakorabea问卷进行编号,分类存放; 3. 如果有几组人同时在进行核对、编码和录入
工作时,必须按问卷编号准确记录问卷的领 取和交回数量,以防出现混乱、遗漏或重复 输入,甚至丢失问卷; 4. 问卷资料回收工作要有专人负责; 5. 验收结束后要计算回收率和差错率。 。
(三)问卷资料的审核
1. 基本的审核方法有三种: 1. 经验判断 2. 逻辑检验 3. 计算审核 2. 剔除有问题的问卷 1. 回答不全的问卷 2. 回答错误的问卷 3. 缺损的问卷 4. 回答者不符合样本要求的问卷 5. 有明显逻辑错误或计算错误的问卷
3、对有问题问卷的处理
一是问卷作废 二是进行补查 三是对有差错的答案按失缺数据处理
1. 用一个中间值或平均数来代替。 2. 用一个估算的答案代替被调查者的回答。 3. 直接删除问卷中有差错的问题,同时调整样本
单位数,但要注意同一问题的删除率不能太高。
二、调查资料的编码与录入
(一)编码
编码是指在问卷调查中,给每一个问题的每 一个可能答案编上一个代码。
事前编码和事后编码:
事前编码是指在问卷设计时就给列出的备选 答案编上号码。主要适用于封闭型答题。
调查资料整理是整个调查活动的 一个重要环节,它既是对前期资料收 集工作的总结,对资料进行去伪存真、 补遗改错、分类汇总的预处理,又是 根据研究的目的要求对资料进行的初 步加工,为后面的分析研究打下基础。
有三个方面的意义:
1. 它可以保证和提高调查资料的质量和使用价
值。 2. 它是进一步分析、研究和利用调查资料的基 础。 3. 调查资料经过整理,便于分类、建档和保存。
对问卷进行失缺数据处理必须满足以下条件:
1. 有问题问卷的数量很少,占总问卷数的比例很
少。 2. 回收问卷数基本满足调查的要求。 3. 进行补查困难较大,费用较高。 4. 问卷中答案差错率较低。 5. 出现差错的问题不是关键的实质性问题。 6. 出现差错的问题与其他问题不存在高度相关。
失缺数据处理方法有:
应用百分数应该注意的几个问题:
1. 利用百分数描述现象时,样本单位数(计算
的基数)不能太小,一般不小于50,否则会 产生误导。 2. 用百分数反映回答者的意见时,不能只提供 其中某一类回答者的意见,以此说明问题是 不全面的,而应列出所有类别回答者意见所 占的百分比。 3. 对基数不同的百分数不能简单地求平均,而 应用加权的办法计算加权算术平均数。 4. 在利用百分数的大小进行比较时,尤其在动 态发展或增长速度方面的比较,必须考虑绝 对值的大小。如用增长1%的绝对量来补充说 明。
相关主题