SPSS数据的预处理报告
旧变量的 分组范围
数据分组合并-算例
1.在数据“概率论成绩”中生成新变量“评价”,当 成绩小于60分时为“不合格”, 60~70分之间时为“合格”,
70~80分时为“中等”,
80~90分时为“良好”,
90分以上时为“优秀”。
3.1 排序
变量的排序是指根据变量值的大小按升序或降序进行排
列,在数据 →排序个案/变量中实现
3.5 计数
计算若干变量中有几个变量的值落入了指定区间内 ,并将结果存入一个新的变量中。
学号 语文 数学 英语 体育
001
.。。
89
66
85
90
3.5 计数——统计不及格课程数目
数据计数.sav 【转换T】【对个案内的值计数O】
目标变量名
目标变量名标签 参与计数的变量
定义计数区间
离散值
[60,90)
对数据的转换处理
针对每个个案,都有自己的结果
算述表达式:由常量、变量、算数运算符、圆括 号和函数组成的式子。
工资*0.1 Mean(数学,语文,英语)-60
3.3 变量计算
条件表达式:由关系运算符、逻辑运算符、变量、 常量、算术表达式等组成; 其结果为真(1) 或者 假(0) 关系运算符: 逻辑运算符:与(且)&;或|;非~ (nl<=35)and not (zc<3) 优先级
筛掉未选中的个案 将选中的个案拷贝 到一个新的数据文件 删除未选中的个案
随机近似百分比数值
从所有个案中选取?%的数量
精确选取 选取?个;从前?个个案中选取
3.6 分类汇总
分类汇总是按某分类变量进行分类计算,在数据 →分类汇总中 实现 按照那个变量分类 对哪个变量进行汇总,并指定汇总出哪些统计量 按照 性别 对 数学成绩进行汇总计算平均成绩
(3)选取某一区域内的样本 Based on time or case range 适用
于时间序列数据
(4)通过过滤变量选取 Use filter variable 要求指定一个 变量
作为过滤变量,变量值为非0或非系统缺失值的个案将被选中, 常用于排除包含系统缺失值的个案。
按指定条件选取 随机选取 选取某一区域作为样本 通Байду номын сангаас过滤变量选取
3.3 变量计算
根据用户的要求,在原变量的基础上,计算一个新的结
果,并生成一个新的结果变量。变量的计算在转换
Transform →计算变量Compute 中实现:
变量计算主对话框
存放结果的 变量名
函数库
条件
变量计算-算例
数据“厨师的得分表”是15名厨师参加某一次厨艺 大赛的成绩,比赛共分3个环节。 1.求每个厨师3个环节的加权总分,3个环节的权重 分别为0.3、0.5、0.2; 2.求第一环节分数在80分以上的厨师平均得分。
记录拆分主对话框
数据拆分-算例
1.数据“用户评价”是某一年全球通、动感地带、神 州行、大众卡对中国移动的服务评价,试根据用户类 型对数据进行拆分,比较各用户类型的评价平均分。
小 结
本章主要阐述了数据管理的基本内容,包括变量
的计算、分组合并、排序以及数据的合并等等。数据
良好的加工整理是数据分析的重要基础。
3.3 变量计算——P51
函数:可以看做是功能体;我们告诉已知,函数给出结果 Mean函数:功能 计算平均数 Mean(语文,数学,英语) 常见函数 算数函数 统计函数:均值(mean),标准差(Sd),方差 (Variance) 与分布相关的函数 查找函数 字符函数 日期函数 缺失值函数 其他函数
SPSS统计分析方法
Part 1:第三章 数据预处理
1.变量级别的数据管理
2.文件级别的数据管理(一)
3.文件级别的数据管理(二)
学习要求
学习要求
掌握变量计算、 分组合并等变量 级别的数据管理 方法
掌握记录排序、 数据汇总、数据 合并等文件级别 的数据管理方法
数据预处理的主要内容
数据预处理
…
3.3变量计算
即:分别计算出男生们的数学平均成绩和女生们的数学平均成
绩
分类变量
汇总变量
汇总结果加到当前数据编辑窗口
汇总结果保存到新建数据编辑窗口
汇总结果保存到数据文件
3.8 拆分
记录拆分在数据 → 拆分文件中实现,是指数据根据 需要,事先按用户的指定作分组,此后的所有分析
都将按这种分组进行,除非取消数据分割的命令。
Thank you!
变量排序主对话框
选择需要排序的变量
升序 降序
3.4 数据选取
数据选取指从大批量(总体)数据中按照一定规则选取部分数 据(样本)参与分析,在数据 →选择个案中实现 选取方法: (1)按指定条件选取 If condition is satisfied (2)随机选取 Random sample of cases
( ,60)
[90, )
3.6 分组合并
对同一变量的变量值按照某种分组,并合并。 变量的分组合并在转换 →重编码为相同(不同)变 量 中实现,相同变量表示在原始变量基础上修改, 不同变量表示生成一个新变量来表示分组情况
分组合并主对话框
选择需要分组合 并的变量
新变量设置
新变量设置对话框
新变量设置