当前位置:
文档之家› SPSS统计分析- 第2章 数据文件建立和管理
SPSS统计分析- 第2章 数据文件建立和管理
4.读取“*.txt”数据文件
现需将“人居收入.txt”文件中的数据读入SPSS,如图所示: (1) 打开“数据编辑器”对话框,选择“文件”|“打开文本数据”命令,打 开“打开数据”对话框。选择文本文件,单击“打开”按钮,打开“文本导入向 导”对话框,如图所示:
(2) 在“您的文本文件与 预定义的格式匹配吗? ” 选项组中选择 “ 是 ” 单选 按钮,可单击“浏览” 按 钮,选择已预定义好的 格式;单击 “ 否 ” 则需要 建立一个新格式。
2.1.1 打开定义变量视图
• 按前一章所述打开SPSS主界面,视图切换标签处单击“变 量视图”,即打开“变量视图”窗口,如图所示。在该视 图可对变量的以下属性进行定义:名称、类型、宽度、小 数、标签、值、缺失、列、对齐、度量标准和角色。
2.1.2 定义变量名称
• 在“变量视图”变量栏的“名称”栏中定义变量名称,用 户可根据数据需要或个人习惯进行定义,如果不对变量进 行定义,系统将自动默认变量名为var00001、var00002、 var00003等。一般根据变量的实质意义来命名,例如:年 龄、性别、年级等变量,可用Age,Gender,Grade命名,也 可用中文意义命名,但当出现变量数量较大时,一般使用 流水编号,即防混淆又方便。虽然变量可根据用户的需求 自行编辑,但仍有其需共同遵循的原则: • 若用英文命名,变量名首字必须为英文字母,其后方可接 数字、英文字母、@等。若用中文命名,则可直接使用。 • 不可使用空格和特殊字符(如键盘上的!、#、$、%、&、 ^、*、(、)、?等字符)。
(9) 之后进入下一步,如图所示。在“变量之间有哪些分隔符?”中,可根据 文本数据中变量间的分隔符,可选择“制表符”、 “空格”、“逗号 ”、“分号” 和“其他”复选框。在“文本限定符是什么?”中,可选择“无”、“单引号”、“ 双引号”和“其他”单选按钮,一般默认为“无”,选择完毕后单击“下一步” 。
2.2.3 数据文件的存储
• 选择“文件”|“保存”|“另存为”|“保存所有数据” 命令,即打开“将数据保存为”对话框,如图所示。
• 若要对部分变量进行保存,单击“变量”按钮,打开“数据存 储为:变量”对话框,如图所示,在复选框中勾选需要选择的 变量。或单击“全部保存”按钮,选择全部变量;单击“仅可 视”按钮,选择正在使用中的变量集;单击“全部丢弃”按钮, 撤销对所有变量的选择。单击“继续”按钮,再次打开“将 数据保存为”对话框。单击“保存”按钮,即可完成数据的存 储。
3.读取“*.xls”数据文件
(1) 打开“打开数据”对话框,单击“文件类型”下拉列表框中 的下三角按钮,选择“Excel( *.xls,*.xlsx,*.xlsm )”命令。 (2) 选择需要打开的数据文件,单击“打开”按钮,打开“打开 Excel数据源”对话框。如图所示: (3) 选择需打开的数据文件,单击“确定”按钮,即读取Excel 数据文件。
(3) 单击“下一步”按钮,进入下一步,如图所示。在“变量是如何排列的?” 选项组中,根据原有文本文件的格式,选择“分隔”表示使用分隔格式的数据 结构;选择“固定宽度”表示使用固定格式的数据结构。
(4) 在 “变量名称是 否包含在文件的顶部 ? ” 选项组中,选择 “是”表示文本数据 的第一行,将被作为 变量名读入 “ 数据视 图 ” 窗口的变量栏中 ;选择“否”表示文 本数据的第一行,将 作为个案被读入 “ 数 据视图 ” 窗口的个案 1中。
2.3 编辑数据
• 将数据录入或读入“数据视图”窗口后,需对数据进行初 步加工,为后续统计分析做准备。这一部分将重点讨论, 在加工过程中会使用到的:数据的剪切、复制和粘贴,数 据的查找、替换,个案的增加和删除,数据的排序,数据 的行列互换,选择个案,数据的分类汇总,缺失值的替代, 数据的加权处理。
第2章 数据文件建立和管理
LOGO
• 本章将进一步具体讲解数据的录入、读取和存储,数据的 编辑,数据文件的预处理,以及数据文件的拆分与合并。
2.1 定义变量
• 在介绍对数据的具体操作前,首先需认识数据编辑视图。 数据编辑视图由“数据视图”和“变量视图”两个视图组 成,在视图左下角的视图标签处对以上两个视图进行切换; “数据视图”用于显示、编辑数据;“变量视图”用于显 示、编辑变量。
2.1.5 定义变量标签和数值标签
1.变量标签 • 在处理大量数据的过程中,为方便使用,变量名称越简单 越好。而同时在简化过程中很容易混淆这些变量名称,因 此给变量名称贴上“标签”,对它进行标识和区分就显得 尤为重要了。 2.值 • 由于变量有时可能有几个水平,每个水平代表不同的意义, 而对水平所赋予的“值”本身并不能代表这些意义,这样 就需对“值”进行标识。 • 例如:性别有两个水平(男和女),为便于区分,用 0 代 表男, 1代表女(数值仅是一种符号,无实际意义,可自 行选择数值),如此既能表示变量的不同水平,又便于后 续统计分析。具体操作如下:
• 一些文本框支持预定义的角色,从而对预先选择的变量进 行分析,角色的分配不仅影响文本框,还可影响语法命令。 SPSS 18.0 软件在“变量视图”窗口中增添了对“角色” 的定义,系统提供了6种选择,如图所示。
2.2 数据录入、读取和存储
• 以上介绍了如何在“变量视图”窗口中定义变量的各种属 性,这一部分将把目光转向“数据视图”窗口。定义好数 据的规则后,接下来将具体介绍数据的录入、读取和存储。
• 将光标移至“值”栏的单元格中,单击里面的按钮,即弹出“ 值标签”对话框,如下图所示: • 在 “值 ” 文本框中输入数值,在 “标签 ” 文本框输入标识(字 符串)。单击 “ 确定 ” 按钮,即生成标识语言。如下图所示 。待定义完所有数值标识后,单击“确定”按钮。
2.1.6 定义变量缺失值
• 在实际的调查研究工作中,经常出现被试不答、漏答和错 答的情况,而这些不答、漏答和错答的题目在总体数据中, 就构成了缺失值。 SPSS 18.0 软件提供定义变量缺失值的 功能,如图所示,对不合理的缺失值进行定义,使缺失的 变量值不参与统计分析。
2.1.8 定义变量度量类型
• 在“变量视图”窗口中的“度量标准”栏中定义变量度量 类型, SPSS 18.0 软件将量表分为:度量、序号和名义, 如图所示,分别对应等距 / 等比变量、序列变量和称名变 量使用,系统默认值为“度量”。用户可根据分析变量或 量表的性质进行选择。
2.1.9 定义变量角色
• • • • • *.sav: SPSS for Windows数据文件 *.sys: SPSS/PC+数据文件 *.syd: Systat软件包的系统文件 *.por: SPSS for Windows版本的ASCII码数据文件 *.xls,*.xlsx,*.xlsm: Excel数据文件
• • • •
*.w: Lotus公司的1-2-3格式数据文件 *.slk: Multiplan公司的symbolic格式的数据文件 *.dbf: 数据库dBase,Foxbase格式数据文件 *.sas7dbat,*.sd7,*.sd2,*.ssd01,*.ssd07,*.xpt: SAS软件包 的长文件名的数据文件 • *.txt,*.dat: 纯文本数据文件 • *.dta: 数据管理统计绘图软件(Stata)数据文件 • *.*: 所有文件
2.1.7 定义数据列宽和对齐方式
• 在“变量数据”窗口的“列”栏中,定义数据显示的列宽 (默认值为8 个字符,最大值为256个字符),如图1所示。 在“对齐”列中,定义数据对齐的方式:“左”、“右”、 “居中”(默认“字符串型”数据为“左”,“数值型数 据”和“日期型数据”为“右”),如图2所示。 图1 图2
(10) 之后进入下一步,如图所示。在“数据预览”中选择变量。在“变量名称 ”文本框中输入欲使用的名称,也可使用系统默认的名称。在“数据格式”下拉 列表框中选择数据格式,选完后单击“下一步”。
(11) 之后进入下一步,如图所示。可根据选项组的内容,对该操作的文件格 式和语法进行保存。若勾选“在本地缓存数据 ”,可在磁盘中临时保存数据文 件的完整副本。缓存数据文件可以提高 SPSS 的性能。单击 “完成 ”按钮,即 成功读取文本型数据文件。
其中有3个单选按钮:
没有缺失值:系统默认值,在 “ 数据视图 ” 窗口中用 “.”表示。 离散缺失值:最多可在 3个文本框中分别输入 3个不 同的数值为缺失值。 范围加上一个可选离散缺失值:可在 “低 ”、 “ 高 ”文 本框中输入缺失值的范围,并在 “ 离散值 ” 文本框中 输入一个单独的缺失值。
2.1.3 定义变量类型
• 如图1 所示,单击图中圆圈处按钮,打开“变量类型”对 话框,如图2所示。 图1 图2
• SPSS 18.0软件提供了8种变量类型,如表所示。
2.1.4 定义变量宽度和数据小数位数
• 在“变量视图”的“宽度”栏中(如图所示)定义数据宽 度(默认值为 8个字符,最大值为40个字符),在“小数” 栏中定义小数位数(默认值为 2 个字符,最大值为 16 个字 符)。
• 不能使用相同的字符,英文字符不论大小写,都代表相同 的名称。 • 一般字符宽不超过 8 个字符( 4个中文),在 SPSS 18.0 中 可达到40个字符。 • 变量名不可使用系统保留字,如:All、And、By、Eq、Ge、 Gt、Le、Lt、Ne、Not、Or、To、With等变量名称。 • 变量名结尾不可使用“.”、“—”和“_”结尾。
2.2.2 数据文件的读取
1.读取“*.sav”数据文件 方法一:
启动SPSS 18.0软件时,会自动跳出PASW Statistic 18对话框, 如图所示。 若要选择已存在的数据,单击“打开现有的数据源”单选按钮, 在列表框中进行选择。若在列表框中没有想要找的文件,则双击“更 多文件”选项,弹出“打开数据”对话框,如图所示。
方法二:
进入“数据编辑器”窗口后,若想读取“*.sav”数据文 件,可执行下操作: 选择“文件”|“打开”|“数据”命令,即打开“打开 数据”对话框,如图所示。根据数据的文件格式在列表框中 进行选择,单击“打开”按钮,即打开所需数据。