当前位置:文档之家› SPSS教程1数据文件

SPSS教程1数据文件

一.数据文件SPSS所处理的数据文件有两种来源:一是SPSS环境下建立的数据文件;二是调用其它软件建立的数据文件。

1 在SPSS数据编辑窗口建立数据文件当用户启动SPSS后,系统首先显示一个提示窗口,询问用户要SPSS做什么时,把鼠标移至“Type in data”项上单击左键选中,然后单击“OK”按钮;或者该窗口中单击“Cancel”按钮进入SPSS数据编辑窗屏幕,如图所示。

图进入SPSS数据编辑器(1) 数据编辑(SPSS Data Editor)界面介绍窗口名显示栏:在窗口的顶部,显示窗口名称和编辑的数据文件名,没有文件名时显示为“Untitled-SPPS Data Editor”。

窗口控制按钮:在窗口的顶部的右上角,第一个按钮是窗口最小化,第二个按钮是窗口最大化,第三个按钮是关闭窗口。

SPSS主菜单:在窗口显示的第二行上,有:File文档,Edit编辑,View显视,Data数据,Transform转换,Analyze分析,Graphs图形,Utilities公用项,Windows视窗。

图 SPSS窗口界面常用工具按钮:在窗口显示的第三行上,有:打开文档,保存文档,打印,对话检索,取消当前操作,重做操作,转到图形窗口,指向记录,指定变量操作,查找,在当前记录的上方插入新的空白记录,在当前变量的左边插入新的空白变量,切分文件,设置权重单元,标记单元,显示价值标签。

数据单元格信息显示栏:在编辑显示区的上方,左边显示单元格和变量名(单元格:变量名),右边显示单元里的内容。

编辑显示区:在窗口的中部,最左边列显示单元序列号,最上边一行显示变量名称,缺省为“Var”。

编辑区选择栏:在编辑显示区下方,Data View 在编辑显示区中显示编辑数据,Variable View在编辑显示区中显示编辑数据变量信息。

状态显示栏:在窗口的底部,左边显示执行的系统命令,右边显示窗口状态。

(2) 数据文件格式数据文件格式以每一行为一个记录,或称观察单位(Cases),每一列为一个变量(Variable)。

由于SPSS不同的统计分析过程需要不同的数据类型,因此,在学习使用SPSS 软件作统计分析时要注意这个问题。

现在,我们通过一个例子来学习数据的输入操作。

例:马尾松腮扁叶蜂在林间表土层的水平分布调查数据(3) 定义变量建立数据文件的第一步是定义变量。

在数据编辑窗口左下角激活(Variable View)变量定义窗口,如下图在数据窗口中,用户定义数据变量的名称、数据类型、宽度、小数位和标记等信息。

变量名称输入字符(汉字和英文)作为变量的名称,本例为,样地1,样地2,样地3。

如不输入名称,系统依次默认为“var00001”、“var00002”、“var00003” …。

变量应遵循下列原则:∙在SPSS10.0中限制为8个字符长度(4个汉字);在SPSS12.0中没有限制。

∙首字符必须是字母或汉字,不能以下划线“_”或圆点“,”结尾。

∙变量不能有空格或某些特殊符号,如“!?*”等。

∙变量名不能与SPSS的关键字相同,即不能用ALL、AND、BY、EQ、GT、LE等。

变量的数据类型当鼠标指针移至单元格,单击后该单元格的右边就会显示一个“…”按钮,单击该按钮就会显示一个数据类型设置窗口,如下图所示。

可供选择的数据类型有:∙Numeric标准数值型,系统默认。

例如: 12345.67∙Comma逗号数值型。

例如: 12,345.67 千分位用逗号∙Dot圆点数值型。

例如: 12.345,67 千分位用圆点∙Scientific notal科学记数法。

例如: 1.2E+04∙Dat日期型,有27种形式。

例如: mm/dd/yyyy∙Dollar美元型。

例如:$12345.67∙Custom currency自定义型。

例如:12345.67∙String字符型。

例如:12345.67width指定数据字符占据的总个数(包括小数点和小数位)。

Decimal 指定小数位。

根据本例的要求,变量定义如图所示。

变量标签(Label):有的时候变量名不能正确反映变量含义,有必要给它贴上标签以便识别。

这个时候,就在变量定义的标签栏里输入你的注释。

变量值标签(Values):变量值标签是用来帮助解释某些变量,特别是分类变量的数值含义。

例如,有一个数值变量,0表示女性,1表示男性。

此时,为了便于识别这些数值,我们是用变量值标签。

在下图的第一个Value栏输入数值,在第二个Value栏输入数值标签。

当两个输入栏输入内容后,Add按钮激活,点击它就定义了变量值标签。

如本例,定义了0=女和1=男。

需要修改和删除,使用Change和Remove按钮。

缺失值(Missing):缺失值是统计分析时,对数据中缺少数据的一种统计识别值。

缺失值定义窗口如下图。

No missing values 没有定义缺失值,用系统默认值圆点“.”表示。

Discrete missing values 可以定义3个缺失值,例如,第一格输入“0”,表示凡为0的数据是缺失值。

Range plus one optional discrete missing value 定义取值区间为缺失值。

例如,Low:为1,High:为5,Discrete value:为10,表示1至5之间的数据及数值10视为缺失值。

数据列的显示宽度(Columns): 显示数据的列宽,默认8个字符。

对齐方式(Align): 有左中右3种数据显示方式。

度量类型(Measure): 按度量精度将变量分为定量变量(Scale)、等级变量(Orsinal)和定性变量(Nominal)。

该选项仅用于统计绘图时坐标轴变量的区分以及决策树模块的变量定义。

定量变量,如虫口数、死亡率等;等级变量,如防治效果的好、不好等;定性变量,如害虫抗药性发生,低抗,中抗和高抗。

(4) 输入数据变量定义完成后,在编辑区选择栏里单击“Data View”卡片,编辑显示区显示为数据编辑。

在编辑区中,把与变量名相对应的数据输入到单元格里区,如下图所示。

数据输入后的数据编辑窗口2 调用已建立的数据文件SPSS可以调用SPSS(*.sav),Excel(*.xls),dBASE(*.dbf),ASCII(*.dat,*.txt)等数据文件。

2.1 调用SPSS数据文件(*.sav)从菜单选择File-Open-Data命令,在弹出的打开文件对话中指定数据文件的路径,文件名框内显示的是SPSS数据文件是系统默认的文件类型“*.sav”,点击所选文件,单击“打开”按钮,或双击所选文件。

这样就把该数据文件调入数据编辑窗口中。

2.2 调用ASCII数据文件(文本文件,*.dat, *.txt)文本文件(ASCII)格式是我们经常使用的一种文件格式,也是许多软件都具有的数据交换格式。

文本文件分变量固定字符宽度与使用分隔符分开变量格式(‘,’、‘;’)和制表(‘Tab’)两种形式,下面我们用例子来说明其操作。

1) 定字符宽度格式文本文件的输入我们使用Windows“记事本”创建一个显示如下格式的TEXT1.TXT的文件。

0 7 15.56 7 15.561 3 6.67 10 22.222 8 17.78 18 40.003 7 15.56 25 55.564 7 15.56 32 71.115 4 8.89 36 80.006 2 4.44 38 84.447 3 6.67 41 91.118 3 6.67 44 97.78该数据文件有5个变量,9个记录。

使用这种格式使用变量名称注意宽度不能超过对应的变量数据的宽度,否则会发生一些变量名称不对的错误。

该数据文件保存在配套光盘中(\SPSS\DATA\TEXT1.TXT)。

操作过程:(1). 在主菜单中点击“File-Open-Data”命令。

(2). 出现打开文件操作窗口,在“查找范围”栏指定文本文件“TEXT1.TXT”保存的文件夹;在“文件类型”栏里,单击该输入框或者右边的下拉按钮(三角形按钮),在下拉选项里选中“Text (*.txt)”,然后在文件列表框里选中“Text1.txt”文件,再单击“打开”按钮,如下图所示。

(3). 出现数据引导对话窗口,一共有6个对话窗口。

① 第一个对话窗口的设置Does your text file match a predefined format(该文本文件是否与以前定义过的格式匹配?)○Yes选择此项,则“Browse..”按钮被激活,可以将以前定义的文件调出。

⊙No不使用保存过的匹配文件,系统默认。

然后点击“下一步”按钮,出现文本输入向导的第二个对话窗口。

②第二个对话窗的设置(设置变量的分隔方式)图变量格式和变量名设置How are your variables arranged(变量间分隔方式?):○Delimited: 变量间用特殊符号分隔,系统默认;⊙ Fixed width:变量间为固定列宽度,本例选中该项。

Are variable names included at top your file (文件顶端是否含变量名?)○ Yes:文件中第1行为变量;⊙ NO:文件中没有变量名,系统自动给变量命名。

本例选中该项。

然后点击“下一步”按钮,出现文本输入向导的第三个对话窗口。

③第三个对话窗口的设置(设置纪录读取方式)The first case of data begins on which:指定第一数据从那行开始,本例选1。

How many lines represent a case 多少行为一个记录?本例选择1。

How many cases do you want to import (读入多少记录?)⊙All of the cases:全部记录。

系统默认,本例选中该项;○The first 1000 cases:开始的1000个记录;○A random percentage of the cases (approximately): 随机选择一定百分比。

然后,点击“下一步”按钮。

④ 在第四个对话窗口的设置(修改变量分割)可以在窗口的数据显示(Data preview)栏里,用鼠标抓住变量分隔竖线,调整竖线位置来符合变量取值宽度。

有如下三种操作:(1)修改变量字符宽度,用鼠标抓住分割线拖移;(2)插入一条分割线,在插入位置点击鼠标左键;(3)删除一条分割线,用鼠标抓住分割线拖移数据窗口。

调整完成后,点击“下一步”按钮。

⑤在第五个窗口定义变量属性Specifications for variable(s) selected the data preview(设置在数据显示栏选中变量的属性):Variable name: v1 重新定义变量名称。

相关主题