当前位置：文档之家› 第二章-SPSS数据文件的建立和管理(ppt文档)

第二章-SPSS数据文件的建立和管理(ppt文档)

教授（1）
0
15
8
副教授（2）
10
20
1
讲师（3）
20
10
1
助教（4）
35
2
0
频数数据举例
2-2 数据文件的结构和定义方法
SPSS数据的结构是对SPSS每列变量及其相关属性的描述，它的定义是通过数据编辑窗口中的变量视图实现的。
一、变量名二、数据类型三、变量名标签四、变量值标签五、缺失数据六、计量尺度
一、变量名（Name）
变量名是变量存取的惟一标志。在定义SPSS数据文件结构时应首先给出每列变量的变量名。为了方便记忆，变量名最好与代表的数据含义相对应。
变量名一般的起名规则： 1、变量名的字符个数不多于8个；变量名不区分大小写字母。允许汉字作为变量名，汉字总数不能超过4个；
2、首字符应以英文字母开头，后面可以跟除了！，？，*之外的字母或数字。下划线、圆点不能为变量名的最后一个字母；
3、变量名不能与SPSS内部特有的具有特定含义的保留字相同，如ALL，BY，NOT，OR等；SPSS有默认的变量名，它以字母“VAR”开头，后面补足5位数字，如VAR00001， VAR00012等。
二、数据的类型、宽度、小数位数 Type、 Width、Decimals
数据类型是指每个变量取值的类型。SPSS中有三种基本数据类型，分别为数值型、字符型和日期型。相应的类型会有默认的列宽或小数位数等。
3、日期型（Date）日期型用来表示日期或者时间数据，如生日、成立日期等变量可以定义为日期型。
三、变量名标签（Label）
1、变量名标签是对变量名含义的进一步解释说明，它可增强变量名的可视性和统计分析结果的可读性。
2、变量名标签可用中文，总长度可达120字符，但在统计分析结果的显示中，一般不可能显示如此长的变量名标签信息。
（5）美元符号型（Dollar）
SPSS变量默认小数
类型
长度位数
显示方式
标准型
8
Numeric
科学记数法型 8
Scientific Notation
逗号型
8
Comma
圆点型
8
Dot
美元符号型 8 Dollar
字符型
8
String
日期型
Date
2 标准格式数值变量，圆点表示小数点数值
2
科学记数法
五、缺失数据（Missing）
数据中明显错误或明显不合理的数据以及漏填的数据都可看做缺失数据。
例，在某项客户满意度的问卷调查数据中，某个被调查者的年龄是213岁。这个数据显然是一个不符合实际情况的失真数据。
例，在某项客户满意度的问卷调查数据中，某个被调查者的年收入没有填，是空缺的。
SPSS中说明缺失数据的基本方法是指定用户缺失值。在SPSS中处理的方式是：首先，在遗漏的数据处填入某个特定的标记数据，例，将遗漏的年收入数据用特定的标记数据（如9999999）来替代；然后，再指明这个特定的标记数据（如9999999）或那些明显的失真的数据（如213）等为用户缺失值。这样，在进行统计分析时，SPSS就能将这些用户缺失值与正常的数据区分开来，并依据用户选择的处理策略对其进行处理或分析等。
第二章
SPSS数据文件－－建立与管理
2-1 SPSS数据文件
一、SPSS数据文件的特点
1、SPSS数据文件的扩展名是.sav； 2、SPSS数据文件是一种有结构的数据文件。（结构＋内容）
二、SPSS数据的基本组织方式 1、原始数据的组织方式如果待分析的数据是一些原始的调查问卷数据，或是一些
基本的统计指标，那么这些数据就可按原始数据的方式组织。
打开住房状况调查：桌面－>培训->住房状况调查
一行为一个个案
一列为一个变量
二、计数数据的组织方式
有时所采集的数据不是原始的调查问卷数据，而是经过分组汇总后的计数数据。
在研究职称和年龄的关系时汇总得到如表所示的数据。其中职称的分组值分别为1～4，年龄段的分组值为1～3。
职称
年龄段 35岁以下（1） 36～49岁（2） 50岁以上（3）
2 圆点做小数点，逗点做三位分隔符的数值
2 逗点做小数点，圆点做三位分隔符的数值
2
ቤተ መጻሕፍቲ ባይዱ
有效数值前带$，以逗点为分隔符
无
一串字符
dd-mmm-yyyy、mm/dd/yyyy 等
2、字符型（String）字符型也是SPSS较常用的数据类型，由一串字符串组成。如职工号码、姓名、地址等变量都可以定义为字符型数据。
1、数值型数值型是SPSS最常用的数据类型，通常由阿拉伯数字（0 ～9）和其他特殊符号（如美元符号、逗号、圆点）等组成。SPSS中数值型有以下五种不同的标识方法：（1）标准型（Numeric）
（2）科学记数法型（Scientific Notation）
（3）逗号型（Comma）（4）圆点型（Dot）
定距型数据（Scale）：通常是指诸如年龄、身高、体重、血压等连续数值型数据，也包括“人数”、“商品件数”等离散数值型数据；
定序型数据（Ordinal）：具有内在固有大小或高低顺序，一般可以用数值或字符表示，它取值的大小能够表示观测对象的某种顺序关系（等级、方位或大小等），但是相邻级别之间的差距是不相等。例如，职称变量可以有低级、中级、高级三个取值，可分别用1,2,3表示。年龄段变量可以有老、中、青三个取值，分别用A、B、C表示等。
3、变量名标签这个属性是可以省略的，但建议最好给出变量名的标签。
四、变量值标签（Values）
变量值标签是对变量取值含义的解释说明信息，对于定类型和定序型数据尤为总要。
例，用数值1表示男，用数值2表示女。
可见，变量值标签对于定序数据（如收入的高、中、低）和定类数据（如民族、性别）来说是必不可少的，它不但明确了数据的含义，也增强了最后统计分析结果的可读性。变量值标签可以用中文。
SPSS用户缺失值是： ★ 对字符型或数值型变量，用户缺失值可以是1～3个特
定的离散值。 ★ 对一个数值型变量，用户缺失值可以在一个连续的闭
区间内并同时附加一个区间以外的离散值。
SPSS系统缺失值：是用一个圆点表示，它不等于0或.00，通常出现在数值型变量数据中。
六、计量尺度（Measure）
定类型数据（Nominal）：是指没有内在固有大小或高低顺序，而只是一种名义上的指代，一般以数值或字符表示的分类数据。如性别变量中的男、女取值，可以分别用1，2表示。民族变量中的各个民族，可以分别用汉、回、满等字符表示。

e商务文档

第二章-SPSS数据文件的建立和管理(ppt文档)

相关文档推荐：