当前位置:文档之家› 第二章-SPSS数据文件的建立和管理(ppt文档)

第二章-SPSS数据文件的建立和管理(ppt文档)


教授(1)
0
15
8
副教授(2)
10
20
1
讲师(3)
20
10
1
助教(4)
35
2
0
频数数据举例
2-2 数据文件的结构和定义方法
SPSS数据的结构是对SPSS每列变量及其相关属性的描述, 它的定义是通过数据编辑窗口中的变量视图实现的。
一、变量名 二、数据类型 三、变量名标签 四、变量值标签 五、缺失数据 六、计量尺度
一、变量名(Name)
变量名是变量存取的惟一标志。在定义SPSS数据文件结构 时应首先给出每列变量的变量名。为了方便记忆,变量名最好 与代表的数据含义相对应。
变量名一般的起名规则: 1、变量名的字符个数不多于8个;变量名不区分大小写字 母。允许汉字作为变量名,汉字总数不能超过4个;
2、首字符应以英文字母开头,后面可以跟除了!,?,*之 外的字母或数字。下划线、圆点不能为变量名的最后一个字母;
3、变量名不能与SPSS内部特有的具有特定含义的保留字 相同,如ALL,BY,NOT,OR等;SPSS有默认的变量名,它 以字母“VAR”开头,后面补足5位数字,如VAR00001, VAR00012等。
二、数据的类型、宽度、小数位数 Type、 Width、Decimals
数据类型是指每个变量取值的类型。SPSS中有三种基本数 据类型,分别为数值型、字符型和日期型。相应的类型会有 默认的列宽或小数位数等。
3、日期型(Date) 日期型用来表示日期或者时间数据,如生日、成立日期 等变量可以定义为日期型。
三、变量名标签(Label)
1、 变量名标签是对变量名含义的进一步解释说明,它 可增强变量名的可视性和统计分析结果的可读性。
2、变量名标签可用中文,总长度可达120字符,但在统 计分析结果的显示中,一般不可能显示如此长的变量名标 签信息。
(5)美元符号型(Dollar)
SPSS变量 默认 小数
类型
长度 位数
显示方式
标准型
8
Numeric
科学记数法型 8
Scientific Notation
逗号型
8
Comma
圆点型
8
Dot
美元符号型 8 Dollar
字符型
8
String
日期型
Date
2 标准格式数值变量,圆点表示小数点数值
2
科学记数法
五、缺失数据(Missing)
数据中明显错误或明显不合理的数据以及漏填的数据都可看 做缺失数据。
例,在某项客户满意度的问卷调查数据中,某个被调查者 的年龄是213岁。这个数据显然是一个不符合实际情况的失真 数据。
例,在某项客户满意度的问卷调查数据中,某个被调查者的 年收入没有填,是空缺的。
SPSS中说明缺失数据的基本方法是指定用户缺失值。在SPSS中处理的方 式是:首先,在遗漏的数据处填入某个特定的标记数据,例,将遗漏的年收 入数据用特定的标记数据(如9999999)来替代;然后,再指明这个特定的 标记数据(如9999999)或那些明显的失真的数据(如213)等为用户缺失值 。这样,在进行统计分析时,SPSS就能将这些用户缺失值与正常的数据区 分开来,并依据用户选择的处理策略对其进行处理或分析等。
第二章
SPSS数据文件 --建立与管理
2-1 SPSS数据文件
一、SPSS数据文件的特点
1、SPSS数据文件的扩展名是.sav; 2、SPSS数据文件是一种有结构的数据文件。(结构+内容)
二、SPSS数据的基本组织方式 1、原始数据的组织方式 如果待分析的数据是一些原始的调查问卷数据,或是一些
基本的统计指标,那么这些数据就可按原始数据的方式组织 。
打开住房状况调查:桌面->培训->住房状况调查
一行为一个个案
一列为一个变量
二、计数数据的组织方式
有时所采集的数据不是原始的调查问卷数据,而是经过分 组汇总后的计数数据。
在研究职称和年龄的关系时汇总得到如表所示的数据。其 中职称的分组值分别为1~4,年龄段的分组值为1~3。
职称
年龄段 35岁以下(1) 36~49岁(2) 50岁以上(3)
2 圆点做小数点,逗点做三位分隔符的数值
2 逗点做小数点,圆点做三位分隔符的数值
2
ቤተ መጻሕፍቲ ባይዱ
有效数值前带$,以逗点为分隔符

一串字符
dd-mmm-yyyy、mm/dd/yyyy 等
2、字符型(String) 字符型也是SPSS较常用的数据类型,由一串字符串组成。如 职工号码、姓名、地址等变量都可以定义为字符型数据。
1、数值型 数值型是SPSS最常用的数据类型,通常由阿拉伯数字(0 ~9)和其他特殊符号(如美元符号、逗号、圆点)等组成 。SPSS中数值型有以下五种不同的标识方法: (1)标准型(Numeric)
(2)科学记数法型(Scientific Notation)
(3)逗号型(Comma) (4)圆点型(Dot)
定距型数据(Scale):通常是指诸如年龄、身高、体重、 血压等连续数值型数据,也包括“人数”、“商品件数”等离 散数值型数据;
定序型数据(Ordinal):具有内在固有大小或高低顺序, 一般可以用数值或字符表示,它取值的大小能够表示观测对象 的某种顺序关系(等级、方位或大小等),但是相邻级别之间 的差距是不相等。例如,职称变量可以有低级、中级、高级三 个取值,可分别用1,2,3表示。年龄段变量可以有老、中、青三 个取值,分别用A、B、C表示等。
3、变量名标签这个属性是可以省略的,但建议最好给出 变量名的标签。
四、变量值标签(Values)
变量值标签是对变量取值含义的解释说明信息,对于定 类型和定序型数据尤为总要。
例,用数值1表示男, 用数值2表示女。
可见,变量值标签对于定序数据(如收入的高、中、低) 和定类数据(如民族、性别)来说是必不可少的,它不但明确 了数据的含义,也增强了最后统计分析结果的可读性。变量值 标签可以用中文。
SPSS用户缺失值是: ★ 对字符型或数值型变量,用户缺失值可以是1~3个特
定的离散值。 ★ 对一个数值型变量,用户缺失值可以在一个连续的闭
区间内并同时附加一个区间以外的离散值。
SPSS系统缺失值: 是用一个圆点表示,它 不等于0或.00,通常出现 在数值型变量数据中。
六、计量尺度(Measure)
定类型数据(Nominal):是指没有内在固有大小或高低顺 序,而只是一种名义上的指代,一般以数值或字符表示的分类 数据。如性别变量中的男、女取值,可以分别用1,2表示。民 族变量中的各个民族,可以分别用汉、回、满等字符表示。
相关主题