当前位置:文档之家› 描述性统计分析方法讲解

描述性统计分析方法讲解

每个变量代表对一个选项的选择结果,是 或不是,均为二分类变量。
SPSS中演示数据建立情况
2.多重分类法记录格式
同样,每个多选题根据5个选项设计5个变 量。每个变量均为多分类变量。 注意:多重分类法记录格式中常见数据缺 失的现象。 SPSS中演示数据建立过程
(二)多选题常用分析指标
应答人数百分比(percent of cases) 即,选择该项的人占总人数的比重。应答
人数百分比加总不等于100%。 应答次数百分比(percent of responses)
即,在做出的所有选择中,选择该项的次 数占总次数的比例。应答次数百分比加总等 于100%。
(三)SPSS相关操作
定义多选题变量集 (分析——多重响应——定义变量集) 频数表 (分析——多重响应——频率) 注意:缺失值的处理问题。 交叉分析
第三节 统计指标计算
一、指标类型 集中趋势指标
反映分布的平均水平。如平均数、众数、 中位数等。 离中趋势指标
反映分布的离散程度。如标准差、极值、 等。
百分位数指标 四分位数、各个百分位数等。
一般的图形:箱式图、茎叶图 考察数据是否为正态分布 (1)正态QQ概率图、去势QQ正态概率图。 (2)正态性检验 分组情况下对不同组别方差齐性进行检验
第四节 统计图制作

哪些非药物方法控制高血压?
A.调理饮食
B.做适宜运动
C.保持情绪稳定 D.其它措施
例2:请在下面列出的20个品牌中选择您认为 最信得过几个(最多列五个),并将代码按 照顺序排列。 候选品牌列表:1.长虹 2.海尔 3……….
1.多重二分法记录格式
一个多选题要根据它的选项设定对应的变 量。如例1有四个选项,对应这个多选题就 应该有4个变量。
步骤4:作出性别与考试成绩的交叉表
分析——描述统计——交叉表
三、多选题的统计整理问题
多选题又称多重应答,是在社会调查中常 见的一种数据记录类型。它本质上属于分类 数据,但由于其数据格式较为特殊,所以 SPSS中专门的模块来分析。
(一)多选题的记录格式
例1:确诊高血压后,您按医生的建议采取了
串型数据。 (2)组距式分组。一般适用于数值型。
三、spss相关操作
序号 性别
1

将8个同学的考试 2

成绩建立为SPSS 3

文件,并对学生 4

的性别及考试成 5

绩进行频数统计。 6

7

8

考试成绩 78 68 45 72 93 56 85 84
步骤1:建立数据文件
定义变量视图。(重点在于数据类型、值 标签)
描述性统计分析方法
第一节 基本问题
意义 一般的数据资料都来源于样本的调查。只
有通过对样本的研究,才能做好对实际问题 的可能的推断。因此,描述性分析是统计数 据分析的第一步。
定义 通过对现象进行调查研究,将大量数据加
以整理,简化,制成图标,并就这些数据的 分布特征进行计算,如集中趋势、离中趋势 等。
分布指标 偏度系数、峰度系数。
其它 M统计量、极端值等。
二、数据类型及SPSS一般实现操作
基于未分组的原始数据资料 基于某种标志的分组数据资料
三、EXPLORE模块
Explore过程(探索性分析)主要用于对 资料的性质、分布特点等完全不清楚的情况 下。在常用描述性统计指标的基础上,又增 加了有关数据详细分布特征的文字及图形 等。
数据视图中输入数据。
步骤2:对性别进行统计分组 (单项式分组)
分析——描述统计——频率 注意输出结果的解释。
(此频率非彼频率)
步骤3:对考试成绩进行统计分组 (组距式分组)
对考试成绩进行可视离散化(即将原始数 据转化为统计组别的离散数据,如1、2、3、 4、5)
对分组后的离散数据进行频数分析。
主要内容 (1)整理。主要是做统计分组及频数统计。 (2)计算分布特征指标。如平均数、众数、
中位数、标准差,等。
(3)做图表。如条形图、饼图、直方图等。
第二节 统计整理
一、统计整理的内容
主要是对原始数据进行统计分组并做频 数统计。
二、统计分组的类型
根据原始数据的类型,统计分组有: (1)单项式分组。一般适用于数值型和字符
相关主题