当前位置:文档之家› SPSS数据分析教程-3-描述性统计分析

SPSS数据分析教程-3-描述性统计分析

教育水平为分类变量,它有11个类别。
SPSS频率分析
选择【分析】→【描述统计】→【频率】
频率分析选项-统计量
频率分析选项-图表
频率分析的结果解释
频率表格 条形图、直方图
3.2 中心趋势的描述
均值 中位数 众数 5%截尾均值
均值
均值即数据的算术平均数,是数据中心趋势的 主要度量指标,
平均 若i不是整数,则向上取整。
总结五数
最小值、第一个四分位数、中位数、第三个四 分位数、最大值
从这五个值可以大致看出数据分布的中心和离 散程度。而箱图则是这五个数的图形表现
3.4 分布的形状
偏度
当偏度0时,分布为正偏 或右偏,布图形在右边拖 尾,分布图有很长的右尾, 尖峰偏左
当偏度0,分布为负偏或 左偏,即分布图形在左边 拖尾,分布图有很长的左 尾,峰尖偏右
当偏度为0,分布对称
பைடு நூலகம் 峰度
峰度 >3,分布为高峰度,即
比正态分布的峰要陡峭; <3,分布为低峰度,即 比正态分布的峰要平坦 些;=0,分布为正态峰。
3.5 SPSS描述性统计
许多菜单均可进行描述性分析,提供描述性统 计指标的输出。例如T检验、方差分析、因子 分析等
需要首先消除测量尺度和量纲的影响。变异系 数可以剔除这些影响,其计算公式为:
分位数
第p百分位数
使得至少有p%的数据小于或等于这个值, 且使得至少有(100-p)%的数据大于或等于 这个值
如何计算?
将原数据从小到大排列 计算i=(p/100)n 若i是整数, 则第p百分位数为第i 与第 i+1 项的
定性数据
条形图 饼图 帕累托图
定量数据
直方图 茎叶图 箱图
频率:
描述-频率->图表
条形图 饼图 直方图
示例:数据文件 DisasterReason.sav
条形图 饼图 直方图 帕累托图
条形图
饼图
帕累托图
直方图-茎叶图-箱图
SPSS数据分析 教程
作者:李洪成 姜宏华
第3章 描述性统计分析
—《SPSS数据分析教程》
主要内容
描述性统计分析
频率分析 对数据进行描述的图形化方法和数值方法 学习分析数据分布的方法 应用SPSS进行描述性数据分析的方法 常用统计图形的绘制方法和解释技巧 数据标准化
本章学习目标:
极差(range) 方差(Variance) 标准差(S.d.) 分位数( Percentage) 变异指标
极差
极差=最大值-最小值 受极端值影响较大
方差和标准差
方差 标准差
变异系数
在比较两组数据离散程度大小时,如果数据的 测量尺度相差太大,直接比较二者的标准差并 不合适。
描述性统计分析指标
统计量可分为两类
一类表示数据的中心位置,例如均值、中位数、众 数等
一类表示数据的离散程度,例如方差、标准差、极 差等用来衡量个体偏离中心的程度。
3.1 频率分析
频率分析主要通过频率分布表、条形图和直方 图,以及集中趋势和离散趋势的各种统计量来 描述数据的分布特征
设变量有n个测量值 x1, x2,L ,, xn则算术均值为:
均值的特点
最常用的中心位置度量 受极端值影响 例:1,3,5,7,9 和
1,3,5,7,14
中位数
重要的中心位置度量 在递增排序后的数据列中
若数据个数为奇数,中位数是正中央的数 若数据个数是偶数,中位数是正中央的两数的平均
应用分类、制表、图形以及概括性数据指标来概括 数据分布特征的方法。结论不能推及总体。
推断性统计
推断性统计分析得到的结论适用于总体。
统计量
统计分析往往是从了解数据的基本特征开始的。 统计上,需要把样本数据所含信息进行概括、 融合和抽象,从而得到反映样本数据的综合指 标,这些指标称为统计量。
值.
不受极端值的影,例如:1,5,7,3,9
众数
发生频数最高的数据值 不受极端值的影响 众数可能不存在 可能有多个众数(单峰,双峰,多峰) 可用于定量或定性数据
5%截尾均值
避免了极端值的影响
3.3 离散趋势的描述
仅仅根据数据的中心趋势指标进行决策是不够 的。例如,如果一个国家的不同家庭收入差距 很少;而另一个国家的家庭收入差距很大,既 存在大量的贫困家庭,也存在许多十分富有的 家庭,那么即使这两个国家的中等收入家庭的 收入完全一样,其家庭收入情况仍然完全不同。
作业
描述性->探索
直方图 茎叶图 箱图
示例:数据Employ Data.sav
直方图 茎叶图 箱图
直方图和茎叶图
箱图
从旧对话框作图
重新完成上面两个例子中的图形(箱图除外)
饼图-帕累托图
频率-> 饼图 质量控制-> 排列图 图 -> 图表构建程序 图 -> 旧对话框
频率:实例
【分析】→【描述】→【频率】
频率:统计量的选择
频率:结果的解释
描述性子菜单
探索子菜单
【分析】→【描述统计】→【探索】 该菜单可以对不同的组分别给出描述性统计量
探索:选择统计量
探索:图
探索:结果解释(1)
探索:结果解释(2)
设定表格
表格:摘要统计量设置
统计图进行描述性统计分析
SPSS自定义表模块也可以产生大部分的描述 性统计指标
SPSS中的菜单
专门的描述性统计菜单:
描述(D):该过程则进行一般性的统计描述; 探索(E): 该过程用于对数据概况不清时的探索性
分析; 交叉表(C):该过程完成分类数据的统计描述和一
般的统计检验,我们常用的 检验也包含在该对话框 中。
掌握数据分析项目的整个过程; 掌握数据的分类方法; 掌握对数据进行描述的图形化方法和数值方法; 学习分析数据分布的方法; 掌握应用SPSS进行描述性数据分析的方法; 掌握常用统计图形的绘制方法和解释技巧
描述性统计和推断性统计
统计学分为描述性统计分析和推断性统计分析 描述性统计
频率分析术语
频率
对于定性观测值时,把它们按照某种原则分成一些 组,每个观测值必须落入一个类并且只能够落入一 个类中。对于给定的类,落入这个类的个案数称为 频率
落入该类中的个案数和个案总数的比例称为相 对频率
案例
数据文件Employ Data.sav记录了某公司职工 的基本信息,例如性别、民族、出生日期、教 育水平、工资水平、工作年限等。
例子
假设我们有以下的三组观测值:
观测A:11,12,13,16,16,17,18,21 观测B:14,15,15,15,16,16,16,17 观测C:11,11,11,12,19,20,20,20
这三组观测值的均值都是15.5,那么这三组数 据是否相似呢?
离散趋势
离散趋势的描述
相关主题