当前位置:文档之家› SPSS第三章 描述统计

SPSS第三章 描述统计


偏度(Skewness) 统计学上的定义和计算公式
定义:偏度也是描述数据分布形态的,它 是描述某变量取值分布对称性的统计量。
这个统计量是与正态分布相比较的量,偏 度为0表示其数据分布形态与正态分布偏度x相 同;偏度大于0表示正偏差数值较大,为正偏 或右偏,即有一条长尾巴拖在右边;偏度小于 0表示负偏差数值大,为负偏或左偏,有一条 长尾拖在左边。而偏度的绝对值数值越大表示 分布形态的偏ห้องสมุดไป่ตู้程度越大。
总体平均数:若一组数据X1,X2,…,XN, 代表一个大小为N的有限总体,则其总体平均 数为
样本平均数:若一组数据x1,x2,…,xn, 代表一个大小为n的有限样本,则其样本平均 数为
中位数(Median) 统计学上的定义和计算公式
定义:把一组数据按递增或递减的顺序排 列,处于中间位置上的变量值就是中位数。它 是一种位置代表值,所以不会受到极端数值的 影响,具有较高的稳健性。 适用条件:适合各种类型的资料。尤其适合于 ①大样本偏态分布的资料; ②资料有不确定 数值;③资料分布不明等。
25 20 15 10 5 0 0 5 10 15 20 25 30 35 40
负偏态分布: 长尾向左延伸 左偏态
45
50
肌红蛋白含量(ug/mL)
图2-2 59名链球菌咽喉炎患者的潜伏期(h)
图2-3 101名正常人的血清肌红蛋白含量
峰度(Kurtosis) 统计学上的定义和计算公式
定义:峰度是描述某变量所有取值分布形 态陡缓程度的统计量。这个统计量是与正态分 布相比较的量,峰度为0表示其数据分布与正 态分布的陡缓程度相同;峰度大于0表示比正 态分布高峰要更加陡峭,为尖顶峰;峰度小于 0表示比正态分布的高峰要平坦,为平顶峰。
基本概念再复习
变量的类型
变量的尺度:
定类 变量:只能计次 b 定序 变量:计次、排序 c 定距 变量:计次、排序、加减 d 定比 变量:计次、排序、加减、乘除
a
基本概念再复习
变量的类型 连续型变量(定距/定比型)---取值范围是 一个区间,连续取值 离散型变量---取值范围是有限个值或一个数 列构成。

集中趋势指标
数值平均数、中位数、众数
离散趋势指标
全距、标准差、四分位数
分布特征:偏度峰度
正态分布与非正态分布
图 2 -4
频 数 分 布 逐 渐 接 近 正 态 分 布 示 意
25
20 频数
15
10
正态分布:中间高、 两边低、左右对称
0.50 0.70 0.90 1.10 1.30 1.50 1.70 1.90
Spss应用实例
Frequencies:特色是产生频数表,对分类 资料和定量资料都适用 Descriptives:适用于服从正态分布的定量 资料 Means:适用于某一变量的分组描述
概述:统计学知识回顾 集中趋势指标 离散趋势指标 SPSS应用实例

基本概念回顾
参数和统计量 参数:刻画总体特征的指标称为总体参数。

用来确定某一分布的特征;如总体均数 往往是未知的

统计量:刻画样本特征的指标称为统计量。
由观察资料计算出来的量;可以用来近似的反映 总体参数

统计的任务:由样本估计总体,由样本统计 量估计总体参数
方差(Variance)和标准差(Standard Deviation)
统计学上的定义和计算公式
定义:方差是所有变量值与平均数偏差平 方的平均值,它表示了一组数据分布的离散程 度的平均值。标准差是方差的平方根,它表示 了一组数据关于平均数的平均离散程度。方差 和标准差越大,说明变量值之间的差异越大, 距离平均数这个“中心”的离散趋势越大。
分布特征:偏度峰度

集中趋势指标
统计上使用平均数(average)这一指标体系
来描述一组变量值的集中位置或平均水平。
算术平均数 数值平均数 调和平均数 几何平均数 平均数 幂平均数
众数
位置平均数
中位数
平均数(Mean)
统计学上的定义和计算公式
•定义:均值(平均值、平均数)表示的是某 变量所有取值的集中趋势或平均水平。 •例如,学生某门学科的平均成绩、公司员工 的平均收入、某班级学生的平均身高等。 计算公式如下。
表示分类情况的离散型变量又称为分类变量 无序变量(名义型):两分类和多分类如性别,也
可用数字进行编码,但没有大小关系。 有序变量(定序型):取值为互不相容的类 别,而且在研究背景下有等级顺序,如经济收 入(低,中,高)

集中趋势指标
数值平均数、中位数、众数
离散趋势指标
全距、标准差、四分位数
四分位数(Quartiles)
z定义:四分位数是将一组个案由小到大(或 由大到小)排序后,用3个点将全部数据分为 四等份,与3个点上相对应的变量称为四分位 数,分别记为Q1(第一四分位数)、Q2(第二 四分位数)、Q3(第三四分位数)。 z其中,Q3到Q1之间的距离的一半又称为四分 位差(内距),记为Q。四分位差越小,说明中 间的数据越集中;四分位差越大,则意味着中 间部分的数据越分散。 z四分位差不受极值的影响,主要用于测度顺 序数据的离散程度。

集中趋势指标
数值平均数、中位数、众数
离散趋势指标
全距、标准差、四分位数
全距(Range) 极差 统计学上的定义和计算公式
定义:全距也称为极差,是数据的最大值 与最小值之间的绝对差。在相同样本容量情况 下的两组数据,全距大的一组数据要比全距小 的一组数据更为分散。 计算公式:最大值-最小值。
第3章 统计描述
SPSS基本统计分析是进行其他统计分析的 基础和前提。通过基本统计方法的学习,可以 对要分析数据的总体特征有比较准确的把握, 从而有助于选择其他更为深入的统计分析方法。 本章主要介绍如何在SPSS中进行平均数、 中位数、众数、方差、百分位、频数、峰度、 偏度等基本统计描述的操作。
主要内容
5
0
血 清 甘 油 三 酯 (mmol/L)
正偏态分布: 长尾向右延伸 右偏态
病例数
图 2-1 160名 正 常 成 年 女 子 的 血 清 甘 油 三 酯 的 频 数 分 布 图
18 16 14 12 人数 10 8 6 4 2 0 12 24 36 48 60 72 84 96 108 120 潜伏期(h)
相关主题