当前位置:文档之家› 第四章 统计描述_PPT幻灯片

第四章 统计描述_PPT幻灯片

4.1 基本概念和原理
统计学的基本内容可分为两大类——统计 描述和统计推断。
➢ 统计描述(Descriptive Statistics)是指运用 各种统计学手段(如统计表、统计图、统计 指标等)对观测数据的数量特征进行客观地 描述和表达。
2021/3/10
1
4.1 基本概念和原理
➢统计推断(Inferential Statistics)是指根据 观测数据(即“样本”——Sample)所提供 的信息,对未知总体的情况做出具有一定概 率保证的估计和推断,包括假设检验和参数 估计两大内容。
2021/3/10
11
4.3 描述性统计量(Descriptive)
专门用于计算各种描述统计量(均值、中位数、 众数、方差、标准差、全距、偏度、峰度),以 反映总体分布的集中趋势和离散趋势。
2021/3/10
12
4.4 探索性数据分析(Explore)
是一种基于数据稳健性和耐抗性的统计分析方法。 基本思路是在统计分析时尽量减小数据中存在的 少量异常值对分析结果的影响。Explore命令提供 了3种非常重要的功能:
i1
Me L 2
Sm1 d
fm
2021/3/10
7
4.1 基本概念和原理
3.众数(Mode)
➢ 上限公式:
m o U (m f f f 1 m ) ( f m 1 f f 1 ) d U Δ 1 Δ 2 Δ 2 d
➢ 下限公式:
m o L (m f f f1 m ) ( f m 1 f f 1 ) d L Δ 1 Δ 1 Δ 2 d
➢ 异常值检查 ➢ 正态分布检验 ➢ 方差齐性检验
2021/3/10
13
2021/3/10
3
4.1 基本概念和原理
加权算术平均数:
k
x x1f1x2 f2 f1 f2
xk fk fk
fi
i1 k
fi
i1
2021/3/10
6
4.1 基本概念和原理
2.中位数(Median)
➢ 上限公式:
k
fi
i1
Me U 2
Sm1 d
fm
➢ 下限公式:
K
fi
n
(xi x)2
s i1 n
4、均值标准误(Standard Error of Mean)
sm
s n
2021/3/10
10
4.2 频数分析(Frequencies)
其功能是描述变量的分布特征。
➢ 对于离散变量,可直接进行频数分析; ➢ 对于连续变量,要在统计分组的基础上,先做变换
处理(重编码Recode),再进行频数分析。
2021/3/10
8
4.1 基本概念和原理
4.1.2离散程度指标
变异指标的概念、作用及分类。
1、极差(Range)
R=Xmax-Xmin
2、方差(Variance)
n
(xi x)2
s 2 i1 n
2021/3/10
9
4.1 基本概念和原理
3、标准差(Standard Deviation)——基于大样本
2021/3/10
2
4.1 基本概念和原理
4.1.1频数分布
频数分布的概念及其构成
➢ 在统计分组的基础上,把总体所有单位按某一标志 进行分组,计算各组的单位数,它是统计描述的一 种重要形式。分布数列由两个要素构成:按某标志 所分的组;各组单位数。
几个术语
➢ 频数(次数)、频率(比率);累计频数(次数)、 累计频率(比率)
相关主题