数值变量资料的统计描述
精选ppt
2
2021/2/27
第一节 数值变量资料频数分布
数值变量资料进行统计描述需要根据资料的分 布类型选择合适的统计指标,因此首先要通过频 数分布表或分布图了解资料的分布特征。
一、频数分布表及其制作
精选ppt
3
2021/2/27
例8.1 某地区2002年55~58岁健康成人的空腹血糖(mmol/L) 测定值如下,试编制频数表和观察频数分布情况。
精选ppt
13
2021/2/27
正偏态(右偏态)
2021/2/27
精选ppt
负偏态(左偏态)
返回14
频数分布的类型
对称分布
正偏态分布
负偏态分布
精选ppt
15
2021/2/27
2.描述频数分布的特征
图8-1(P154)数据的频数分布特征: ①数据变异(离散)的范围在
3.60~5.60(mol/L )
②数据集中(平均)的组段在
4.20~5.00(mol/L )之间,尤以组段的人数
4.60~4.80 (mol/L )最多。且上下组段的频
数分布基本对称。
2021/2/27
精选ppt
返16 回
3.便于发现一些特大或特小的可疑值
2021/2/27
精选ppt
n确定分组组数。相邻两组段下限值之差称组距,组距=
极差/组数,为方便计,组距为极差的十分之一, 再略加调 整。
1.99 / 10 = 0.199 ≈0.2 (mol/L)
(3) 列出组段:第一组段的下限必须包含最小值,最 后一个组段上限必须大于或等于最大值。
3.6~ 3.8 ~ …… 5.2 ~ 5.4 ~ 5.6
第八章 数值变量资料的统计描述
精选ppt
1
2021/2/27
回顾:
根据是否定量划分,资料被分作不同的类型: 数值资料(measurement data):
用定量的方法对观察单位进行测量得到的资料,亦 称作计量资料。 分类变量资料(enumeration data): 用定性的方法得到的资料,亦称计数资料。 等级资料(ranked data): 不能精确测量,仅能根据相对大小分为几个等级。
4.56 4.39 5.24 4.61 4.21 4.96 4.34 4.45 4.86 4.50 4.90
4.45 4.49 4.42 4.68 4.56 5.38 4.34 4.46 4.16 4.98 4.29
4.83 4.27 3.68 3.85 3.86 4.56 4.56 4.55 5.16 5.15 5.16
精选ppt
11
2021/2/27
1.描述频数分布的类型(对称分布、偏态分布)
(1)对称分布 :
若各组段的频数以中心位置左右两侧大体对称,就 认为该资料是对称分布
精选ppt
12
2021/2/27
(2)偏态分布 :
1)右偏态分布(正偏态分布):右侧的组段 数多于左侧的组段数,频数向右侧拖尾。
2)左偏态分布(负偏态分布):左侧的组段 数多于右侧的组段数,频数向左侧拖尾。
4.85 5.07 4.16 4.66 4.70 4.20 3.95 4.09 4.64 4.33 5.21
4.61 4.98 5.24 4.60 4.25 4.78 5.00 3.60 4.11 4.61 4.08
4.78 4.26 4.44 4.38 4.4 4.79 4.76 4.92 4.60 4.78 5.03
5.17 5.56 4.86 4.87 4.74 5.24 5.51 4.46 4.96 4.82 4.90
5.30 5.22 5.58 4.48 4.80 4.6 4.02 5.16 5.36 4.34 4.24
4.64 4.27 4.25 4.44 4.46 4.62 4.87 4.34 4.90 5.25 4.77
累计频率 (%)
2.27 4.55 10.61 28.03 46.21 65.15 80.30 89.39 96.97 100.00
精选ppt
8
2021/2/27
二、频数分布图
数人
血糖(mol/L)
图8-1某地区2002年55~58岁健康成人的空腹血糖(mmol/L) 测定值的频数分布图
精选ppt
9
2021/2/27
同一组资料,不同的人编制的 频数表,结果不尽相同,允许几个 合理的结果并存。
精选ppt
ห้องสมุดไป่ตู้
10
2021/2/27
三、频数表和频数分布图用途
1.描述频数分布的类型(对称分布、偏态分布) 2.描述频数分布的特征(集中趋势 离散趋势) 3.便于发现一些特大或特小的可疑值 4.便于进一步做统计分析和处理(加权)
合计
3.70 3.90 4.10 4.30 4.50 4.70 4.90 5.10 5.30 5.50
频数(f)
3 3 8 23 24 25 20 12 10 4 132
累计频数(Σf)
3 6 14 37 61 86 106 118 128 132
频率(%)
2.27 2.27 6.06 17.42 18.18 18.94 15.15 9.09 7.58 3.03 100.00
精选ppt
4
2021/2/27
编制频数分布表的步骤
编制频数分 布表的步骤
计
确
计
编
算
定
算
制
极
组
频
表
差
数
数
格
组
距
精选ppt
5
2021/2/27
频数表的编制步骤:
(1)求极差(range):即最大值与最小值之差,又 称为全距。
R=5.59–3.60 =1.99(mol/L)
(2) 决定组数、组段和组距:根据研究目的和样本含量
4.35 4.18 4.68 4.65 4.57 4.27 4.99 4.21 4.89 4.71 4.72
4.41 4.38 4.06 4.79 4.96 4.83 4.45 4.51 4.27 4.50 4.31
5.05 5.59 5.08 5.16 3.74 4.36 5.36 4.64 5.09 4.57 4.46
(4) 划记计数:用划记法将所有数据归纳到各组段, 得到各组段的频数。
精选ppt
6
2021/2/27
精选ppt
7
2021/2/27
表8-1
某地区2002年55~58岁健康成人的空腹血糖 (mmol/L)测定值的频数分布表
血糖(mol/L)组段 组中值(xi)
3.60~ 3.80~ 4.00~ 4.20~ 4.40~ 4.60~ 4.80~ 5.00~ 5.20~ 5.40~5.60