集中趋势
• 频数分布的类型
types of frequency distribution
对称分布 symmetric distribution
偏态分布
skewness distribution
频数表与频数分布
40 人 数 30 20 10
对称分布
0
124 132 140 148 身高(cm) 156 164
(3)列表
做出如表2-2的表格,将选好的组段顺序地列在 (1)列。按照 “下限≤x<上限” 的原则确定每一例数据x应归属的组段。
组 段 124~ 128~ 132~ 136~ 140~ 144~ 148~ 152~ 156~ 160~ 合 计
频 数 1 2 10 22 37 26 15 4 2 1 120
列出各个组段
确定每 一组段 频数 选 根据变量值大小 把各观察单位归 入各个组段
极差即最大值 与最小值之差
组距=R/组段数, 但一般取一方便 计算的数字
编制频数表步骤流程图
频数分布特征
人 数
40 30
20
10 0
124 132 140 148 156 164
图
某市120名12岁男童身高的频数分布
第二节
频数与频数分布
离散型定量变量的频数分布
例2-1 1998年某山区96名孕妇产前 检查次数资料如下:0,3,2,0,1, 5,6,3,2,4,1,0,6,5,1,3, 3,…,4,7等共96个数值
频数与频数分布
表2-1:96名妇女产前检查次数分布的频数分布表
表2-1 1998年某地96名妇女产前检查次数分布 检查次数 频数 频率(%) 累计人数 累计频率(%)
频 率 0.0083 0.0167 0.0833 0.1834 0.3083 0.2167 0.1250 0.0333 0.0167 0.0083 1.0000
频数与频数分布
人 数
40 30
20
10 0
124 132 140 148 156 164
图
某市120名12岁男童身高的频数分布
频数表与频数分布
G
n
X 1 X 2 ...X n
lg X lg n
1
定量变量的特征数
例2-5 7名慢性迁延性肝炎患者的HBsAg滴度资 料为1:16,1:32,1:32,1:64, 1:64,1:128, 1:512。试计算其几何均数。
G 7 16 32 32 64 64128 512 64
频数表与频数分布
偏态分布 正偏态
(positive skew)
8
10
负偏态
(negative skew)
6
Frequency
4
Frequency
5
2
0 1 2 3 4 5 var5 6 7 8 9
0 1 2 3 4 5 var6 6 7 8 9 10
频数表与频数分布
• 非对称分布称为skewness;俗称偏态分布,有人称偏峰分 布。 • “偏”是偏离的意思,表示个别观察值偏离均数较远,而不 是“集中位置偏”;
130.5 141.8 146.2 139.5 138.9 144.5 147.9 147.5 142.9 145.9 146.5 142.4
134.5 146.8 143.3 146.4 134.7 137.1 141.8 136.9 129.4 146.7 149.0 138.7
148.8 135.1 156.3 143.8 147.3 147.1 141.4 148.1 142.5 144.0 142.1 139.9
• 熟悉:连续型变量频数表的编制,频数分布类型,百 分位数法的概念及计算。 • 了解:离散型定量变量的频数分布
单变量计量资料的统计分析
研究总体
随机
样本
抽样
统计描述
统计表 统计图 统计指标
统计推断
参数估计 假设检验
定量资料的统计描述
• 统计表-频数分布表 • 统计图-频数分布图 • 统计指标 • 集中趋势:均数、几何均数、中位数 • 离散趋势:极差、四分位间距、方差、标准 差、变异系数
20 15 10 5 0 0 1 2 3 4 5 >5 30
产前检查次数 图2-1 某地96名妇女产前检查次率分布
频数与频数分布
连续型定量变量的频数分布
频数分布表的编制步骤 1.求极差 2.确定组段数、组距 3.从小到大列出组段 4.清点各组段包含的观察单位数(频数) 5.整理成频数分布表
频数与频数分布
第4章 定量资料的统计描述
本章的内容和重点
第一节 第二节 第三节 第四节 频数分布 集中趋势的描述 离散趋势的描述 描述分布形态的统计指标
重点: 掌握概念、方法的用途和适用条件 熟悉统计符号和公式
教学目的与要求
• 掌握:描述定量资料的集中趋势的指标——算术均数、 几何均数、中位数的计算方法和适用条件,描述定量 资料的离散趋势的指标——极差、四分位数间距、方 差、标准差和变异系数的计算方法和适用条件。
均数的应用:
最适于对称分布资料,特别是正态分布资 料;
对于偏态资料,均数不能较好地反映其集 中趋势。
我也 知道 了!
定量变量的特征数
二、几何均数(geometric mean,G)
适用条件:适用于对数正态分布或近似正态分布,以 及呈倍数关系的等比资料。其频数图一般呈正偏峰分布。 在医学研究中常适用于免疫学的指标。其计算公式为
(1)
0 1 2
(2)
4 7 11
(3 )
4.2 7.3 11.5
(4)
4 11 22
(5)
4.2 11.5 22.9
3
4 5 >5 合计
13
26 23 12 96
13.5
27.1 24.0 12.5 100
35
61 84 96 —
36.5
63.5 87.5 100.0 —
频数与频数分布
图2-1
频 率 25 (%)
频数与频数分布
手工编制表2-2步骤: (1)计算全距(range,R),也称为极差
R = 最大值-最小值 =160.9-125.9=35(cm)
(2)确定组段数与组距:组距=上限-下限=R/(预计的组段数)
i=R/K(极差/组数) 本例如果预计取10个组段,则组距长度约为35/10=3.5,取整数4。两 端的组段应分别包含最小值或最大值;
频数表与频数分布 • 分布不对称者称为偏态分布。
• 偏态分布又分为正偏分布和负偏分布。 • 所谓正偏分布是指分布的长尾在峰的右侧,又 称右偏分布; • 所谓负偏分布是指分布的长尾在峰的左侧,又 称左偏分布。”
70
人 数
60
50
40
大多数居民发汞含量在 1~15mol/kg之间,少 数人的发汞大于 15mol/kg,分布呈正偏 态。
30
20
10
0 1 3 5 7 9 11 13 15 17 19 21
发汞含量(mol/kg)
(a) 239人发汞含量的频数分布
400 人 数
300
200
100
0
0 10 20 30 40 50 60 70 80 90 100
自评分
图
某城市892名老年人生存质量自评分的频数分布
4 0
人 数
3 0
138.2 140.8 151.1 148.8 141.9 145.8 125.9 137.9 138.5 152.3 143.6 146.7
141.6 149.8 144.0 140.1 147.8 147.9 132.7 139.9 139.6 146.6 150.0 139.2
142.5 145.2 145.4 150.6 140.5 150.8 152.9 149.7 143.5 132.1 143.3 139.6
死亡年龄(岁)
图
某地1990~1992年男性死亡年龄分布
频数分布表和频数分布图的用途
• 描述分布类型 • 描述分布的特征 集中趋势-反映资料的平均水平 离散趋势-反映资料的变异程度 • 便于发现特大、特小的可疑值 • 便于计算有关指标、统计分析与处理
编制频数表的步骤
第一组段包括极小值,最后 一组段包括极大值,除最后 一组段可同时标出上下限, 一般 8- 15 之间 求出极差 确定组段数 确定组距 其他组段只标出下限。
100
频数与频数分布
频数与频数分布 频数:某个测量值的个(例)数。 频数分布表(frequency distribution table):
又称频数表,是将原始数据值适当分组后得到各组的 频数,如表2-1频数分布表。 适用于样本量较大的资料进行统计描述的常用方法。 通过频数表可以显示数据分布的范围与形态。 可用手工和计算机软件(如SAS、SPSS等)方便制 作频数表。
例2-6 52例慢性肝炎患者的HBsAg滴度数据如表 2-4。试计算滴度的几何均数。
定量变量的特征数
表2-4 52例慢性肝炎患者的HBsAg滴度资料 抗体滴度 1:16 1:32 1:64 频数(f) 2 7 11 滴度倒数(X) 16 32 64 lgX 1.20412 1.50515 1.80618 f(lgX) 2.40824 10.53605 19.86798
156.6 148.8 133.1 140.7 139.2 140.2 134.9 141.4 138.5 148.9 144.4 145.4
142.7 137.9 142.7 141.2 144.7 137.4 143.6 160.9 138.9 154.0 143.4 142.4
145.7 151.3 143.9 141.5 139.3 145.1 142.3 154.2 137.7 147.7 137.4 148.9