当前位置:文档之家› 【医学统计学】2.1定量资料的统计描述

【医学统计学】2.1定量资料的统计描述

组距为相邻两组段的下限差。组距i=R/组数≈R/10. 本例i=20/10=2(g/L) 3.确定组段值。原始数据表 第一组段应包含最小值,最末组段应包含最大值并 写出其下限和上限值。 4.列出频数表。采用划记法或计算机汇总。
频数表
组段
64.0~ 66.0~ 68.0~ 70.0~ 72.0~ 74.0~ 76.0~ 78.0~ 80.0~ 82.0~ 84.0~86.0 合计
2 统计描述
青岛大学医学院公共卫生学院 流行病与卫生统计学教研室
姜秀波
定量资料的统计分析
定量资料的统计描述
集中趋势指标 离散趋势指标
定量资料的统计推断
总体均数的估计 假设检验
2.1 定量资料的统计描述
主要内容
•频数分布表 •集中趋势指标 •离散趋势指标
定量资料的 频数/频率分布表
(frequency distribution table)
集中趋势指标
(central tendency)
平均数(average)
定义:描述一组性质相同的定量观察值的 集中趋势、中心位置或平均水平的指标。 平均数是一组定量数据典型的或有代表性 的值。
常用平均数的种类
算术均数 中位数 几何均数 ➢众数* ➢调和均数*
一、算术均数
(arithmetic mean)
表 3-2 100 名健康女大学生血清总蛋白含量的频数分布表
含量(g/L)
划记
频数(人数)
64.0~ III
3
66.0~
IIIII
5
68.0~
IIIII III
8
70.0~
IIIII IIIII I
11
72.0~
IIIII IIIII IIIII IIIII IIIII IIIII
25
74.0~
IIIII IIIII IIIII IIIII IIIII IIII
2.可以根据频数分布的不同类型,选 择适当的统计方法,进行计算与分 析。
频数分布的两个特征:
①集中趋势:变量值集中位置。
②离散(/中)趋势:变量值围绕集中位置的分布情况。离“中心”位置 越远,频数越小;且围绕“中心”左右对称。
频数分布的类型:
对称分布
例题直方图
偏态分布(集中位置偏向小的一侧叫正偏态,偏向大的一侧叫负偏
100.0 —
频数表的概念
100名健康女大学生血清总蛋白含量的频数 分布
25 20 15 10 5 0
64~ 66~ 68~ 70~ 72~ 74~ 76~ 78~ 80~ 82~ 84~
血清数表的意义:
1.由频数表可以看出频数分布的两个 重要特征:集中趋势和离散趋势。
24
76.0~
IIIII IIIII
10
78.0~
IIIII II
7
80.0~
IIIII I
6
82.0~
0
84.0~ I
1
合计

100
步骤
编制频数表的步骤
1.求全距(R)。R=最大值-最小值=84.3-64.3=20(g/L) 2.确定组数和组距。频数表
一般设8-15组。各组段的起点和终点分别称为下限 和上限。
态)。偏态分布图示
120
100
80
60
40
20
0 2.50
3.00
3.50
4.00
4.50
5.00
5.50
6.00
6.50
7.00
7.50
Std. Dev = .85 Mean = 4.90 N = 816.00
8.00
CHO
曲线下面积的含义
400
300
200
100
Std. Dev = 1.12
75.5 79.5 70.4 76.5 72.7 77.2 84.3 75.0 76.5 70.4
步骤
•频数:将定量资料的变量值按大小进行 分组,则某组段内所包含的变量值的个 数称为频数,以f 表示。频率是某组段 频数在总例数中所占的百分比。
•频数表(/频率表):表示各组段及其对 应的频数(/频率)的表格称为频数表或 频数分布表。频数分布表格
算术均数简称为均数(mean)
1.适用资料:适用于正态分布或近似
正态分布资料。
2.符号:样本均数 3.计算:
x,总体均数μ。
(1)不分组资料的均数计算法
x x1 x2 xn x
n
n
(2)分组资料的均数计算法
编制频数分布表
注意:合理分组才能求均数,否则没有意义 。
组中值
65.0 67.0 69.0 71.0 73.0 75.0 77.0 79.0 81.0 83.0 85.0 —
频数分布表
频数 f
3 5 8 11 25 24 10 7 6 0 1
100
频率%
3.0 5.0 8.0 11.0 25.0 24.0 10.0 7.0 6.0 0 1.0
100.0
累计频率% 3.0 8.0 16.0 27.0 52.0 76.0 86.0 93.0 99.0 99.0
73.5 75.0 72.0 64.3 75.8 80.3 69.7 74.3 73.5 73.5
75.8 75.8 68.8 76.5 70.4 71.2 81.2 75.0 70.4 68.0 74.0 72.0 76.5 74.3 76.5 77.6 67.3 72.0 75.0 74.3 73.5 79.5 73.5 74.7 65.0 76.5 81.6 75.4 72.7 72.7 67.2 76.5 72.7 70.4 77.2 68.8 67.3 67.3 67.3 72.7 75.8 73.5 75.0 72.7 73.5 73.5 72.7 81.6 70.3 74.3
Mean = 1.55
0
N = 1049.00 0.00 1.00 2.00 3.00 4.00 5.00 6.00 7.00 8.00 9.00 10.00 11.00 12.00 13.00 14.00 15.00
TG
频数表的用途:
1.揭示资料的分布特征和分布类型;
2.发现特大值和特小值;
3.由组中值近似代表原始数据,便于 手工计算集中趋势指标与离散趋势 指标。
表 3-1 上海医科大学健康女大学生 100 名血清总蛋白含量(单位:g/L) 74.3 78.8 68.8 78.0 70.4 80.5 80.5 69.7 71.2 73.5 79.5 75.6 75.0 78.8 72.0 72.0 72.0 74.3 71.2 72.0 75.0 73.5 78.8 74.3 75.8 65.0 74.3 71.2 69.7 68.0
相关主题