当前位置:
文档之家› 医学统计学——数值变量资料的统计描述
医学统计学——数值变量资料的统计描述
血糖 频数f 组中值X f X (4)
f X2 (5)
(1) (2) (3)
=(2)×(3) =(3)×(4)
3.60~ 3
3.7
3.80~ 3
3.9
4.00~ 8
4.1
4.20~ 23
4.3
4.40~ 24
4.5
4.60~ 25
4.7
4.80~ 20
4.9
5.00~ 12
5.1
5.20~ 10
5.3
0~
5
5
0.42
10~
12
17
1.41
20~
15
32
2.66
30~
76
108
8.98
40~
189
297
24.69
50~
234
531
44.14
60~
386
917
76.23
70~
286
1203
100.00
8
病例数
频数
人数
25
正态分布:中间高、
20
两边低、左右对称
15
10
5
0
0.50 0.70 0.90 1.10 1.30 1.50 1.70 1.90
﹡表示符号: 总体均数 (μ) 样本均数 (x )
﹡应 用: 对称分布资料,尤其是正态或近似正 态分布资料
﹡计算方法:
直接法 x=
1+ 2+……+ n n
=
∑
n
加权法 x=
f 1x1 + f 2x2 + ……+f kxk f 1 +f 2+……+f k
Σ:求和符号,读成sigma
∑ fx =f
12
55~58岁健康成人空腹血糖均数和标准差的计算表(加权法)
= lg–1
∑f lgx
14
n
n
几何均数(geometric mean)
XG n X1X2 Xn
lg
XG
1 n
(lg
X1
lg
X2
lg
Xn)
lg X n
X G lg 1
lg X n
lg 表示以10为底的对数;
几何均数:变量 对数值的算术均 数的反对数。
2
• 对一组研究对象进行观察,某变量或指标 (如肺活量)数值出现的次数被称为频数 (frequency);
• 可以将各变量值及其出现的频数编制频 数分布表(frequency distribution table);
• 用来反映各变量值与其频数之间的关系, 并观察资料的分布类型
3
一、频数分布(Distribution of frenquency)表与频数分布图
22
正正正正正
25
正正正正 |
21
正正正 | |
17
正||||
9
||||
4
|
1
合计
——
130
6
﹡偏态正分偏布态分布
238名正常人发汞值(μg/g)
发汞值 (1) 0.3~ 0.7~ 1.1~ 1.5~ 1.9~ 2.3~ 2.7~ 3.1~ 3.5~ 3.9~
频数 (2) 20 66 60 48 18 16 6 1 0 3
血清甘油三酯( m m o l / L )
图2-1 160名正常成年女子的血清甘油三酯的频数分布图
正偏态分布:长尾向右延伸;负偏态分布:长尾向左延伸
18
25
16
14
20
12Βιβλιοθήκη 10158 10
6
4 2 0
12 24 36 48 60 72 84 96 108 120 潜伏期(h)
5
0 0 5 10 15 20 25 30 35 40 45 50 肌红蛋白含量(ug/mL)
累计频数 (3) 20 86 146 194 212 228 234 235 235 238
累计频率(%) (4)=(3)/238
8.4 36.1 61.3 81.5 89.1 95.8 98.3 98.7 98.7 100.0 7
负偏态分布
某地某年恶性肿瘤死亡数
年龄组(岁) 死亡人数 累计频数 累计频率(%)
* 对称分布(正态分布或近似正态分布)
某地区130名正常成年男子红细胞数(1012/L)的频数分布
红细胞数
划记
频数
3.70~ 3.90~ 4.10~ 4.30~ 4.50~ 4.70~ 4.90~ 5.10~ 5.30~ 5.50~ 5.70~5.90
T
2
||||
4
正||||
9
正正正 |
16
正正正正 T
图2-2 59名链球菌咽喉炎患者的潜伏期(h)
图2-3 101名正常人的血清肌红蛋白含量 9
❖ 频数分布类型:
①对称分布或近似正态分布:即频数集中位置(或高 峰)在正中,两侧频数分布大致对称;
②偏态分布:即集中位置偏向一侧,频数分布不对称。
若频数集中位置偏向数值小的一侧,为正偏态分布; 若频数集中位置偏向数值大的一侧,为负偏态分布。
—— 频数分布表的编制
﹡找全距
R=最大值 - 最小值
﹡定组距
i =全距 / 组数
﹡写组段
第一组组段包括最小值
最后一组组段包括最大值
﹡划 记 各组段的观察单位数(频数)
4
——频数分布的用途:
(1)频数分布的特征描述 ﹡集中趋势:变量值集中分布的位置 ﹡离散趋势:变量值围绕集中位置的
分布情况
(2) 频数分布的类型 ﹡ 对称分布——正态或近似正态分布 ﹡ 非对称分布 ——偏态分布
不同类型的分布,应采用相应描述指标和统计分 析方法。
医学院 预防医学教研室 2020/10/13
10
二、集中趋势(Central tendency) 指标
平均数(average)常用于描述一组计量 变量值的集中趋势,是反映同质资料的平 均水平或集中位置的特征值。
均数
常用平均数 几何均数
中位数
11
1. 算术均数(均数,mean)
5.40~5.60 4
5.5
11.1
11.2 32.8 98.9 108.0 117.5 98.0 61.2 53.0 22.0
41.07
45.63 134.48 425.27 486.00 552.25 480.20 312.12 280.90 121.00
合计 132(Σf)
614.2(ΣfX) 2878.92 (ΣfX2) 13
——常用平均数
2. 几何均数 (geometric mean)
﹡表示符号: (G)
﹡应 用: 变量值呈倍数关系;对数正态分布资料。 ﹡计算方法:
直接法 G = n √ x1 ·x2 … xn
G = lg–1 lgx1+lgx2+…+lgxn = lg–1 ∑ lgx
n
n
加权法
G = lg–1
f1lgx1+f2lgx2+…+fklgxk
数值变量资料
(计量资料) 统计描述(Descriptive Statistics)
医学院 预防医学教研室 2020/10/13
1
数值变量资料的统计描述
➢ 频数表与频数分布 ➢平均指标:算术均数、几何均数、中位数 ➢变异指标:极差、百分位数与四分位间距
方差、标准差、变异系数
➢正态分布及其应用
医学院 预防医学教研室 2020/10/13