当前位置:
文档之家› 第二章常用统计指标(计量资料的统计描述)
第二章常用统计指标(计量资料的统计描述)
• 不同计量数据组间比较,此差距越大, 表示变异越大。
百分位数(PX%)
• 是描述一组计量数据分布特征的位置指 标 。将n个数据由小到大排列,将位次 转为百分位(%),常计算P25%、P50%、 P75%、 P95%百分位数作为分割点。
• X: 5 7 9… 20... 45 50, n=100
• 位次 1 2 3… 50… 99 100
变异指标的几点说明
• 全距(R):可表达任意分布的变异 大小。
• 四分位间距:用于表达偏态分布的 变异
• 标准差(SD):用于正态或近似正 态分布的变异(较常用的指标)。
• CV :主要用于单位不同时组间变异 的比较。
三、均数和变异指标的应用
• 在医学杂志中,常以 X S 的形式列出, 描述数据的平均水平和离散程度。
•
两组患者Pco2值的比较
• 组别
n X S
R CV(%)
• 肺心病组 12 65.97 ± 20.28 66 30.74
• 慢支肺气肿 10 43.90 ± 8.24 29 18.79
中位数和百分位数的应用
• 生存分析中,常用X25%、X50%、X75%做 描述和比较。同一分位数越大,说明生存 时间越长。
• 组段(d) 频数 累计频数
• 0-
29
29
• 15-
32
61
• 30-
18
79
• 45-
14
93
• 60-
4
97
• 75-
0
97
• 90-
0
97
• 105-
2
99
• 120-
1 100
• 135-
2 102
位次范围
1-29 30-61 62-79 80-93 94-97 97 97 98-99 100 101-102
试验的5次重复结果如下:
X
•
RS
• 甲 20 21 22 23 24 22 4 1.58
• 乙 18 20 22 24 26 22 8 3.16
• 丙 16 19 22 25 28 22 12 4.74
• 结论:三位检验员对该结果测定的平均水 平为22,但测定值的稳定性(变异程度)
不同,以丙测定的稳定性最差。
S (X X )2 n 1
S2 为方差
标准差的意义:表示一组数据的变异程 度大小。当比较组单位相同时, S越大, 表示一组数据间离散程度越大。反之越 小。
标准差的计算公式:
S X 2 ( X )2 / n n 1
(2-13) 例数较少
S fX 2 ( fX)2 / f f 1
的组 间变异程度。
意义:CV越大,表示数据变异越大。 常用于衡量方法、仪器的精密度。
某地7岁年龄组男童身高与体重
•
X
•
x
S CV(%)
• 身高(cm)。 123.10 4.71 3.83
• 体重(kg) 22.29 2.26 10.14
• 结论: 7岁年龄组男童身高与体重 值指标比较,体重指标的变异大于 身高指标。
FX100计算器统计功能计算
• 步骤
说明
• 1. MODE MODE 1 进入统计功能模式
• 2.SHIFT AC =
清除数据
• 3. 55 M+
数据输入
•
54 M+
•
58 M+
• 4 SHIFT 1 =
显示均数
• 5. SHIFT 3 = • 6. RCL C • 7. RCL B
显示标准差(S)
• 缺点:数据利用不全,部分信息损失, 在例数少时结果不稳定。
(二)、百分位数与四分位数间距 (percentile and quartile range)
• 四分位间距:用Q表示,即一组数据用 百分位数法计算的第75%位数与第 25%位数之差。
•
Q=P75%-P25%
• 常用于表示偏态分布的变异的指标。
显示例数x
显示
二、频数表统计功能计算
• 例数较多时计算均数
• 方法1:
• 例:X(年龄) 20
23 25
•
f: 10
5
3
• 步骤同前:
• 数据输入:20 SHIFT , 10 M+
•
23 SHIFT , 5 M+
•
25 SHIFT , 3 M+
• 步骤同前:
CASIO FX-100W计算器
• MODE 运算状态选择键
• 乙 18 20 22 24 26 22 8
• 丙 16 19 22 25 28 22 12
• 变异指标作用:用变异指标来反映计 量数据间相互离散的程度。
几个常用的变异指标
• (一)、极差(Range)或全距:用 (R)表示,即一组数据的R=最大值– 最小值
• 意义:R值越大,表示该组数据的变异 越大。
(n 50% fL )
表2-6 102名3岁以下儿童LgA含量的 中位数计算
• 组段(d) 频数 累计频数
• 0-
29
29
• 15-
32
61
• 30-
18
79
• 45-
14
93
• 60-
4
97
• 75-
0
97
• 90-
0
97
• 105-
2
99
• 120-
1 100
• 135-
2 102
位次范围
1(
f lg f
Xi
)
lg 1(102.1032) 72
26.19
结论:72名鼻咽癌病人唾液中EB病毒某
种抗体平均滴度为1:26
(三)、中位数(Median)
• 中位数(Md):适用于描述偏态分布 资料的平均水平。(例)
• 计算定义:将一组变量值由小到大依 次排列,居以中间位置的观察值即为 中位数,为这组数据的平均数。
• 1:2.5
14
2.5 03979 5.5706
• 1:10
18 10
1.0000 18.0000
• 1:40
22 40
1.6021 35.2462
• 1:160
12 160
2.2041 26.4492
• 1:640 • 合计
6 640 72
2.8062 16.8372 102.1032
•
XG
lg
感染出现症状的平均时间如下:
• 30,47,54,69,78,109,194天
XG
lg
1( lg n
Xi
)
lg 1(lg 30 lg 47 ...lg 194) / 7 70.5 (天)
X 83(d)
表2-5 72名鼻咽癌病人唾液中EB病毒 某种抗体滴度
• 抗体滴度 频数f 滴度倒数 lg(x) f•lg x
•例
•
• 类型 • ALL
儿科白血病患者生存时间(周)
生存分位数
例数 X25% 542 32
X50% 73
X75% 146
• AUL 369 30
70
134
• AML 107 9
25
60
作业
• 练习题(31页) • 习题1中的②题 • 习题4 • 要求: • 计算题要求写出公式、步骤、结论。
CASIO FX-100W述)
第二节 平均数指标 第三节 变异指标
平均数(average )指标
• 平均数指标的概念和作用 • 概念:平均数表示一组同质计量数据
集中趋势的位置和平均水平。
• 作用:是一组计量数据平均水平的代 表值(概括统计量);可作为不同组 间的比较值
• 医学中常用的平均数指标有: • 算数均数、几何均数、中位数
• 本例:
• 四分位数间距(Q)=P75-P25
•
=42.9-13.2=29.7
• 结论:某地102名3岁以下儿童lgA含 量的中位数为25.3(ug/ml),四分位 间距为29.7 (ug/ml)。
.(三)标准差(Standard deviation)
和方差(variance)
用S或SD表示样本标准差,计算公式
• P% 1% 2%
50%
100%
百分位数(PX%)法频数表计算
• 频数表计算公式(2-8)
PX
Lx
ix fx
(n
x% fL )
• 例:P25:即第25%位数值,有25%的 变量值小于P25 值,有75%的变量值 高于P25值。
表2-6 102名3岁以下儿童LgA含量的 中位数计算
(二)、几何均数 (Geometric
• 适用条件:X值m呈ea倍n)数增长或部分 数据偏离过大的正偏态分布资料。
• 计算公式:
XG
lg 1( lg n
Xi
)
例数较少用 (2-3)
XG
lg 1(
f lg f
Xi
)
频数表资料用 (2-4)
例2-5, 7名输血后感染乙肝患者从输 血至出现症状的时间如下:估计输血
(一)算术均数( mean)
简称均数,用 X 表示.
基本公式(2-1,2-2) 1.直接法
适用条件
X X
n
公式适用频数为 正态或近似正态
2.加权法公式
分布的计量资料.
X fX
f
• 表2、160名正常成年女性血清甘油三酯分布
• 组段 频数(f) 组中值(X) fx