当前位置:文档之家› 医学统计学--第二章 计量资料的统计描述

医学统计学--第二章 计量资料的统计描述


(2)偏态分布 :
1)右偏态分布 (skewed to the right distribution) 也称正偏态分布 (positive skewness distribution):右侧 的组段数多于左侧的
组段数,频数向右侧 拖尾
人数
25 20 15 10
5 0
13.5 19.5 25.5 31.5 37.5 43.5. 血清转氨酶(mmol/L)
图2-2 115名正常成年女子血清转氨酶的频数分布
2)左偏态分布 (skewed to the left distribution ) 也 称 负 偏 态 分 布 ( negative
skewness distribution ) : 左 侧 的组段数多于右侧的 组段数,频数向左侧 拖尾
人数
25
20
公式
: X

X1 X2 L
Xn

X
n
n
式中 X1, X2,L , Xn 为所有观察值,n 为样本含量, (希腊字母,读作
sigma)为求和的符号。
例2-2 用直接法计算例2-1某单位101名正常成年 女子的血清总胆固醇的均数。
2.35 4.21 3.32 5.35 4.17 4.13 2.78 4.26 3.58 4.34 4.84 4.41 4.78 3.95 3.92 3.58 3.66 4.28 3.26 3.50 2.70 4.61 4.75 2.91 3.91 4.59 4.19 2.68 4.52 4.91 3.18 3.68 4.83 3.87 3.95 3.91 4.15 4.55 4.80 3.41 4.12 3.95 5.08 4.53 3.92 3.58 5.35 3.84 3.60 3.51 4.06 3.07 3.55 4.23 3.57 4.83 3.52 3.84 4.50 3.96 4.50 3.27 4.52 3.19 4.59 3.75 3.98 4.13 4.26 3.63 3.87 5.71 3.30 4.73 4.17 5.13 3.78 4.57 3.80 3.93 3.78 3.99 4.48 4.28 4.06 5.26 5.25 3.98 5.03 3.51 3.86 3.02 3.70 4.33 3.29 3.25 4.15 4.36 4.95 3.00 3.26
2.360~
组段 2.30~ 2.60~ 2.90~ 3.20~ … 5.60~5.90
4.分组段划记并统计频数
L X U
2.360~
组段 (1)
2.30~ 2.60~ 2.90~ 3.20~ 3.50~ 3.80~ 4.10~ 4.40~ 4.70~ 5.00~ 5.30~ 5.60~5.90 合计
15
10
5
0 2.5
12.5 22.5 32.5 42.5 52.5 血 清 肌 红 蛋 白(μg / m L)
图 2-3 101 名 正 常 人 血 清 肌 红 蛋 白 的 频 数 分 布
2.描述频数分布的特征
①变异的范围在2.30~5.90 (mmol/L)
②有明显的统计分布规律,数据主要集 中在3.50~4.70(mmol/L) 之间,尤以组段的 人数3.80~4.10 (mmol/L) 最多,且上下组段 数的频数分布基本对称。
例2-3 利用表2-1计算101名正常成年 女子的血总胆固醇的均数。
组段
(1) 2.30~ 2.60~ 2.90~ 3.20~ 3.50~ 3.80~ 4.10~ 4.40~ 4.70~ 5.00~ 5.30~ 5.60~5.90 合计
频数f (2) 1 3 6 8 17 20 17 12 9 5 2 1 101
X 1?2?.45?32.7515.75L409.75 13110L1
4.06(mmol/L)
2、应用
适用于对称分布, 特别是正态分布 资料。
二、 几何均数
几何均数(geometric mean): 可用于反映一组经对数转换后呈对称分 布的变量值在数量上的平均水平。
1、计算方法
(1)、直接计算法
PXΒιβλιοθήκη 1 2X
(nX
%)

X (nX %1)
例2-9 对某医院细菌性痢疾治愈者的住院天数统计,名 患者的住院天数从小到大的排列如下,试求第5百分位数 和第99百分位数。
公式:G n X1X2 L Xn 或
G lg1(
lg X )
n
例2-4 某地5例微丝蚴血症患者治疗七年后用间接 荧光抗体试验测得其抗体滴度倒数分别为,10, 20,40,40,160,求几何均数。
G 5 10 20 40 40160 34.8
G lg1( lg X ) lg1(lg10 lg 20 lg 40 lg 40 lg160) 34.8
第二节 集中趋势的描述
统计上使用平均数(average)这一 指标体系来描述一组变量值的集中位置 或平均水平。 常用的平均数有:
算术均数 几何均数 中位数
一、算术均数
算术均数:简称均数(mean) 可用于反映一组呈对称分布的变量
值在数量上的平均水平或者说是集中位 置的特征值。
1、计算方法
(1)直接计算法
第一节 频数分布
一、频数分布表(frequency table) :
例2-1 从某单位1999年的职工体检资料 中获得101名正常成年女子的血清总胆固 醇( mmol/L )的测量结果如下,试编制 频数分布表。
2.35 4.21 3.32 5.35 4.17 4.13 2.78 4.26 3.58 4.34 4.84 4.41 4.78 3.95 3.92 3.58 3.66 4.28 3.26 3.50 2.70 4.61 4.75 2.91 3.91 4.59 4.19 2.68 4.52 4.91 3.18 3.68 4.83 3.87 3.95 3.91 4.15 4.55 4.80 3.41 4.12 3.95 5.08 4.53 3.92 3.58 5.35 3.84 3.60 3.51 4.06 3.07 3.55 4.23 3.57 4.83 3.52 3.84 4.50 3.96 4.50 3.27 4.52 3.19 4.59 3.75 3.98 4.13 4.26 3.63 3.87 5.71 3.30 4.73 4.17 5.13 3.78 4.57 3.80 3.93 3.78 3.99 4.48 4.28 4.06 5.26 5.25 3.98 5.03 3.51 3.86 3.02 3.70 4.33 3.29 3.25 4.15 4.36 4.95 3.00 3.26
320
14
640
2.5051 2.8062
37.5765 39.2868
2
1280
69

3.1072 —
6.2144 150.2778
G lg1( f lg X ) lg1(150.2778) lg1(2.1779) 150.6
f
69
故例类风湿关节炎患者血清EBV-VCA-lgG 抗体的平均滴度为:1:150.6。
三、频数表和频数分布图用途
1.描述频数分布的 类型
(1)对称分布 :若 各组段的频数以频数 最多组段为中心左右 两侧大体对称,就认 为该资料是对称分布
频数
25
20 15
10 5
0 2.45 3.05 3.65 4.25 4.85 5.45 6.10
血 清 总 胆 固 醇(mmol/L) 图 2 - 1 101 名 正 常 成 年 女 子 血 清 总 胆 固 醇 的 频 数 分 布
第二章 计量资料的统计描述
Descriptions of Measurement Data
Content
1. Frequency distribution 2. Description of central
tendency 3. Measures of dispersion 4. Normal distribution 5. Range of reference value
X 2.35 4.78 L 3.91 4.03(mmol/L) 101
(2)加权法:
公式 :
X
f1X1
f2 X 2 f3X3 L

fk Xk

fX
f1 f2 f3 L fk
f
计算4,4,4,6,6,8,8,8,10的均 数?
X 3 4 2 6 38 110 3 231
表 2-4 69 例 RA 患者血清 EBV-VCA-lgG 抗体测定结果
人数 f
滴度倒数 X
lg X
f lg X




4
10
3
20
1.0000 1.3010
4.0000 3.9030
10
40
1.6021
16.0210
10
80
11
160
1.9031 2.2041
19.0310 24.2451
15
3.便于发现一些特大或特小的可疑值
组段
(1) 2.30~ 2.60~ 2.90~ 3.20~ 3.50~ 3.80~ 4.10~ 4.40~ 4.70~ 5.00~ 5.30~ 5.60~5.90 合计
频数f (2) 1 0 0 0 17 20 17 12 9 5 2 1 101
4.便于进一步做统计分析和处理
X(n) 2

X ( n 1) 2

例2-6 7名病人患某病的潜伏期分别为2, 3, 4, 5, 6, 9, 16天,求其中位数。
本例n=7,为奇数 M X (71) X 4 5(天) 2
相关主题