定量资料数据的统计描述
f lg X lg f
1
X1,X2…Xn 为各组段的滴度或滴度倒数。 f1,f2…fn分别为各组段的频数。
例2-6 52例慢性迁延性肝炎患者的HBsAg滴度 数据见表2-4,求其平均滴度。
2 1.20412 7 1.50515 ... 7 2.7027 G lg 1 52 lg 1 108.06977/ 52 lg 2.7017 119.74705
①两端的组段应分别包含最小值或 步骤: 最大值; (1) 求全距:(极差) R=29.64-7.42=22.22 ②尽量取较整齐的数值作为组段的 端点,便于对数据进行表述; (2) 定组段数与组距 : 8~15个组段,组距i=全距/组段数 ③组距以相等为宜。 (3) 划组段:以一个稍小于或等于最小值的整数作为第一个
理的各种因素在个体之间都不会完全相同,即个体间存在差
异,因此导致某地18-35岁健康男性居民血清铁含量不会完全 相同,而是呈现或大或小的离散趋势。
一、描述集中趋势的统计指标
平均数:描述一组同质计量资料的集中趋势;反映一组观察值 的平均水平。 常用的平均数有算术均数,几何均数和中位数。 (一)算术均数(mean):简称均数,总体均数用希腊字母µ 表
四、频数分布的类型
对称分布型:指集中位置在正中,左右 两侧频数分布大体对称。
偏态分布型:指集中位置偏向一侧,频数 分布不对称。 正偏态分布:集中位置偏向数值小的一侧。
偏态分布型
频数分布
负偏态分布:集中位置偏向数值大的一侧。
频数表的用途
1. 揭示频数分布的分布特征和分布类型。文献中常 将频数表作为陈述资料的形式。
图中横轴为血清铁含量,纵轴为频率密度,直条面 积等于相应组段的频率。
由于同质性,所有实测值趋向 同一数值的趋势称为集中趋势。 三、 频数分布的两个特征 集中趋势:血清铁含量向中央部分集中, 即中等含量者居多,集中在18 这个组段,这种现象为集中趋势。 离散趋势:从中央部分到两侧的频数分布 逐渐减少,而且血清铁含量的值参差不齐, 最低的接近6 ,最高的接近30 , 这种现象称为离散趋势。 离散趋势或变异程度是指观察 值之间参差不齐的程度。
组段的起点数据。 下限:每个组段的起点(最小值) 。 上限:每个组段的终点(近似最大值)。 注:最后一个组段应同时写出上限和下限来。
(4) 绘制整理表
“下限≤x<上限”
注:各组段的频数之和应等于总的观察例数。
表2
120名正常成年男子血清铁含量的频数分布表 划记
一 上 正一 正上 正正丅 正正正正 正正正正正丅 正正正上 正正丅 正上 止 一
1. 极差(range ,R) 也称为全距,用R表示,即一组资料中,最大值与最 小值之差。 缺点:1)除了最大、最小值外,不能反映组内其他 数据的变异度。2)样本例数越多,抽到较大或较小变量 值的可能性越大,因而极差可能越大。3)即使样本含量 相同,极差也不够稳定。
2. 四分位数间距(quartile range ,Q)
1. 中位数和百分位数的计算 1) 直接法:适用于样本例数n较少的资料。 将观察值按大小顺序排列,当n为奇数时,中
间那个数就是中位数。当 为偶数时,中间两个数 M Xn n 1
的平均数就是中位数。 例2-7
2
M Xn Xn / 2 1 某药厂观察9只小鼠口服高山红景天醇 2 2
由于
3. 均数的应用 但它最适用于对称分布资料,尤其是 正
态分布资料。因为这时均数位于分布的中心,
最能反映资料的集中趋势。
( 二)几何均数(geometric mean):
(几何均数也称为倍数均数,用G表示) 1. 几何均数的计算方法 1) 直接法:适用于样本例数n较少的资料。 将n 个观察值X1,X2,X3…Xn的乘积开n次方
(1)
频数(f)
(2)
组中值(X0)
(3)
fX 0
(4)=(2)(3) (5)=(3)(4)
6~ 8~ 10~ 12~ 14~ 16~ 18~ 20~ 22~ 24~ 26~ X 28~30
1 3 6 8 12 20 27 12 10 8 fx 4 0 1f
7 7 9 27 11 66 13 104 15 180 17 340 19 513 21 378 23 276 25 200 2228 27 18.57108 m ol/ L 29 29 120 2228(∑fX0)
即频数多,权数大,作用也大,频数小,权数小,作 用也小。
例2-3 测得8只正常大白鼠总酸性磷酸酶 (TACP)含量(U/L)为4.20,6.43,2.08, 3.45,2.26,4.04,5.42,3.38。试求其算术均数。
求例2-2中某地120名正常成年男子的血清铁
含量的均数。
120名成年男子血清铁含量均数、标准差计算表(加权法) 组段
组段 6~ 8~ 10~ 12~ 14~ 16~ 18~ 20~ 22~ 24~ 26~ 28~30
合计
120
例 某市大气中SO2的日平均浓度见表2.5,求P25,P50,P75。
例
某市大气中SO2的日平均浓度见表2.5,求中位数,P25,P50,P75。
2. 中位数和百分位数的应用
1)中位数常用于描述偏态分布资料的集中趋势,反映位
2. 便于进一步计算统计指标和进行统计分析处理。
3. 便于发现某些特大或特小的可疑值。
110名7岁男童身高(cm)的频数分布
90 ~ 92 ~ 94 ~ 96 ~ 98 ~ 100 ~ 110 ~ 112 ~ 114 ~ 116 ~ 118 ~ 120 ~ 122 ~ 124 ~ 126 ~ 128 ~ 130 ~ 132 ~ 134 ~ 136 1 0 0 0 0 0 1 3 9 9 15 18 21 14 10 4 3 2 1
频率:各组的频数除以总例数 n 所得的比值。 频率描述了各组频数在全体中所占的比重,各组 频率之和等于100%。 累计频数:本组段的频数与以前各组段的频数 相加; 累计频率:每组段的累计频数除以总例数。
连续变量的频数分布图
直方图
连续型变量的频数分布图,以直方的面积大小表 示频率的多少。 等距分组 以横轴表示被观察变量,纵轴表示频率密度,以 各矩形(宽度为组距)的面积代表各组段的频率。
频数(frequency):对一个随机变量做重复观察,
其中某变量值出现的次数。 频数分布表(frequency distribution table):将各变 量值及其相应的频数列成表格的形式。 例2-2 抽样调查某地120名18岁~35岁健康男性居
民血清铁含量(μmol/L)见P12,试编制频数分布表。
次居中的观察值的平均水平。在对称分布的资料中,中位数和
均数在理论上是相同的。
2)百分位数可用于确定医学参考值范围(详后)。
3)分布在中部的百分位数相当稳定,具有较好的代表性,
但靠近两端的百分位数,只有在样本例数足够多时才比较稳定。
应用平均数的注意事项
1.平均数的计算和应用必须具备同质基础,必须先
合理分组。
卫生统计学
第二章
定量资料的 统计描述
定量资料的统计描述
统计图表:频数分布表(图)
集中趋势指标
统计指标: 离散趋势指标
利用统计表对数据进行概括,用统计图对分布形态 及分布间的关系做直观的表达,用于描述定量资料的统 计指标的意义与计算。
第一节
频数与频数分布
一、连续型定量变量的频数分布 频数表的编制:
组段
6~ 8~ 10~ 12~ 14~ 16~ 18~ 20~ 22~ 24~ 26~ 28~30
频数
1 3 6 8 12 20 27 18 12 8 4 1 120
合计
二、离散型定量变量的频数分布
离散型变量的频数分布图
直条图
横坐标为产前检查次数;纵坐标为 频率,即产前检 查K次的妇女在被统计妇女中所占的比例%。图中等宽矩 形长条的高度与相应检查次数的频率呈正比。
简记为Q,可看为特定的百分位数。P25表示全部观
不同质的事物要分别求平均数,以便分析比较。 2.根据资料的分布选用适当的平均数。对称分布资 料,尤其是正态分布资料,宜用均数,也可用中位数, 而偏态分布资料则中位数的代表性较好,对数正态分
布及等比级数资料宜用几何均数。
二、描述离散趋势的特征数
例2-11 A组 B组 C组 试观察3组数据的离散情况。 26 28 30 32 34 24 27 30 33 36 26 29 30 31 34
49 243 726 1352 2700 5780 9747 7938 6348 5000 2916 841
合计
120(∑f)
43640(
)
2. 均数的两个重要特性
1). 各离均差的总和等于0。(总体中各变量值X与均 数之差称为离均差) 2). 离均差的平方和小于各观察值X与任何数a之差的 平方和。( ) 即 < 设:a≠ ,则a= ±d,d>0
提物(RSAE)后在乏氧条件下的生存时间(分钟)
如下:49.1,60.8,63.3,63.6,63.6,65.6,65.8,
68.6,69.0 n为奇数,M=63.6 (cm)
2)频数表法计算中位数和百分位数:适用于
样本例数n较多的资料。
累计频数:本组段的频数与以前各组段的频数
相加; 累计频率:每组段的累计频数除以总例数。 公式为
i Xn Px L fL f x 100
L为百分位数所在组段的下限,i为该组段的组距,fx
为该组段的频数,fL为百分位数所在组段的前一组段
的累计频数,n为总例数。
例2-8
利用表2-2的频数表求血清铁含量的中位数。
频数 1 3 6 8 12 20 27 18 12 8 4 1 累计频数 1 4 10 18 30 50 77 95 107 115 119 120 累计频率 0.83 3.33 8.33 15.00 25.00 41.67 64.17 79.17 89.17 95.83 99.17 100.00