当前位置:文档之家› 数值变量的统计描述

数值变量的统计描述

S S (X X )2 X 2( n X )2
SS 通常作为一个中间统计量使用。
(三)方差 (Variance)
方差是将离均差平方和再取平均,即
S2 (XX)2
n1
注意:对于样本资料,分母用的是n-1,称 为自由度(degree of freedom,df )。
方差的特点:便于数学上的处理,但由于 有平方,度量衡发生变化,不便于实际应用。
符号R 表示。如前例甲乙两患者收缩压的极差分别为
R甲18 614 244 (mmHg)
R乙16 615 97(mmHg)
该法简单明了、容易使用,如用于说明传染病、食 物中毒等的最短、最长潜伏期等;缺点是结果不稳 定。
(二)四分位数间距 (Quartile)
QP75P25
如由上一章例2.4 算出,50岁~60岁正常女性血清
通常指正常人的解剖、生理、生化、免疫及组 织代谢产物的含量等各种数据的波动范围。主要目 的:用于临床疾病诊断。最常用的是95%参考值范围。
确定95%参考值范围示意图
二、医学参考值范围的制定方法
(一)选择一定数量的参照样本
选择参照样本必须要考虑可能影响所要制定参 考值范围指标的各种疾病及干扰因素,将这些人排 除在外。例如在制定血清谷-丙转氨酶活性正常值 时,选取正常人的条件为肝、肾、心、脑、肌肉等 无器质性疾患,近期无特殊用药史等。同时可能需 要考虑性别、年龄、民族、地理位置等因素。样本 含量一般要较大,如n>120。
(五)变异系数(Coefficient of Variation )
CV S 100% X
主要用于对均数相差较大或单位不同的几组观 察值的变异程度进行比较。
例3.3 测得某地成年人舒张压均数为77.5mmHg, 标准差为10.7mmHg;收缩压均数为122.9mmHg,标准 差为17.1mmHg。试比较舒张压和收缩压的变异程度。
第七章 数值变量资料的统计描述 (Measures of Dispersion)
例3.1 对甲乙两名高血压患者连续观察5天,测得 的收缩压(mmHg)结果如下:
患者 甲患者 乙患者
第1天 第2天 第3天 第4天 第5天 162 145 178 142 186 164 160 163 159 166
图3-2 正态分布曲线下的面积
1 2
3
-4 -3 -2 -1 01 1 22 3 43 5 6 7
1 2 3
图3-3 三种不同均值的正态分布
-5 -4 -3 -2 -1 0 1 2 3 4 5
1 2 3 图3-4 三种不同标准差的正态分布
二、标准正态分布 (Standard Normal Distribution)
甘油三脂含量的百分位数P75和P25的位置分别为63.2
mg/dl和135.7 mg/dl,则
Q13.75 6.3 27.2 5(mg/dl)
四分位数间距主要用于衡量明显偏态分布资料的 变异程度。
二、平均差距指标 (一)平均偏差(Mean Difference)
平均偏 差XX
n
如对于例3.1:
甲患者: 平均 1偏 6 12.6 6 差 2 14 15.6 6 2 18 16.6 6 2 15.5)2(
对任何参数的正态分布,都可以通过一个简单的 变量变换 u X 化成 0和 1 的标准正态分布。
通常,可以利用标准正态分布表求出与原始变量X 有
关的概率值。
图3-5 标准正态分布及曲线下面积
参见书中计算实例……
第三节 医学参考值范围
(Reference Value Range) 一、基本概念
均数 X 162.6 162.4
可以看出:两患者收缩压的均数十分接近,但甲患 者的血压波动较大,而乙患者相对稳定。通常,描 述一组观察值,除需要表示其平均水平外,还要说 明它的离散或变异的情况。
第一节 衡量变异程度的指标
一、间距指标 (一)极差(Range)
也称作全距,即观察值中最大值和最小值之差,用
C舒 V张 1 7 压..7 0 5 710 % 01.8 3%
1.1 7 C收 V缩 1 压2 .9 210 % 01.9 3%
第二节 正态分布及应用
一、正态分布(Normal Distribution)
f (X) 1.2 1
0.8
f (X) 1.2 1
0.8
0.6
0.6
0.4
0.4
0.2
0.2
(二)对选定的参照样本进行准确的测定
为保证原始数据可靠,要严格控制检测误差, 包括分析仪器的灵敏度、试剂的纯度、操作技术及 标准的掌握等,同时必须对测量条件做出统一的规 定和说明,如临床化验参考值范围的制定,、饮食、妊娠等),收集、转运和储藏样品 的方法及时间有明确的规定。
0 3.8 4.2 4.6 5.0 5.4 5.8 X
0 3.8 4.2 4.6
f (X )1.2
1
0.8
0.6
0.4
0.2
5 5.4 5.8 X
0 3.6 4 4.4 4.8 5.2 5.6 6 X
图3-1 某地成年男子红细胞数的分布逐渐接近正态分布示意图
f(X)(fi/n)/Xi
f (X)
1
(X)2
(四)标准差 (Standard Deviation)
将方差取平方根,还原成与原始观察值单位 相同的变异量度即为标准差:
S (XX)2 X2( X)2 n
n1
n1
例如对于例3.1经计算有
甲患者: X813 X2 133713 n 5
S 1337183123/519.49(mmHg) 51
同理乙患者: S2.88(mmHg)
5
乙患者: 平均 1偏 6 14.6 4 差 2 16 10.6 4 2 16 16.6 4 2 2.32(
5
特点:直观 , 易理解;但由于用了绝对值,不便于 数学处理,实际中很少使用。
(二)离均差平方和(Sum of Square,SS)
为了克服平均偏差的缺点,可以不通过取绝 对值,而是通过取平方来避免正负抵消,即使用 离均差平方和,其计算公式为
e 22
2
X
正态分布有两个参数: 和 , 分别表示均数和标准差。
主要特征:
1.以 为中心的对称分布
2.钟型曲线
-5 2-.548 -3 1.96-2 -1 0 1 2 1.936 4 2.585
68.3% 95.0% 99.0%
3.曲线下面积分布有规律 4.两个参数决定位置和变异
相关主题