第五章医学统计学的基本知识
第二节医学统计学的基本知识
一、基本概念
(一)医学统计学的定义和研究对象
1.医学统计学定义:
根据统计学的原理和方法,研究医学数据收集、表达和分析的一门应用学科。
2. 医学统计学研究对象:
是具有不确定性的医学数据,其基本的研究方法是通过收集大量资料,通常是人、动物或生物材料的测量值,发现蕴含其中的统计学规律。
(二)医学统计学的主要内容
1.统计设计
2.统计描述
3.统计推断
(三)医学统计资料的类型
计量资料、计数资料和等级资料三类。
1.计量资料——数值变量:
为定量测量的结果,通常用专用仪器测量,并有计量单位,如身髙(cm)、体重(kg)等。
2.计数资料——定性观察的结果。
二分类:两种相互对立的属性如:阳性/阴性、正常/异常
多分类:定性观察结果有两种以上互不包含的属性,
如新生儿出生缺陷、某病患者的死亡原因等。
这类资料之所以称为计数资料,因为在统计时通常将各种
观察结果按属性分类计数,如阳性人数、阴性人数、
死于某病的人数等。
3.等级资料:
介于定量测量和定性观察之间的半定性观察结果,通常有两个以上等级,
如阴性、阳性、强阳性,治愈、好转、有效、无效等。
(四)医学统计工作的基本步骤
研究设计、收集资料、整理资料和分析资料是统计工作的4个基本步骤。
(五)统计学的几个重要概念
1.同质与变异
同质:研究对象具有相同的背景、条件、属性称为同质。
变异:同一性质的事物,其个体观察值(变量值)之间的差异,在统计学上称为变异。
统计学所研究的对象是以同质为基础,并具有变异的事物或现象。
2.总体与样本
总体:是根据研究目的确定的同质观察单位的全体,更确切地说,是同质的所有观察单位某种变量值的集合。
观察单位——个体,是统计研究中最基本的单位。
样本:即从总体中随机抽取有代表性的一部分观察单位,其测量值(或观察值)的集合称为样本(sample)。
抽样研究的目的是用样本信息推论总体特征。
3.参数与统计量
参数:指总体指标,如总体均数、总体率、总体标准差等。
统计量:指样本指标,如样本均数、样本率、样本标准差等。
4.误差
医学科学研究中的误差:
通常指测量值与真实值之差,其中包括系统误差和随机测量误差;
以及样本指标与总体指标之差,即抽样误差。
5.概率与频率
概率是对总体而言,频率是对样本而言。
概率:指某随机事件发生的可能性大小的数值,常用符号P来表示。
随机事件的概率在0与1之间,即0≤P≤1,常用小数或百分数表示。
P越接近1,表明某事件发生的可能性越大,P越接近0,表明某事件发生的可能性越小。
频率:指一次实验结果计算得到的样本率。
二、统计描述
(一)数值变量资料的统计描述
1.频数表:最小值、最大值、组段之间首尾相接。
2.频数分布图:直接反映连续变量各种取值出现的机会。
3.描述离散趋势的指标:方差与标准差、极差、百分位数、变异系数。
4.描述集中趋势的指标:算数均数、中位数、几何均数。
(二)分类资料的统计描述
1.频数表:表5-4 108例患者随访方式频数表。
2.相对数:比和率(见本章第一节)。
三、统计表和统计图
(一)统计表
统计表是以表格的形式,表达被研究对象的特征、内部构成及研究项目分组之间的数量关系。
1.统计表的结构:标题、标目、线条、数字、备注等。
2.制表原则:重点突出,简单明了。
主谓分明,层次清楚。
3.制表要求
1)标题:概括说明表的内容,位于表的上方,内容简洁扼要。
2)标目:指明表内数字含义,横标目为主语,表示被研究事物;纵标目为谓语,表示被研究事物的各项统计指标。
3)线条:除顶线、底线、标目线以外,尽量少不必要的线条,不用竖线、斜线。
4)数字:一律使用阿拉伯数字,应准确无误;小数位应一致,位次对齐。
(二)统计图
统计图是通过点的位置、线段的升降、直条的长短和面积的大小来表现事物的数量关系。
其特点是直观、形象、利于对比等。
四、统计推断
统计推断是用样本信息推断总体特征,包括总体参数的估计和假设检验,它是统计学的核心内容。
(一)假设检验的基本原理
假设检验,亦称为显著性检验,是统计推断的核心,也是实际应用最广的内容。
通常把需要判断的总体特征叫做“统计假设”,简称假设,利用样本信息判断假设是否成立的统计方法称为假设检验。
(二)假设检验的基本步骤
1.建立检验假设,确定检验水准。
2.选定检验方法,计算检验统计量。
3.确定P值,做出推断结论
(三)假设检验的注意事项
1.检验方法的正确选择
2.结果的解释。