医学统计学基础知识
基本概念
统计描述
统计图表
统计推断
基本概念
医学统计学的定义和研究对象
1.定义统计学通常被定义为“关于数据收集、表达和分析的普遍原理和方法”。
医学统计学则可定义为“根据统计学的原理和方法,研究医学数据收集、表达和分析的一门应用学科”。
2.研究对象医学统计学的研究对象是具有不确定性的医学数据,其基本研究方法是通过收集大量资料,通常是人、动物或生物材料的测量值,发现蕴含其中的统计学规律。
医学统计学的主要内容
1.统计设计
包括调查设计和实验设计。
调查设计主要有抽样方法、调查技术、质量控制技术等;实验设计主要有
各种实验设计模型、分组方法、样本量估计等。
由于统计设计关系到资源分配的可行性、数据收集的正确性和结论的科学性,一旦出现设计上的失误
或缺陷,有可能导致在整个研究的失败。
因此,统计设计是保证统计描述和推断正确的基础。
2.统计描述对原始数据归纳整理,用相应的统计指标,如率、均数等,表示出研究对象最鲜明的数量特征,必要时选择统计表或统计图。
3.统计推断在统计描述的基础上,对统计指标的差别和关联性进行分析和推断。
医学统计资料的类型
在医学研究中,试验或观察结果常按分组因素和反应变量分别记录。
分组因素为研究者根据试验目的
施加的干预,如不同治疗药物、不同治疗期限等。
在某些不能施加干预的观察性研究中,研究者感兴趣的
因素,如年龄、性别等,也可看作分组因素。
在流行病学研究中,这些因素又称为危险因素。
反应变量是
指施加干预后的研究对象的生物反应,如是否治愈、是否死亡、红细胞计数、血细胞计数、血压值等。
统计资料类型通常针对反应变量而言,如收缩压、舒张压、药物不良反应等。
1.计量资料亦称数值变量,为定量测量的结果,通常用专用仪器测量,并有计量单位,如身高(cm)、体重(kg)等。
计量资料有连续性的特点,如身高可以是175cm、175.1cm、175.11cm等。
2.计数资料计数资料是定性观察的结果。
有二分类和多分类两种情况。
二分类观察结果只有两种相互对立的属性,如“阳性”或“阴性”、“死亡”或“存活”、“正常”或“异常”;多分类的定性观察结
果有两种以上互不包含的属性,如新生儿出生缺陷、某病患者的死亡原因等。
这类资料之所以称为计数资料,因为在统计时通常将各种观察结果按属性分类计数,如阳性人数、阴
性人数、死于某病人数等。
3.等级资料介于定量测量和定性观察之间的半定性观察结果,通常有两个以上等级,如阴性、阳性、强阳性,治愈、好转、有效、无效等。
等级资料与计数资料又可统称为分类变量。
它们的区别在于,等级资料虽然也是多分类资料,但各个
类别间还是存在大小或程度上的差别。
表5-3 108例高血压患者随访记录汇总表
医学统计工作的基本步骤
研究设计、收集资料、整理资料和分析资料是统计工作的4个基本步骤。
这4个步骤是紧密联系不可分割的,某一环节发生问题,都将影响最终的统计分析结果。
1.研究设计
按研究者是否对观察对象施加干预(即处理因素),可以分为调查设计和实验设计两大类。
调查设计(不加干预)主要是了解客观实际情况的现场工作。
实验设计(加干预)根据研究对象不同分为动物实验和临床试验(或现场试验)。
无论是调查设计,还是实验设计均包括专业设计和统计学设计两个方面。
专业设计是运用专业理论技术知识进行设计,统计学设计是运用统计学知识和方法进行设计。
两者应相互结合,缺一不可。
2.收集资料的任务是取得准确可靠的原始数据。
(1)统计资料的来源:①经常性资料。
一般指医疗卫生工作中的原始记录。
如医疗卫生工作记录和报告单(卡)、医院各科门诊病历、住院病例、健康检查记录等;②一时性资料。
根据专题调查或实验研究的需要而临时设计的调查表或调查问卷,如临床试验的病例报告单、动物实验的数据记录等。
(2)统计资料的要求:原始资料是统计工作的基本依据,把好收集资料这一关,要求做到:①资料必须完整、正确和及时;②要有足够的数量;③注意资料的代表性和可比性。
3.整理资料的任务是整理原始数据,使其系统化、条理化,以便进一步计算指标和分析。
(1)原始数据的检查与核对:检查核对原始数据有无错漏,以及数据间的相互关系是否合乎逻辑,并予以必要的补充、修正与合理的剔除。
对原始记录的检查核对,应在调查现场完成,而整理资料过程则是从不同角度、用不同方法进一步浄化数据。
它包括:①统计数据的常规捡查。
如检查原始记录的数据有无错误和遗漏;调查项目是否按要求或填表说明填写;统计表格的行栏合计应与总计相符。
②数据的取值范围检错。
可利用频数分布表检查是否有异常值的出现。
③数据间的逻辑关系检错。
逻辑检查是为了查明资料项目之间是否有矛盾,例如,乙型肝炎病史与乙型肝炎血清标志物检查结果是否矛盾。
(2)数据的分组设计和归纳汇总:按资料的性质和数量特征分组,以反映事物的特点。
例如,整理某药物治疗消化性溃疡后的疗效资料,除了得到总的治愈人数外,还可以按年龄、性别、病情轻重等多种特征进行分组,得出各组的治愈人数和治愈率,才能对药物疗效与疾病有关因素进行分析。
常用的分组方法有以下两类:①质量分组:按事物的性质或类型分组,这种方法多适用于分类变量资料或等级资料。
如患者按性别、病情轻重等分组作为分组变量;疗效按治愈、好转和无效等分组作为结局变量。
根据研究需要,有时也可将计量资料转换成计数资料或等级资料,进行质量分组。
例如,舒张压<90mmHg为正常血压,舒张压>90mmHg为高血压。
②数量分组。
按观察值的大小进行分组,这种方法多适用。