当前位置:文档之家› 卫生统计学——第一节 统计学的几个基本概念

卫生统计学——第一节 统计学的几个基本概念

卫生统计学
第一节统计学的几个基本概念
一、统计工作的步骤
统计工作的步骤包括:统计设计、收集资料、整理资料和分析资料。

其中统计设计是最关键的一环,是后续步骤的依据。

统计资料主要来自:①卫生统计报表;②经常性工作记录;③专题调查或实验研究。

整理资料的目的是净化原始数据,使其系统化、条理化。

分析资料即通过计算统计指标,反映数据的综合特征,阐明事物的内在联系和规律。

统计分析包括统计描述和统计推断两部分。

统计描述是指运用统计指标如平均数、标准差、率以及统计表和统计图等,对数据的数量特征及其分布规律进行客观地描述和表达,不涉及样本推论总体的问题;统计推断是指一定的可信程度或概率保证下,根据样本信息去推断总体特征。

二、统计学中的几个基本概念
(一)资料的类型
1.定量资料亦称计量资料,其变量值是定量的,表现为数值大小,一般有度量单位。

如调查某年某地7岁女童的生长发育状况,以人为观察单位,女童的身高(cm)、体重(kg)、血红蛋白(g/L)等
均属于定量资料。

一年里的新生儿数。

连续型变量可以取实数轴上的任何数值。

有些变量的数值由测量得到,他们大多属于连续型变量。

例如身高、体重等。

值是定性的,表现为互不相容的类别或属性,例如职业是一个分类变量,其可能的“取值”不是数字,而是工、农、商、学、兵等。

(1
表现为互不相容的两类属性,如性别、疾病和结局等。

②多项分类。

如血型,表现为互不相容的过个类别。

(2)有序分类资料:各类之间有程度的差别,给人以半定量的概念,亦称等级资料。

如极不满意、有点满意、中毒满意、很满意、极满意等。

有时为了数据分析的方便,人们将一种类型的变量转化为另一种类型。

但变量只能由高级向低级转化:连续型→有序→分类→二值;不能作相反方向的转化。

离散型变量常常通过适当的变换或连续性校正后借用连续型变量或有序变量的方法来分析。

(二)总体与样本
总体:就是所有同质观察单位某种观察值(即变量值)的集合。

样本:是总体中随机抽取的部分观察值的集合。

抽样:从研究总体中抽取一部分有代表性的个体的手段。

统计推断的工具是有关概率的理论。

如果某事件的结果具有多样
性的,事先不能肯定,人们就用一系列概率来描述出各种结局的可能性。

既然是推断,既然是由部分推断全体,统计学的结论从来就不是完全肯定或者完全否定的。

能不能成功地达到从样本推断总体的目的,关键是抽样的方法、样本的代表性和推断的技术,这些是统计学的核心内容。

(三)、参数与统计量
参数:表示总体分布特征的统计数字,用于描述总体特征的指标,由总体观察值计算而来。

同一总体的个体彼此之间的差异具有一定的规律性。

通常用变量取值的分布来全面反映这种规律性。

为了便于处理实际问题,统计学中常用若干典型的分布模型来近似地描写实际资料,例如,正态分布、二项分布、和泊松分布等,常称为统计模型。

一旦知道这两个参数的数值,我们就完全了解相应的正态分布;这两个参数的大小是客观存在,然而往往是未知的,我们需要通过样本资料来估计这两个参数。

观察样本中的个体,我们获得一批数据,计算他们的均数,得到样本均数。

这种由观察资料计算出来的量称为统计量。

我们用样本均数这个统计量来近似地反映总体均数这个参数。

总之,统计学关心的常常是总体参数的大小,其依据却是统计量及其性质。

一个总体中有许多个体,他们之所以汇集起来共同成为人们研究的对象,必定存在共性。

我们说一些个体处于同一总体,就是指他们大同小异,具有同质性。

然而,同一总体内的个体间存在差异又是绝对的,这种现象称为变异。

统计学的任务就是在变异的背景上描述同一总体的同质性,揭示不同总体的特异性。

(四)概率和频率
概率是描述随机事件发生可能性大小的数值,常用P表示。

随机事件概率的大小在0与1之间,P越接近1,表示某时间发生的可能性越大;P越接近0,表示某事件发生的可能性越小。

习惯上将P≤0.05的事件,称为小概率事件,表示在一次实验或观察中该事件发生的可能性很小,可视为不发生。

在现实中,随机事件的概率往往是未知的,因此,当观测单位足够多时,常用样本中事件的实际发生率来估计总体概率,这种实际发生率称为频率。

在相同条件下,独立重复进行n次试验,事件A出现f次,则事件A出现的频率为f/n。

如治疗200例患者,120名患者治愈,治愈率为60%,这就是一个频率。

当观测单位较少时,用频率估计概率是不可靠的。

相关主题