当前位置:文档之家› 卫生统计学

卫生统计学

第一章绪论一,名词解释1.参数:根据总体分布的特征而计算的总体统计指标。

2. 总体:研究目的确定的同质观察单位的全体。

3. 同质:总体中个体具有相同的性质。

4.变异:同质基础上的个体差异。

5.样本:从总体中随机抽取的有代表性的一部分观察单位,其实测值的集合。

6.统计量:由总体中随机抽取样本而计算的相应样本指标。

概率:描述随机事件发生的可能性大小的数值。

(概率的统计定义:在一定条件下,重复做n次试验,nA为n次试验中事件A发生的次数,如果随着n逐渐增大,频率nA/n逐渐稳定在某一数值p附件,则数值p称为事件A在该条件下发生的概率。

)7.抽样误差:由个体变异的存在和抽样引起样本统计量与相应的总体参数间以及各样本统计量之间的差别。

二,问答题。

1.统计学的基本步骤有哪些?答:统计学是一门处理数据中变异性的科学与艺术,它包括收集数据、分析数据、解释数据,以及表达数据。

2.总体与样本的区别与关系?答:区别:样本是总体的一部分,联系:如果样本的均衡性较好,就能够代表总体的特征。

3. 抽样误差产生的原因有哪些?可以避免抽样误差吗?答:一,个体差异引起;二,抽样方法引起。

抽样误差不能避免,但可以随着样本含量的增大而减小。

4.何为概率及小概率事件?答:概率是指在一定条件下,重复做n次试验,nA为n次试验中事件A发生的次数,如果随着n逐渐增大,频率nA/n逐渐稳定在某一数值p附件,则数值p称为事件A在该条件下发生的概率。

小概率事件是指习惯上将P<=0.05或P<=0.01称为小概率事件,表示某事件发生的可能性很小。

第二章定量资料的统计描述一、名词解释1.频数:对一个随机事件进行反复观察,其中某变量值出现的次数被称为频数。

2.方差:用来度量随机变量和数学期望(即均值)之间的偏离程度。

3. 标准差:也称均方差,是各数据偏离平均数的距离的平均数。

4.中位数:是指将原始观察值从小到大或从大到小排序后,位次局中的那个数。

5. 几何均数:变量对数值的算数均数的反对数。

6.四分位数间距:百分位数P75和百分位数P25之差。

7.正偏态分布:偏态分布是相对于正态分布而言的,如果频数分布的高峰向左偏移,长尾向右侧延伸为正偏态分布也叫右偏态分布。

8.负偏态分布:偏态分布是相对于正态分布而言的,如果频数分布的高峰向右偏移,长尾向左延伸则成负偏态分布,也叫左偏态分布。

9.变异系数:是衡量资料中各观测值变异程度的一个统计量,用标准差与平均数的比值来表示。

二、问答题。

描述数值变量资料集中趋势的指标有哪些?其适用范围有哪些?答:常见的包括算术均数、几何均数、中位数。

相同点:算数均数和中位数都适用于正态分布的资料。

不同点:几何均数适用于可经对数转换为对称分布的资料;中位数适用于各种分布的资料,常用于描述偏峰分布的资料。

描述数值变量资料离散趋势的指标有哪些?其适用范围有何异同?答:常见的包括:极差、四分位数间距、方差、标准差和变异系数。

适用范围相同点:极差和四分位数间距可用于各种资料的分布;方差和标准差适用于对称分布,特别是正态分布的资料。

不同点:极差易受样本含量的影响,很不稳定;四分位数间距特别适用偏峰分布资料;变异系数适用于量纲不同的变量间,或均数差别较大的变量间变异程度的比较。

第三章定性资料的统计描述一,名词解释率:指某现象实际发生观察单位数与可能发生该现象的观察单位总数之比,用以说明某现象发生的频率或强度。

构成比:是指事物内部某一组成部分观察单位数与该事物内部各组成部分观察单位总数之比,用以说明某一事物内部各组成部分所占的比重或分布,常用百分数表示。

相对比:是指两个有关联的指标之比,用以说明一个指标是另一个指标的几倍或几分之几。

人口金字塔:是将人口的性别和年龄资料结合起来,以图形的方式表达人口的性别和年龄构成。

它以年龄为纵轴,人口数构成为横轴,左侧为男,右侧为女而绘制的两个相对应的直方图,可以分析过去人口的出生死亡情况以及今后人口的发展趋势。

标准化率:寻找一个统一的分布作为标准组,然后每个比较组均按该分布标准计算相应的率,所得到的率是相对于标准组的,故称为标准化率。

标准化死亡比(SMR):实际死亡人数与期望死亡人数之比。

期望寿命:指0岁时的预期寿命。

一般用“岁”表示。

即在某一死亡水平下,已经活到X 岁年龄的人们平均还有可能继续存活的年岁数。

动态数列:按时间顺序将一系列统计指标(可以为绝对数,相对数或平均数)排列起来,用以观察和比较该事物在时间上的变化和发展趋势。

二、问答题请说明频率型指标与强度型指标的主要区别?答:主要区别:指标的解释不同,频率型指标是表示事物内部某个组成部分所占的比重或分布,或指某现象发生的频率。

强度型指标是指单位时间内某现象发生的频率。

标准化法的基本思想?答:采用统一的标准,以消除重要因素的构成不同对粗率的影响,使通过标准化后的标准化率具有可比性。

请比较发病率和患病率的不同。

答:发病率表示一定时期内,在可能发生某病的一定人群活过的总人年数中,新发生的某病病历数,其分子是新病历数,分母是总人年数;患病率,又称现患率,指某时点上受检人数中先患某种病的人数,通常用于描述病程较长或发病时间不易明确的疾病的患病情况,其分子包括新旧病例数,分母是受检总人数。

在一定的人群和时间内,发病率和患病率有密切关系,两者与病程(D)的关系是:PR=IR×D。

请比较死亡率与病死率的不同。

答:死亡率与病死率的分子是一样的,均表示因某病死亡的人数,但死亡率的分母是总人年数,侧重反映发生的强度,或单位时间内死亡的概率;病死率的分母是患某病的人数,反映疾病死亡的概率。

应用相对数应注意的事项。

答:1.分析时不能以构成比代替率;2.应用相对数对比分析时,要考虑资料是否具有可比性;3.计算相对数时分母应有足够数量;4.对观察单位数不等的几个率,不能直接相加求其平均;5.样本率要检验。

应用标准化的注意事项。

答:1.标准化的应用范围很广,适用于“某事件的发生率”可以是治愈率,也可以是患病率,还可以是发病率、病死率等。

当某个分类变量在两组中分布不同时,这个分类变量就成为两组频率比较的混杂因素,标准化法的目的就是消除这个混杂因素的影响。

2.标准化后的标准化率,已经不再反映当时当地的实际水平,它只是表示相互比较的资料间的相对水平。

3.标准化法的实质是找一个“标准“,使两组得以在一个共同的”平台“上进行比较。

4.两样本标准化率是样本值,存在抽样误差。

比较两样本的标准化率,当样本含量较小时,还应作假设检验。

第四章统计表与统计图一、问答题依次写出箱式图中涉及到的各个取值。

答:由大到小的次序为:极大值、P75、中位数、P25和极小值。

直方图中各矩形的高度等于频数(或频数),对吗?答:对于各组距相等的情形,该说发是对的。

若某些组段的组距与多数阻段所取组距不同时,例如前者是后者的k倍,则该不等距组段的高度为频数(频率)除以k。

确切地说,组段对应的面积等于频数(频率)。

统计表的列表原则是什么?答:一是重点突出,简单明了;二是主谓分明,层次清楚,符合逻辑。

线图和半对数线图的主要区别是什么?答:线图的纵轴尺度为算术尺度,用以表示某指标随时间的变化趋势;半对数线图的纵轴尺度为对数尺度,用以表示某指标随时间的增长或减少速度。

第五章常用概率分布一、名词解释正态分布:是一种很重要的连续型分布,以均数为中心,左右两侧对称,靠均数两侧的频数较多,离均数越远,频数越少,形成钟形分布。

Poisson分布:是一种离散型分布,用以在单位时间、空间、面积等的罕见时间发生次数的概率分布。

二项分布:对只有两种互斥结果的离散型随机事件的规律性进行描述的一种概率分布。

医学参考值范围:是指特定的“正常”人群(排除了对所研究指标有影响的疾病和有关因素的特定人群)的解剖、生理、生化指标及组织代谢产物含量等数据中大多数个体的取值所在的范围。

人们习惯用该人群中95%的个体某项医学指标的取值范围作为该指标的医学参考值范围。

二、问答题医学参考值范围确定的方法是什么?答:百分位数法和正态分布法。

简述二项分布、Poisson分布、正态分布的区别与联系。

答:区别:二项分布、Poisson分布是离散型概率分布,用概率函数描述其分布状况,而正态分布是连续型概率分布,用密度函数和分布函数描述其分布状况。

联系:Poisson分布可以视为n很大而π很小的二项分布。

当n很大而π和1—π都不是很小的时候二项分布渐近正态分布,当λ》=20的时候Poisson分布渐近正态分布。

控制图的基本原理。

答:如果某一波动仅仅由个体差异或随机测量误差所致,那么观察结果服从正态分布;依据标准正态分布曲线下面积的分布规律性,确定出现概率非常小的若干情况作为异常标准;如果出现相应结果则判为异常。

二项分布的特征?答:二项分布图的高峰在μ=nπ处或附近;π为0.5时,图形是对称的;当π不等于0.5时,分布不对称,且对同一n,π离0.5愈远,对称性愈差。

对同一π,随着n的增大,分布趋于对称。

当n→∞时,只要π不太靠近0或1,二项分布趋于对称。

Poisson分布的特征?答:(1)Poisson分布的总体均数与总体方差相等,均为λ。

(2)当λ较小时,图形呈偏态分布;当λ较大时,图形呈正态分布。

(3)Poisson分布的观察结果具有可加性。

正态分布曲线的位置与形状的特点?答:(1)关于χ=μ对称。

(2)在χ=μ处取得该概率密度函数最大值,在χ=μ±σ处有拐点。

(3)曲线下面积为1。

(4)μ决定曲线在横轴上的位置,μ增大,曲线沿横轴向右移;反之,μ减小,曲线沿横轴向左移。

(5)σ决定曲线的形状,当μ恒定时,σ越大,数据越分散,曲线越“矮胖”;σ越小,数据越集中,曲线越“瘦高”。

第六章参数估计基础一、名词解释统计推断:抽样研究的目的是用样本信息来推断相应总体的特征,这一过程称为统计推断。

参数估计:如何由样本统计指标来推断总体相应指标。

假设检验:如何由样本差异来推断总体之间是否可能存在差异。

标准误SEM:样本均数的标准差,即均数的标准误。

置信区间CI:将样本统计量与标准误结合起来,确定一个具有较大置信度的包含总体参数的范围,该范围称为总体参数的置信区间。

t分布:在实际的工作中,往往σ是未知的,常用s作为σ的估计值,为了与μ变换区别,称为t变换,统计量t值的分布称为t分布。

二、问答题t分布图形的特征?答:(1)单峰分布,以0为中心,左右对称;(2)ν越小,t值越分散,曲线的峰部越矮,尾部越高;(3)随着ν逐渐增大,t分布逐渐接近标准正态分布;当ν趋向∞时,t分布趋近标准正态分布。

总体分布的形态和样本含量对样本均数的抽样分布会产生何种影响?答:无论原始数据的总体分布形态如何,即对于任意分布而言,在样本含量足够大时,其样本均数的分布近似于正态分布,且样本均数的均数等于原分布的均数,样本均数的标准误有公式(6-1)计算。

相关主题