当前位置:文档之家› 卫生统计学知识点(笔记)

卫生统计学知识点(笔记)

第一章绪论1.统计学(statistics)是一门处理数据中变异性的科学与艺术,内容包括收集、分析、解释和表达数据,目的是求得可靠的结果。

2.▲总体(population)用来表示大同小异的对象全体,例如一个国家的所有成年人;某地的所有小学生。

可分为目标总体和研究总体。

若试图对某个总体下结论,这个总体便称为目标总体(target population);资料常来源于目标总体中的一个部分,它称为研究总体(study population)。

需要谨慎的是,就研究总体所下的结论未必适用于目标总体。

3.▲样本(sample)是指从研究总体中抽取的一部分有代表性的个体。

获取样本的过程称为抽样(sampling)。

抽样研究的目的是用样本数据推断总体的特征。

需要注意的是,统计学的结论从来就不是完全肯定或完全否定的,能不能成功地达到从样本推断总体的目的,关键是抽样的方法、样本的代表性和推断的技术。

4.▲同质(homogeneity)是指同一总体中个体的主要性质相同。

5.▲变异(variation)是指同质的个体之间存在的差异。

6.▲变量的类型二分类变量分类变量或名义变量定性变量多分类变量变量有序变量或等级变量定量变量离散型变量连续型变量变量的转化:只能由“高级”向“低级”转化,即由信息量多的向信息量少的类型转化,如:定量有序分类二值7.▲参数(parameter)是反映总体特征的指标,参数的大小是客观存在的,是一个常数,不会发生变化,然而往往是未知的,需要通过样本资料来估计,如总体均数μ,总体标准差σ。

8.▲统计量(statistic)又称样本统计量,是反映样本特征的指标,是由观察资料计算出来的,如样本均数 X,样本标准差S。

统计学的任务就是依据样本统计量来推断总体参数。

9.▲概率与频率的区别:概率是参数,频率是统计量;频率总是围绕概率上下波动。

当某事件发生的概率≤0.05时,即P≤0.05,统计学习惯上称该事件为小概率事件。

10.▲误差:表示统计量与参数之间的差别或测量值与真值之间的差别。

可分为系统误差和随机误差,其中系统误差呈现倾向性偏大或偏小现象,是可以避免的;而随机误差,是非人为偶然因素所致,不可避免,但可通过增大样本量等措施使其减小。

11.因果与联系:存在联系未必有因果关系,需排除虚假关联、间接关联。

大多数观察性研究,单靠统计学分析只能考察变量之间的联系,难以证明因果关系。

第二章 定量变量的统计描述第一节 频率分布表与频率分布图1.频率分布表:是指对各变量值出现的频率列表,简称频率表,频率分布表的图形表示即为频率分布图。

2.编制频率表的注意事项:(1)分组不宜过粗或过细,组段数一般取10左右,且常采用等距分组;(2)各组段要连续但不能重叠,除最后一个组段外,其余组段应包含下限值,不包含上限值。

(3)第一组段应包含最小值,最后一个组段应包含最大值。

3.▲编制频率分布表(图)流程: (1)求极差(全距)(2)划分组段:确定组段数、组距、 (3)根据组距分组(4)制作频数表和频数图4. ▲频数分布表(图)的用途: (1)描述变量的分布类型 对称分布分布 正偏峰分布 偏峰分布负偏峰分布 (2)揭示变量的分布特征集中趋势(平均水平):算术均数、几何均数、中位数、众数 分布特征离散趋势(变异程度):极差、四分位数间距、方差、标准差、变异系数(3)便于发现某些离群值或极端值(4)便于进一步计算统计指标和统计分析第二节 描述平均水平的统计指标1.均数的特性:①各观察值与均数之差(离均差)的总和等于0()0=-∑x x②各观察值的离均差平方和最小()()()x a a x x x ≠-<-∑∑22 (x 为表中数,a 为表中任意≠x 的数)2.▲常用的平均数的比较PS :正态分布 :均数=中位数 正偏峰分布:均数>中位数 负偏峰分布:均数<中位数3. 百分位数(x P ) ▲()L xx F x n f iL P -•+=% L :欲求的百分位数所在组段的下限 i :该组段的组距 x f :该组段内的频数n :总频数L F :所在组段的累计频数 百分位数50P 就是中位数4. 众数(mode ):总体/样本中出现次数最多的数值第四节 描述变异程度的统计指标小结:对于服从正态分布或近似正态分布的变量,常把算术均数和标准差结合起来( X±S),从平均水平和变异程度两方面描述变量的分布特征;对于服从偏峰分布的变量,常把中位数和四分位数间距结合起来描述变量的平均水平和变异程度。

第五节统计表和统计图1.▲统计表的组成部分(1)表号及标题:位于统计表上方中央。

(2)标目:分为横标目和纵标目。

(3)线条:常用“三线表”,包括顶线、底线和纵标目分隔线;左右两侧不应有边线,左上角不宜有斜线,表内不应有竖线。

(4)数字:服从正态分布用(均数±标准差)描述;不服从正态分布用中位数(下四分位数~上四分位数)。

表内不留空格,数字暂缺或未记录用“...”表示,无数字用“-”表示。

(5)备注:非基本要素,在统计表下方。

2.绘制统计图的基本要求(1)图号和标题:位于图的下方中央。

(2)纵横坐标轴:标目尺度,纵轴尺度自下而上,横轴尺度自左而右,数量一律由小到大,并等距表明。

(3)直方图、累计频率分布图和直条图纵坐标要从0开始。

(4)纵横坐标长度的比例一般为7:10。

3.▲描述定量变量的常用统计图比较第三章 定性变量的统计描述第二节 常用相对数指标(注:具体计算公式详见课本)2. ▲应用相对数时的注意事项(1)理解相对数的含义不可望文生义;需牢牢掌握三者的概念 (2)频率型指标的解释要紧扣总体与属性;(3)计算相对数时分母应有足够的数量;样本例数较少会使相对数波动较大 (4)正确计算合计频率; (5)注意资料的可比性;在比较相对数时,除了要对比的因素(如不同的药物),其余的影响因素应尽可能相同或相近(6)样本相对数的统计推断。

应进行参数估计与假设检验第三节 医学人口统计常用指标1.描述人口特征的常用指标(1)人口总数:一般指一个国家或地区在某一特定时间的人口数,按惯例,一般采用一年的中点,即7月1日零时为标准时点进行统计。

(2)平均人口数:通常是指相邻两年年末(12月31日)人口数的平均值,当人口数在一年中是均匀变动时,也可用年中(7月1日零时)人口数代表全年的平均人口数,平均人口数常用作计算出生率、死亡率、发病率等指标的分母。

(3)▲人口学特征指标指标 分子 分母 基数 指标类型 老年(人口)系数 ≥65岁人口数 人口总数 100% 频率型 少儿(人口)系数 ≤14岁人口数 人口总数 100% 频率型总负担系数 ≤14岁人口数+≥65岁人口数15-64岁人口数 100% 相对比型少儿负担系数 ≤14岁人口数 15-64岁人口数 100% 相对比型 老年负担系数 ≥65岁人口数 15-64岁人口数 100% 相对比型 老少比 ≥65岁人口数 ≤14岁人口数 100% 相对比型性别比男性人口数女性人口数100% 相对比型2.▲测量生育水平的统计指标指标粗出生率总生育率年龄别生育率总和生育率定义某年某地平均每千人口的活产数某年某地平均每千名育龄妇女的活产数某年某地每千名某年龄组育龄妇女的活产数表示每个妇女一生平均生多少个孩子分子同年活产数同年活产数同年某年龄组活产数计算方法:15-49岁年龄别生育率的总和分母同年平均人口数×1年同年15-49岁妇女数同年某年龄组平均妇女数×1年用途反映一个国家或地区的人口自然变动的基本指标更确切地反映生育水平可直接比较不同地区不同时期同一年龄别生育率局限性受人口年龄性别结构的影响较大,只能粗略反映生育水平受育龄妇女内部年龄结构的影响3.测量人口再生育的统计指标指标定义计算用途自然增长率粗生育率与粗死亡率之差粗生育率-粗死亡率粗略估计人口增长趋势粗再生育率每个妇女一生平均生育的女儿数总和生育率×女婴占出生婴儿的比例净再生育率(NRR)NRR=1,未来人口将保持恒定;NRR>1,未来人口将增多;NRR<1,未来人口将减少4.▲测量死亡水平的指标指标定义分子分母用途粗死亡率某地某年平均每千人口中的死亡数同年内死亡人数年平均人口数×1年反映当地居民总的死亡水平年龄别死亡率某年某年龄别平均每千人口中的死亡数同年某年龄组死亡人数同年某年龄组平均人口数×1年婴儿死亡某年活产儿中未同年<1周同年活产儿总数反映社会卫生率▲满一周岁婴儿的死亡频率岁死亡人数状况、婴儿保健工作以及人群健康状况的重要指标之一,也是死亡统计中较敏感的指标围生儿死亡率同年围生期死胎数+死产数+<7天死亡人数同年围生期死胎数+死产数+活产数衡量孕前、孕期、产期、产后保健工作质量的敏感指标之一5岁以下儿童死亡率▲同年5岁以下儿童死亡数同年活产儿总数综合反映儿童健康水平和变化的主要指标孕产妇死亡率某年中由于怀孕和分娩及并发症造成的孕产妇死亡人数与同年出生活产数之比同年孕产妇死亡数同年活产儿总数间接反映一个国家的卫生文化水平死因别死亡率某种原因所致的死亡率,也称某病死亡率同年内某原因死亡人数同年平均人口数×1年死因分析的重要指标,反映各类病伤死亡对居民生命的危害程度某病病死率在某一期间内(1年)患某病者因该病死亡的百分比同年某病死亡人数同年患该病总数说明一种疾病的严重程度,也可反映一个医疗单位医疗水平和质量死因构成比全部死亡人数中,死于某死因者所占的百分比同年某死因死亡人数同年内死亡总数说明各种死因的相对重要性死因顺位按各类死因构成比的大小由高到低排列的位次说明各类死因的相对重要性第四节疾病统计常用指标1.疾病统计指标指标定义用途发病率一定时期内,在可能发生某病的一定人群中新发生某病的强度1.表示发病危险的直接指标;2.用于探讨疾病的危险因素;3.评价疾病防治效果患病率某特定时间内某病新旧病例占描述病程较长或发病时间不易明确患病率=发病率×病程治愈率 受治病人中治愈的频率第五节 粗率的标准化法1.标准化法(1)目的:消除用于比较的两组个体其他变量分布不同的影响(2)做法:找一个“标准”,在这个共同的“平台”上比较两组资料。

“标准”的选择有以下三种:第一,选定两组之一,将其作为“标准”;第二,两组合并,作为“标准”;第三,在两组之外另选一个群体,将其作为“标准”。

2.▲标准化率的计算 直接标准化法(1)选定“标准人口”;(2)分别计算“标准人口”的预期治愈人数之和; (3)分别计算两种疗法的标准化治愈率标准化治愈率=预期治愈人数之和/标准人口数 间接标准化法(1)选定该事件的“标准发生率”;(2)分别计算两组每个类别中发生某事件的预期人数之和; (3)分别计算两组合计发生率与标准患病率的乘积 预期患病人数之和实际患病人数之和标准患病率标准化患病率⨯=3.▲应用标准化法的注意事项:(1)标准化法的目的是消除混杂因素的影响;(2)标准化后的标准化率,已经不再反映当时当地的实际水平,它只是表示相互比较的资料间的相对水平;(3)标准化法的实质是找一个“标准”,使两组得以在一个共同的“平台”上进行比较。

相关主题