当前位置:文档之家› 卫生统计学-重点整理资料东大

卫生统计学-重点整理资料东大

卫生统计学第一章绪论1、卫生统计学的概念(P1)卫生统计学是应用概率论和数理统计学的基本原理和方法,研究居民卫生状况以及卫生服务领域中数据的收集、整理和分析的一门科学,是卫生及其相关领域研究中不可缺少的分析问题。

2、卫生统计学的4个基本步骤(P3):设计、收集资料、整理资料、分析资料3、卫生统计学的几个基本概念(P4):⑴同质:在统计学中,若某些观察对象具有相同的特征或属性,我们就称之为同质,或具有同质性。

⑵变异:同质个体的某项特征或属性的观察值或测量值之间的差异。

⑶总体:同质的所有观察单位某种特征或属性的观察值或测量值的集合。

⑷样本:从总体中随机抽取的具有代表性的部分观察单位的集合。

样本中包含的观察单位个数成为样本含量。

⑸参数:反映总体特征的指标,一般是未知的,常用希腊字母表示,如总体均数μ、总体率π等。

⑹统计量:根据样本观察值计算出来的指标,常用拉丁字母表示,如样本均数x 、样本率等。

⑺变量与资料:对每个观察单位进行观察或测量的某项特征或属性称为变量;变量值的集合成为资料。

⑻定量资料:亦称计量资料,其变量值是定量的,表现为数值大小,一般有度、量、衡单位。

⑼定性资料:亦称分类资料,其观察值是定性的,表现为互不相容的类别或属性,一般无度、量、衡单位。

可细分为:①计数资料;②等级资料第二章调查研究设计★1、调查研究的特点(P7):①不能人为施加干预措施;②不能随机分组;③很难控制干扰因素;④一般不能下因果结论2、常用抽样方法(名称、原理):⑴单纯随机抽样:先将调查总体的全部观察单位统一编号,然后采用随机数字表、统计软件或抽签方法之一随机抽取n(样本大小)个编号,由这n个编号所对应的n个观察单位构成研究样本。

⑵系统抽样:又称机械抽样或等距抽样。

事先将总体内全部观察单位按某一顺序号等距分成n(样本大小)个部分,每一部分内含m个观察单位;然后从第一部分开始,从中随机抽出第i 号观察单位,依此用相等间隔m机械地在第2部分、第3部分直至第n部分内各抽出一个观察单位组成样本。

⑶分层抽样:先按对观察指标影响较大的某项或某几项特征,将总体分成若干层,该特征的测定值在层内变异较小,层间变异较大,然后分别从每一层内随机抽取一定数量的观察单位结合起来组成样本。

⑷整群抽样:将总体划分为群(初级观察单位),各群由次级观察单位组成,随机抽取一部分群,调查抽中群的全部次级观察单位。

第三章实验设计★1、实验设计的特点(注意与调查研究的特点的区别):⑴研究者可人为设置处理因素;⑵受试对象接受何种处理因素或处理因素的何种水平是随机的。

★2、实验设计的三要素、四原则:⑴基本要素:①处理因素②受试对象③实验效应⑵基本原则:①对照原则②随机原则③重复原则④均衡原则4、实验设计的基本步骤:⑴明确实验目的;⑵确定研究对象;⑶确定可比的实验组和对照组;⑷确定把受试对象分配到各处理组中的原则;⑸确定样本含量;⑹确定方法和指标;⑺偏倚及其控制5、常用的实验设计方案:主要掌握完全随机设计和配对设计。

第四章定量资料的统计描述★1、频数表的编制:①求极差②确定组数和组距(一般8~15组)③确定组段(上限=下限+组距)④归组计数,整理成表★2、频数表的用途:⑴揭示资料的频数分布特征和频数分布类型①频数分布的特征:集中趋势和离散趋势;②频数分布的类型:对称分布和偏态分布(高峰位置偏向数值小的一侧——正/右偏态分布;高峰位置偏向数值大的一侧——负/左偏态分布)⑵便于发现某些特大或特小的可疑值⑶便于进一步计算指标和统计处理3、连续型的定量资料,其频数图中各长方形是相连的,又称直方图;离散型的定量资料,其频数图是非连续的,其频数图中各长方形是又间隔的,称直条图。

4、定量资料集中趋势的描述,常用平均数——表达一组同质定量数据的平均水平或集中位置。

(结合书本的例题加深理解)⑴算术均数:适用于对称分布特别是正态分布资料;⑵几何均数:适用于①对数正态分布②等比级数资料;观察值中不能有0⑶中位数:是一种位置平均数,适用于偏态分布资料、一端或两端无确切值、总体分布不明的资料;百分位数:一组数据某一百分位置的水平;确定非正态分布资料的医学参考值范围。

平均数意义应用场合均数平均数量水平对称分布,尤其正态分布几何均数平均增减倍数等比、对数正态分布中位数位次居中的观察值水平偏态、分布不明确、分布末端无确定值5、离散趋势是频数分布的另一特征,反映了观察值之间的变异情况。

★6、正态分布的特征:⑴ 正态曲线在横轴上方均数处最高;并以均数为中心,左右对称;两端与横轴永不相交,呈钟形的曲线。

⑵ 正态分布有两个参数,即位置参数μ和形状参数σ;σ固定不变时,μ越大,曲线沿横轴越向右移动;μ固定不变时,σ越大,曲线越平阔。

⑶ 正态曲线下面积的分布有一定的规律:①正态曲线与横轴之间的面积恒等于1或100%;②对称分布,对称轴两侧的面积各为50%;③在(μ-σ,μ+σ)区间的面积为%;在(μσ,μ+σ)区间的面积为%;在(μσ,μ+σ)区间的面积为%7、医学参考值范围:离散趋势指标 意义 应用 极差 四分位数间距 方差和标准差 变异系数 反映一组数据的变异范围 反映全部观察值居中一半的范围 反映全部观察值之间的变异程度 标准差相对于均数的大小资料不限资料不限适用于对称分布,尤正态适用于单位不同或均数差别较大的变量之间的比较⑴正态分布法:适用于正态或近似正态分布的资料双侧界值: 单侧界值: 常用z 值表⑵ 百分位数法:偏态分布资料以及资料中一端或两端无确切数值双侧界值:~单侧界值:上界为:P 95下界为:P 5第五章 定性资料的统计描述1、常用相对数:参考值范围(%) 单侧 双侧8090★95 ★ ★99/2x z Sα±x z S α+x z Sα-⑴率是指某现象实际发生数与可能发生某现象总数之比,用以说明某现象发生的频率或强度。

常以百分率,千分率,万分率,十万分率等表示。

⑵构成比是事物内部某一观察单位数与事物内部各组成部分观察单位的总数之比,说明事物内部各部分所占的比重。

常以百分数表示。

⑶相对比是两个有关的指标之比,用以描述两者的对比水平。

两个指标可以是绝对数、相对数或平均数;可以性质相同,也可以性质不同。

★2、应用相对数注意的事项:⑴计算相对数分母不宜过小;⑵不能以构成比代替率。

率反映事物发生的频率,构成比表示事物内部各组分所占的比重,二者性质不同。

各个组成部分的构成比之和应为100%,事物内部各组成部分之间呈此消彼长的关系;⑶计算合计率时,不能简单地相加求平均;⑷率的比较时应注意可比性。

3、标准化法是在一个指定的标准构成条件下进行率的对比的方法。

意义:用统一的“标准”消除资料由于内部构成不同而对所比较的总率产生的影响。

标准化法的基本思想:确定一个标准的人口年龄构成,男、女人口都按该标准的人口年龄构成,计算年龄别发病情况,最后计算出男、女的合计发病率。

4、应用标准化法应注意的问题:⑴标准化率便于比较,但不能反映实际水平;⑵比较几个标准化率时,应在采用同一标准标化的情况下进行;⑶若各组间的率出现明显交叉时,不宜采用标准化法比较,可直接比较各组的率;⑷两样本标化率的比较应作假设检验。

第六章 总体均数和总体率的估计1、抽样误差:由抽样引起的样本统计量与总体参数间的差异称抽样误差。

不可避免、可以控制。

表现:样本统计量与总体参数之间的差异样本统计量之间的差异。

产生原因:个体变异+抽样。

2、标准误:样本统计量的标准差称为标准误;样本均数的标准差称为均数的标准误。

均数的标准误表示样本均数的变异度 : 总体标准差未知时,用样本标准差代替: ★3、标准差与标准误的区别:⑴标准差表示个体差异的大小;标准误描述样本均数的变异程度,说明抽样误差的大小。

⑵标准差描述资料的频数分布状况,可用于制定医学参考值范围;而标准误用于总体均数的区间估计和假设检验。

4、t 分布的特征:⑴以0为中心,左右对称;⑵自由度ν 越小,t 值越分散,曲线越平阔,尾部越高;⑶当ν 趋于∞时, t 分布逼近标准正态分布;⑷t 分布曲线下面积为1.5、从界值表可看出:(1)自由度ν 相同时,t 界值越大其对应的P 值越小(2)概率P (或尾部面积)相等时,ν 越大,t 界值越小(3)t 值相等时,双侧概率为单侧概率的两倍(4) ν = ∞ 时,t 界值即为z 界值6、总体均数可信区间的计算:nX σσ=nS S X =z 分布法:⑴当σ已知, 服从标准正态分布 ,则总体均数的双测 可信区间为: ⑵未知但n 足够大(n >50): t 分布法:当σ未知n 较小 : 7、常用单双侧u 值α单侧 双侧8、可信区间的涵义:从总体中作随机抽样,每个样本可以算得一个可信区间。

如95%可信区间意味着做100次抽样,算得100个可信区间,平均有95个估计正确。

可信区间的两个要素:一是准确度: 反映在可信度的大小二是精密度: 反映在区间的长度第七章 假设检验★1、假设检验的基本思想:应用反证法和小概率原理,先对总体的参数或分布作出某种假设,再用适当的方法根据样本对总体提供的信息,推断此假设应当拒绝或不拒绝。

★2、假设检验的基本步骤:x z n σ=(0,1)N ()22,x x x z x z αασσ-+()22,x x x z S x z S αα-+()2,2,,x xx t S x t S αναν-+⑴建立检验假设,确定检验水准⑵选定检验方法和计算检验统计量⑶确定P 值,作出推断结论★3、Ⅰ型错误与Ⅱ型错误:Ⅰ型错误:拒绝了实际上成立的 ,犯“弃真”的错误。

其概率大小用 表示, 可取单侧亦可取双侧。

Ⅱ型错误:不拒绝了实际上不成立的H 0,犯“存伪”的错误。

其概率大小用β表示。

只取单侧,其大小一般未知,只有在已知两总体差值, 及 n 时,才能估算出来。

推断结论与两类错误 注:当样本含量固定时,α增大,β减小;反之亦然。

若欲同时减小α与β,则只有增加样本含量。

若重点减小Ⅰ型错误,α可取小一些,如α=;若重点减小Ⅱ型错误,α可取大一些,如α=或α=实际情况 检验结果拒绝H 0不拒绝H 0成立第一类错误(α) 结论正确(1-α) 不成立 结论正确(1-β) 第二类错误(β)★4、检验效能:若两总体确有差别,按照α水准能够发现这种差别的能力。

它的大小用(1-β)表示。

检验效能的影响因素:容许误差 δ、总体标准差 σ、Ⅰ型错误α、样本含量n★5、假设检验应注意的事项:⑴ 应有严密的研究设计:总体中的每个研究个体应具有同质性、样本的获取必须遵循随机化原则、比较的组间应具有可比性。

⑵ 正确理解α水准和P 值的意义:α是人为预先设定的一个概率值,可有多个 ; P 是假定 成立,得到实际观测数据的可能性的大小 ,一个样本按某一方法只能得出一个。

相关主题