第一章绪论1.卫生统计学的概念P1卫生统计学是应用概率论和数理统计学的基本原理和方法,研究居民卫生情况以及卫生服务领域中数据的收集、整理和分析的一门科学。
2.卫生(医学)统计学的主要步骤P3设计;收集资料;整理资料;分析资料3.(选择、判断)卫生统计学的基本概念P4同质(homogeneity):统计学中,若某些观察对象具有相同的特征或属性,称之为同质或具有同质性。
变异(variation):将同质个体的某项特征或属性的观察值或测量值之间的差异称为变异。
总体(population):是根据研究目的确定的的所有观察单位某种特征或属性的观察值或测量值的集合。
样本(sample):是从总体中随机抽取的具有代表性的部分观察单位的集合。
样本中包含的观察单位个数称为样本含量。
参数(parameter):反映总体特征的指标称为参数,一般是未知的,常用希腊字母表示。
统计量(statistic):根据样本观察值计算出来的指标称为统计量,常用拉丁字母表示。
变量(variable):每个观察单位的某项特征或属性称为变量。
抽样研究(sampling research):从总体中随机抽取样本,通过样本信息推断总体特征的研究方法称为抽样研究。
抽样误差(sampling error):由随机抽样造成的样本统计量与总体参数之间、样本统计量之间的差异称为抽样误差。
资料(data):变量值的集合称之为资料。
★4.资料的分类P4(1)定量资料:亦称计量资料,其变量值是定量的,表现为数值大小,一般有度、量、衡单位。
(2)定性资料:亦称分类资料,其观察值是定性的,表现为互不相容的类别或属性,一般无度、量、衡单位。
可进一步细分为两种资料:1)计数资料:指将观察单位按某种类别或属性进行分组,清点各组观察单位数所得的资料。
包括:①二项分类资料;②无序多项分类资料2)等级资料:亦称有序多分类资料,是将观察单位按某特征或属性的程度或等级顺序分组,清点各组观察单位数所得的资料。
第二章调查研究设计1.调查研究的特点P7(1)不能人为施加干预措施(与实验研究主要的区别)(2)不能随机分组(3)很难控制干扰因素(4)一般不能下因果结论2.常用的抽样方法P9~11基本方法:单纯随机抽样;系统抽样;分层抽样(抽样误差最小);整群抽样(最大)。
综合应用:多阶段抽样。
第三章实验设计1.实验设计的基本要素(三个)处理因素;受试对象;实验效应2.实验设计的基本原则(四点)对照;随机化;重复;均衡3.常用的实验设计方案(1)完全随机设计——又称随机对照试验,采用完全随机化分组方法将同质的实验单位分配到各处理组,各处理组分别接收不同的处理。
优缺点:设计简单,易于实施,出现缺失值时仍可统计分析;小样本时,均衡性可能较差,抽样误差较大。
(2)配对设计——是将实验单位按一定条件配成对子,再将每对中的两个实验单位随机分配到不同处理组。
优缺点:抽样误差较小、实验效率较高,所需样本含量较小;当配对条件未能严格控制造成配对失败或欠佳时,会降低效率。
(3)随机区组设计——又称为配伍设计,是配对设计的扩大。
是将几个条件相同的受试对象划成一个区组,将区组中的受试对象采用随机的方法,分配到不同的对比组中,接受不同的处理。
优点:每个区组内的实验单位具有较好的同质性,比完全随机设计减少了随机误差,因而更易发现处理组间的差别,提高了实验效率。
缺点:要求区组内实验单位数与处理组数相等,实验结果中若有数据缺失,统计分析较为麻烦。
第四章定量资料的统计描述一、集中趋势的描述1.算术均数——又称均数(mean),是用一组观察值相加除以观察值的个数所得。
样本均数x,总体均数用µ 。
用应用:适用于对称分布特别是正态分布资料。
2.几何均数——是n个观察值乘积的n次方根,又称倍数均数,用G表示。
应用:适用于①对数正态分布;②等比级数资料。
观察值中不能有03.中位数——将一组观察值由小到大排序后,居于中间位置的数值即为中位数,用M表示。
中位数的计算:★频数表法——用于频数表资料4.百分位数——是指将一组观察值由小到大排序后,将其平均分成100等份,对应于每一分割位置上的数值就称为一个百分位数,用xP 表示 。
5.中位数与百分位数的应用 P55 中 位 数: ①偏态分布资料②一端或两端无确切值 ③总体分布不明 百分位数:非正态分布资料★二、离散趋势的描述 详见P55~58★掌握以上四个指标的意义和应用。
二、正态分布及其应用P59~601.正态分布的概念及各个字母的含义★2.正态分布的分布特征及规律详见P59分布特征:(1)正态曲线——在横轴上方均数处最高;并以均数为中心,左右对称;两端与横轴永不相交,呈钟形的曲线。
(2)正态分布有两个参数,即位置参数μ和形状参数σ(3)正态曲线下面积的分布有一定的规律:3.统计学家发现,可以使所有的正态分布转化为统一的μ=,1σ=的正态分布,该正态分布称为标准正态分布。
这种变换称为标准化变换或Z变换。
若X服从正态分布(),Nμσ,则Z就服从()0,1N。
第五章定性资料的统计描述一、常用相对数及其应用1.率——指某现象实际发生数与可能发生某现象总数之比,说明某种现象发生的频率或强度,又称频率指标。
2.构成比——是事物内部某一观察单位数与事物内部各组成部分观察单位的总数之比,说明事物内部各部分所占的比重。
常以百分数表示。
%100⨯=观察单位总数同一事物各组成部分的数某一组成部分观察单位构成比3.相对比——相对比是两个有关的指标之比,用以描述两者的对比水平。
两个指标可以是绝对数、相对数或平均数;可以性质相同,也可以性质不同。
%)100(⨯=或乙指标甲指标相对比二、应用相对数需注意的问题(4个)1.计算相对数分母不宜过小2.不能以构成比代替率3.计算合计率时,不能简单地相加求平均 4率的比较时应注意可比性三、率的标准化P72标准化法——是在一个指定的标准构成条件下进行率的对比的方法。
意义:用统一的“标准”消除资料由于内部构成不同而对所比较的总率产生的影响。
当两组定性资料的内部构成明显不同时,不宜直接比较两组的总率(即平均率),否则有时会出现局部结果与整体结果相矛盾的现象。
当统一标准后再进行计算,这种矛盾的现象便会消失---所采用的方法即标准化法。
第六章 总体均数和总体率的估计1.抽样误差:由抽样引起的样本统计量与总体参数间的差异称抽样误差。
不可避免、可以控制。
2.标准误:样本均数的标准差称为均数的标准误,简称标准误。
P78 均数的标准误表示样本均数的变异度n X σσ=总体标准差未知时,用样本标准差代替n S S X =用途:①衡量样本均数的可靠性;②估计总体均数的可信区间;③用于均数的假设检验。
★标准差与标准误的区别 P79(1)意义不同:标准差表示个体差异的大小;标准误描述样本均数的变异程度,说明抽样误差的大小。
(2)用途不同:标准差描述资料的频数分布情况,可用于制定医学参考值范围;而标准误用于总体均数的区间估计和假设检验。
(3)公式不同:标准差:S =;标准误:nSS X =3. t 分布 P80~81概念:从正态总体N(μ,σ2)中进行无数次样本含量为n 的随机抽样,每次均可得到一个X和一个s ,通过公式:XS -X =t μ转换,可得无数个t 值,t 值的分布即为t 分布。
特征:①以0为中心,左右对称;②t 分布是一簇曲线,形状与自由度v 有关; ③当ν趋于∞时, t 分布逼近标准正态分布; ④t 分布曲线下面积为1。
4. 总体均数的估计点估计——用样本均数估计总体均数。
区间估计——按一定的概率(可信度,1 -α)估计总体均数所在范围亦称总体均数的可信区间。
5. (选择、判断)95%可信区间的涵义 P82~83 95%可信区间意味着做100次抽样,算得100个可信区间,平均有95个区间(或95%的把握、95%的可能性)估计正确。
★思考题(1)标准差与标准误有什么区别与联系? 区别:详见前面知识点联系:n X σσ=或n S S X =标准误的大小与标准差成正比,与根号n 成反比。
(2)可信区间与正常值范围有什么不同?①意义不同:可信区间是按一定的概率(可信度,1 -α)估计总体均数所在范围;正常值范围则是指绝大多数“正常人”的解剖、生理、生化等指标的波动范围。
②公式不同 ③用途不同:可信区间用于估计总体均数;正常值范围用于判断观察对象的某项指标正常与否。
第七章 假设检验1.假设检验的描述解析: 假设0μμ=,即认为的差别是由抽样误差造成的,则可用公式计算t 值。
根据t 值确定 P 值的大小,并作出推断。
P 小于或等于预先规定的概率值 α(如0.05),则为小概率事件,即在一次抽样中发生的可能性很小,如果它发生了,则怀疑原假设0μμ=可能不成立,故认为其对立面0μμ≠ 成立。
2.假设检验的基本思想应用反证法和小概率事件的原理,先对总体的参数或分布作出某种假设,在H 0成立的条件下,再用适当的方法(如 t 检验)根据样本对总体提供的信息,推断此假设应当拒绝或不拒绝。
3.假设检验的基本步骤 详见P91~92/PPT 格式要规范,注意下结论的用词!★4.Ⅰ型错误与Ⅱ型错误 P92~93Ⅰ型错误——拒绝了实际上成立的H 0,犯“弃真”的错误。
其概率大小用 α 表示, α 可取单侧亦可取双侧。
Ⅱ型错误——不拒绝了实际上不成立的H 0,犯“存伪”的错误。
其概率大小用β表示。
β只取单侧,其大小一般未知,只有在已知两总体差值δ,α 及 n 时,才能估算出来。
推断结论时可能出现的四种情况:5.单侧检验与双侧检验 P95误用单侧检验会易犯Ⅰ型错误;误用双侧检验会易犯Ⅱ型错误。
对于同一资料,凡双侧检验P ≤α,单侧检验必P<α ;凡单侧检验P>α,双侧检验必 P>α。
★6.假设检验应注意的事项 P96 (1)应有严密的研究设计(2)正确理解α水准和P 值的意义 (3)正确理解结论的统计学意义 (4)假设检验的结论不能绝对化第八章 t 检验概念:t 检验是一种以 t 分布为基础,以 t 值为检验统计量的计量资料的检验方法。
★ t 检验的适用条件(4个) (1)总体方差σ未知;(2)样本含量n 较小(n<60); (3)样本来自正态总体;(4)两样本所来自的总体方差齐,即2221σσ=(注意:t 检验都是针对总体下结论的!)应用:1.样本与总体均数的比较nS x t /0μ-=1n ν-=2.配对设计均数的比较n S d S 0d t d d /=-= 1n ν-=3.两样本均数的比较)11(-21221n n S x x t c +=1n ν-=★课本P100~106,掌握案例8-1、8-2、8-3、8-7的资料分析和检验步骤。