当前位置:文档之家› 卫生统计学最好的复习资料

卫生统计学最好的复习资料

一、名词解释1. 计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data )。

计量资料亦称定量资料、测量资料。

.其变量值是定量的,表现为数值大小,一般有度量衡单位。

2. 计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data )。

计数资料亦称定性资料或分类资料。

其观察值是定性的,表现为互不相容的类别或属性。

3. 等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data )。

等级资料又称有序变量。

4. 总体:总体(population )指特定研究对象中所有观察单位的测量值。

5. 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample )。

6. 抽样误差:抽样误差(sampling error )是指样本统计量与总体参数的差别。

在总体确定的情况下,总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。

7. 频数表:用来表示一批数据各观察值在不同取值区间出现的频繁程度(频数)。

8. 算术均数:描述一组数据在数量上的平均水平。

总体均数用μ表示,样本均数用X 表示。

9. 中位数:将一组观察值由小到大排列,位次居中的那个数。

10. 极差:亦称全距,即最大值与最小值之差,用于资料的粗略分析,其计算简便但稳定性较差。

11. 方差:方差表示一组数据的平均离散情况,由离均差的平方和除以样本个数得到。

12. 标准差:是方差的正平方根,使用的量纲与原量纲相同,适用于近似正态分布的资料,大样本、小样本均可,最为常用。

13. 变异系数:用于观察指标单位不同或均数相差较大时两组资料变异程度的比较。

14. 正态分布:若资料X 的频率曲线对应于数学上的正态曲线,则称该资料服从正态分布。

通常用记号),(2σμN 表示均数为μ,标准差为σ的正态分布。

15. 标准正态分布:均数为0、标准差为1的正态分布被称为标准正态分布,通常记为2(0,1)N 。

16. 统计推断:通过样本指标来说明总体特征,这种通过样本获取有关总体信息的过程称为统计推断。

17. 抽样误差:由个体变异产生的,由于抽样造成的样本统计量与总体参数的差异,称为抽样误差。

18. 标准误:通常将样本统计量的标准差称为标准误。

19. 可信区间:按预先给定的概率确定的包含未知总体参数的可能范围。

20. 参数估计:指用样本统计量估计总体参数。

参数估计有两种方法:点估计和区间估计。

21. 假设检验中P 的含义:指从H 0规定的总体随机抽得等于及大于(或等于及小于)现有样本获得的检验统计量值的概率。

22. I 型和II 型错误:I 型错误指拒绝了实际上成立的H 0,这类“弃真”的错误称为I 型错误,其概率大小用α表示;II 型错误,指接受了实际上不成立的H 0,这类“存伪”的错误称为II 型错误,其概率大小用β表示。

23. 检验效能:1-β称为检验效能,它是指当两总体确有差别,按规定的检验水准α所能发现该差异的能力。

24. 检验水准:是预先规定的,当假设检验结果拒绝H 0,接受H 1,下“有差别”的结论时犯错误的概率称为检验水准,记为α。

25. 方差分析:就是根据资料的设计类型,即变异的不同来源将全部观察值总的离均差平方和与自由度分解为两个或多个部分,除随机误差外,其余每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释。

通过各变异来源的均方与误差均方比值的大小,借助F 分布作出统计推断,判断各因素对观测指标有无影响。

26. 随机区组设计:事先将全部受试对象按自然属性分为若干区组,原则是各区组内的受试对象的特征相同或相近,且受试对象数与处理因素的水平数相等。

然后再将每个区组内的观察对象随机地分配到各处理组,这种设计叫做随机区组设计。

27. 相对数:是两个有联系的指标之比,是分类变量常用的描述性统计指标,常用相对数有率、构成比、相对比。

28. 标准化法是常用于内部构成不同的两个或多个总率比较的一种方法。

标准化法的基本思想就是选定一个统一“标准”(标准人口构成比或标准人口数),然后按选定“标准”计算调整率,使之具备可比性以后再比较,以消除由于内部构成不同对总率比较带来的影响。

29. 二项分布:若一个随机变量X ,它的可能取值是0,1,…,n ,且相应的取值概率为k n k n k k X P --==)1()()(ππ, 则称此随机变量X 服从以n 、π为参数的二项分布。

30. Yates 校正:英国统计学家Yates F 认为,由于2χ分布理论上是一连续性分布,而分类资料是间断性的,由此计算出的2χ值不连续,尤其是自由度为1的四格表,求出的概率P 值可能偏小,此时需对2χ值作连续性校正(correction of continuity ),这一校正即所谓的Yates 校正(Yates ’correction )。

31. 非参数统计:针对某些资料的总体分布难以用某种函数式来表达,或者资料的总体分布的函数式是未知的,只知道总体分布是连续型的或离散型的,用于解决这类问题需要一种不依赖总体分布的具体形式的统计分析方法。

由于这类方法不受总体参数的限制,故称非参数统计法(non-parametric statistics ),或称为不拘分布(distribution-freestatistics )的统计分析方法,又称为无分布型式假定(assumption freestatistics )的统计分析方法。

32. 直线回归:建立一个描述应变量依自变量变化而变化的直线方程,并要求各点与该直线纵向距离的平方和为最小。

直线回归是回归分析中最基本、最简单的一种,故又称简单回归。

33. 直线相关:是用来描述具有直线关系的两变量x 、y 间的相互关系。

34. 相关系数:又称积差相关系数,以符号r 表示样本相关系数,ρ表示总体相关系数。

它是说明具有直线关系的两个变量间,相关关系的密切程度与相关方向的指标。

35. 回归系数: 为直线的斜率,其统计学意义是自变量x 改变一个单位时,应变量y 平均变化b 个单位。

36. 人口总数:人口总数(population)是指一个国家或地区在某特定时间点上存活人口的总和。

国际上统计人口数有两种办法:① 实际制(de facto):即只统计标准时刻某地实际存在的人口数(包括临时在该地的人)。

② 法定制(de jure):只统计某地的常住人口。

37. 老年人口系数:是指65岁及以上老年人口数占总人口数的比重。

65100%=⨯岁及以上的人口数老年人口系数人口总数。

老年人口系数用于表明一个国家或地区的人口老龄化程度,其大小受社会经济发展水平、生活水平、卫生保健水平等因素的影响。

38. 围产儿死亡率:围产期是指胎儿体重达到1000克及以上、或孕期满28周,至出生后7天以内的时期。

在此期间的死亡称为围产儿死亡。

计算式为:%产数+活产数某年围产期死胎数+死天内的新生儿死亡数产数+出生同年围产期死胎数+死围产儿死亡率=10007⨯ 。

围产儿死亡率是衡量孕期、产前、产后保健工作质量的敏感指标,它不能从出生报告及死亡报告直接计算,需要利用妇产科病例资料分析计算。

39. 新生儿死亡率:新生儿死亡率(neonatal mortality rate, NMR) 指某地平均每千名活产数中未满28天的新生儿死亡数。

计算式:100028⨯=某年活产总数天的新生儿死亡数同年未满新生儿死亡率‰新生儿死亡在婴儿死亡中占很大的比重。

死亡主要原因是早产、先天发育不良、畸形、分娩外伤、破伤风等难于控制的疾病。

40. 婴儿死亡率:指某年平均每千名活产中不满1周岁(婴儿)的死亡数。

计算式为:10001⨯=某年活产总数岁婴儿死亡数同年未满婴儿死亡率‰ 41. 孕产妇死亡率:指某年由于怀孕和分娩及并发症造成的孕产妇死亡人数与同年出生活产数之比,常以万分率或十万分率表示,计算式为:1000010=⨯同年孕产妇死亡数孕产妇死亡率(或万)某年活产数42. 死因顺位:指按各类死因构成比从高到低排列的位次,说明死因的重要性,反映了各种死亡原因导致死亡的严重程度。

43. 人口金字塔:将人口的性别、年龄分组数据,以年龄(或出生年份)为纵轴,以人口数或年龄构成比为横轴,按男左女右绘制的直方图,其形态如金字塔,故称为人口金字塔。

人口金字塔是对人口年龄、性别构成综合反映的特殊统计图,指示了不同时期人口年龄、性别构成的变化情况,是长期人口出生、死亡、迁入、迁出而形成的,反映了历史的痕迹和变动的趋势。

44.灵敏度:是诊断试验将实际有病的人正确诊断为病人的百分率。

45.特异度:是诊断试验将实际无病的人正确诊断为非病人的百分率。

46.误诊率:是诊断试验将实际无病的人错误诊断为病人的百分率。

47.漏诊率:是诊断试验将实际有病的人错误诊断为非病人的百分率。

48.阳性似然比:是诊断试验中灵敏度与误诊率的比值,即正确判定病人的概率是错判病人概率的倍数,它反映诊断试验判断正确的概率程度。

LR+的取值范围为(0,∞),其值越大则该试验确诊疾病能力越强。

49.阴性似然比:是诊断试验中漏诊率与特异度的比值,即错判非病人的概率是正确判定非病人概率的倍数,它反映诊断试验判断错误的概率程度,LR-的取值范围为(0,∞),其值越小则该试验排除疾病的能力越好。

50.Youden指数:是诊断试验中灵敏度和特异度之和减去基数(1或100%),表示诊断试验发现真正的患者和非患者的总的能力。

Youden指数的取值范围在(-1,1)之间,其值越接近1,诊断价值越大。

51.ROC曲线:即受试者工作特征曲线,是确定临界点较为理想的一种方法。

它是以不同临界点的同一种试验连续(至少5组)测定的灵敏度为纵坐标,1-特异度(误诊率)为横坐标,标出各工作点,然后将得到的多个工作点连接绘制而成的曲线,统计图:是将统计指标用几何图形表达,即以点的位置、线段的升降、直条的长短或面积的大小等形式直观的表示事物间的数量关系。

1.连续性资料1.1 两组独立样本比较1.1.1 资料符合正态分布,且两组方差齐性,直接采用t检验。

1.1.2 资料不符合正态分布,(1)可进行数据转换,如对数转换等,使之服从正态分布,然后对转换后的数据采用t检验;(2)采用非参数检验,如Wilcoxon检验。

1.1.3 资料方差不齐,(1)采用Satterthwate 的t’检验;(2)采用非参数检验,如Wilcoxon检验。

1.2 两组配对样本的比较1.2.1 两组差值服从正态分布,采用配对t检验。

1.2.2 两组差值不服从正态分布,采用wilcoxon的符号配对秩和检验。

1.3 多组完全随机样本比较1.3.1资料符合正态分布,且各组方差齐性,直接采用完全随机的方差分析。

相关主题