《医学统计学》复习提纲第二章 统计描述公式:几何均数(1)直接法:nn X X X G ...21= 或 )lg (lg )lg ...lg lg (lg 1211nX n X X X G n ∑--=+++= (2)加权法:)lg (lg ....lg ...lg lg (lg 12122111∑∑--=++++++=f X f f f f X f X f X f G k k k中位数(median ) (1) 直接法:n 为奇数 , 2)1(+=n X M n 为偶数,)(21122++=n n X X M(2)频数表法:用于频数表资料。
∑-+=)2(L Mf nf i L M 标准差(standard deviation ):nX ∑-=2)(μσ 1)(2--=∑n X X S离均差平方和2)(∑-X X 常用SS 或l XX 表示。
∑∑∑-=-==NX X X X l SS XX 222)()(直接法: 1)(22--=∑∑n n X X S 加权法:1)(22--=∑∑∑∑f f fX fX S 1. 常用的相对数指标有哪些?它们的意义和计算上有何不同? 2. 为什么不能以构成比代率?请联系实际加以说明。
率和构成比所说明的问题不同,绝不能以构成比代率。
构成比只能说明各组成部分的比重或分布,而不能说明某现象发生的频率或强度。
例如:以男性各年龄组高血压分布为例,50~60岁年龄组的高血压病例占52.24%,所占比重最大,60~岁组则只占到6.74%。
这是因为60~岁以上受检人数少,造成患病数低于50~60岁组,因而构成比相对较低。
但不能认为年龄在50~60岁组的高血压患病率最严重,而60岁以上反而有所减轻。
若要比较高血压的患病率,应该计算患病率指标。
3. 应用相对数时应注意哪些问题?4.简述医学中参考值范围的涵义及制定参考值范围的一般步骤。
医学中常把绝大多数正常人的某指标范围称为该指标的参考值范围,也叫正常值范围。
所谓“正常人”不是指完全健康的人,而是指排除了所研究指标的疾病和有关因素的同质人群。
制定参考值范围的一般步骤: (1)定义“正常人”,不同的指标“正常人”的定义也不同。
(2)选定足够数量的正常人作为研究对象。
(3)用统一和准确的方法测定相应的指标。
(4)根据不同的用途选定适当的百分界限,常用95%。
(5)根据此指标的实际意义,决定用单侧范围还是双侧范围。
(6)根据此指标的分布决定计算方法,常用的计算方法:正态分布法、百分位数法。
5.正态分布、标准正态分布与对数正态分布的联系与区别。
三种分布均为连续型随机变量的分布。
正态分布、标准正态分布均为对称分布,对数正态分布是不对称的,其峰值偏在左边。
标准正态分布是一种特殊的正态分布(均数为0,标准差为1)。
一般正态分布变量经标准化转换后的新变量服从标准正态分布。
对数正态分布不属于正态分布的范畴,对数正态分布变量经对数转换后的新变量服从正态分布。
6.对称分布在“X ± 1.96S 标准差”的范围内,也包括95%的观察值吗?不一定。
均数±1.96标准差范围内包含95%的变量值是正态分布的分布规律,不是对称分布的规律。
对称分布不一定是正态分布。
7.集中趋势的描述有哪些指标?各指标的具体应用条件? 8.离散程度的描述有哪些指标?各指标的具体应用条件/ 9.正态分布的特征有哪些?10.正态分布下面积有哪些分布规律? 11.正态分布有哪些应用?12.简述标准化的目的和基本思想;标准化率有哪些计算方法/ 13.简述频数分布表的编制方法及其主要应用。
14.中位数与百分位数在符号,意义,计算和应用有何区别和联系? 15.试比较标准差和变异系数在描述变异程度时的优势。
第三章 抽样分布与参数估计 公式1.均数标准误的计算公式:n x /σσ= 均数标准误的估计值(x s )n s s x /=2. t =xs x μ- 3.总体均数的估计1.σ已知时 总体均数μ的95%可信区间为(x x x x σσ96.1,96.1+-) 2.σ未知,但n 足够大(如n >100)时 总体均数μ的95%可信区间为(x s x 96.1-,x s x 96.1+)3.σ未知且n 小时 某自由度的t 曲线下有95%的t 值在±υ,05.0t 之间, 总体均数μ的95%可信区间为 (x s t x υ,05.0-,x s t x υ,05.0+)4. 二项分布概率公式:Xn X X n X P --⎪⎪⎭⎫⎝⎛=)1()(ππ 在二项分布资料中,当π和n 已知时, 均数μ: μ=nπ μp =π,标准差σ: σ=)1(ππ-n σp =n)1(ππ-当π未知时,常用样本率p 作为π的估计值,式σp =n)1(ππ-变为: s p =np p )1(-总体率的区间估计 (一)查表法当样本含量n 较小,如n ≤50,特别是p 很接近于0或1时 (二)正态近似法当样本含量n 足够大,且样本率p 或1-p 均不太小,如np 与n (1-p )均大于5时, p s u p 2(α-,)2p s u p α+。
5. Poisson 分布的概率函数!)(X eX P Xμμ-= X=1,2,3…μ-=e P )0( 1)()1(+=+X X P X P μ问答题:1.服从二项分布及Poisson 分布的条件分别是什么?二者有哪些性质?二项分布成立的条件:①每次试验只能是互斥的两个结果之一;②每次试验的条件不变;③各次试验独立。
Poisson 分布成立的条件:①平稳性:X 的取值与观察单位的位置无关,只与观察单位的大小有关;②独立增量性:在某个观察单位上X 的取值与前面各观察单位上X 的取值无关;③普通性:在充分小的观察单位上X 的取值最多为1。
2.二项分布、Poisson 分布分别在何种条件下近似正态分布?二项分布的正态近似:当n 较大,π不接近0也不接近1时,二项分布B (n ,π)近似正态分布N (n π, )1(ππ-n )。
Poisson 分布的正态近似:Poisson 分布P (μ),当μ相当大时(≥20),其分布近似于正态分布。
3.在何种情况下,可以用率的标准误S p 描述率的抽样误差?当率P 所来自的样本近似服从正态分布时,即n 较大,P 不接近0也不接近1时,可以用率的标准误S p描述率的抽样误差。
4. 中心极限定理的内容?(样本均数的抽样分布有哪些特点?)5.t 分布的特征?如何进行总体均数的估计?6.标准差和标准误的区别?7.总体均数的可信区间与医学参考值范围的区别? 第四章 数值变量资料的假设检验 公式:1.单样本检验nsx t 0μ-=1-=n ν如果样本含量足够大时,可将样本均数转化为u 值nsx u 0μ-=2.配对t 检验 ns d t d=1-=n ν3.两样本检验 2121x x s x x t --=221-+=n n v 21x x s -为两样本均数差值的标准误,可用下式计算⎪⎪⎭⎫ ⎝⎛+-+-+-=-2121222211112)1()1(21n n n n s n s n s x x如果样本含量足够大时,可计算u 统计量22212121n sn s x x u +-=如果方差不齐,可以考虑用t '检验。
两样本的方差是否齐同,可对样本的方差做方差齐性检验22小大s s F =111-=n v , 122-=n v问答题; 1. t 检验适用于?t 检验的应用条件?t 检验有哪几种类型?各自的意义和目的及应用条件? 2. u 检验的应用条件?分哪几种类型? 3. Ⅰ型错误和Ⅱ型错误的区别和联系? 4. 假设检验应注意哪些事项? 5. 简述假设检验的原理及基本步骤? 6. 两样本均数比较t 检验,P 值的意义? 7. 简述假设检验与区间估计的联系?8.假设检验时,当P ≤α, 则拒绝0H ,其理论依据是什么?(假设检验时,当P ≤0.05,则拒绝H 0,理论依据是什么?)答:P 值系由H 0所规定的总体做随机抽样,获得等于及大于(或等于及小于)依据现有样本信息所计算得的检验统计量的概率。
当P ≤0.05时,说明在H 0成立的条件下,得到现有检验结果的概率小于α,因为小概率事件几乎不可能在一次试验中发生,所以拒绝H 0。
同时,下“有差别”的结论的同时,我们能够知道可能犯错误的概率不会大于α,也就是说,有了概率保证。
9. 如何合理设置检验水准?设置检验水准应根据研究目的,结合专业知识和研究设计要求,在末获得样本信息之前决定,而不应受到样本结果的影响。
10. 以t 检验为例,说明检验水准α和P 的区别? 以t 检验为例,α和P 都是用t 分布尾部面积大小表示,所不同的是:α表示I 型错误的概率,即H 0为真而被错误地拒绝的概率值。
α是在统计分析时,根据I 型错误危害的大小,预先规定的,即规定统计结果为“接受 H 1” 时的误判率的界限值为α(即检验水准)。
P 值是由实际样本得出的统计结果为“接受 H 1” 时误判率。
根据P 与α的大小关系作出“不拒绝H 0”或“拒绝H 0”的统计推断。
11. 配对资料有哪几种情形?请举例说明。
12.简述可信区间在假设检验问题中的作用。
[评析]可信区间不仅能回答差别有无统计学意义,而且还能提示差别有无实际意义。
可信区间只能在预先规定的概率即检验水准α的前提下进行计算,而假设检验能够获得一较为确切的概率P 值。
故将二者结合起来,才是对假设检验问题的完整分析。
第五章 方差分析公式:1.方差分析的计算方法1)总离均差平方和(sum of squares,SS )及自由度(freedom,ν)∑∑==∑-∑=-=ki n j ij iN x x x x SS 11222)()(总 总ν=N -12)组间离均差平方和、自由度和均方∑=-=k i i i x x n SS 12)(组间 Nx n x SS ki in j ij i2121)()(∑-=∑∑==组间 1-=k 组间ν 组间组间组间νSS MS =3)组内离均差平方和、自由度和均方组间总组内SS SS SS -= k N -=组内ν 组内组内组内νSS MS =4)三种变异的关系:211112)]()[()(x x x x x x SS i i k i n j ij k i n j ij ii-+-=-=∑∑∑∑====总组内组间ss ss x x x x n i k i n j ij i ki i i+=-+-=∑∑∑===21121)()(总ν= N -1= (k -1)+(N -k ) =组内组间+νν2. Newman-Keuls 检验(q 检验)BA x x BA s x x q --=nMS s B A x x 组内=- (n A =n B =n )否则)11(2BA x x n n MS sB A +=-组内 1. t 检验和方差分析的应用条件与用途?t 检验和方差分析均要求各样本来自相互独立的正态总体且各总体方差齐。