当前位置:文档之家› 医学统计学第六版1-11章

医学统计学第六版1-11章

1、★医学统计学工作基本步骤:统计设计;收集资料.;整理资料;分析资料2、★统计分析包括:统计描述、统计推断,统计推断包括参数估计和假设检验。

★常见的统计资料的类型有:定量数据(计量资料);定性数据(计数资料);有序数据(等级资料)3、频数分布的两个重要特征:集中趋势和离散趋势4、正态分布的两个参数:均数;标准差。

μ=0、δ =1的正态分布即为标准正态分布。

5、当 μ和 δ 未知时,可以利用样本均数x 拔 和标准差S 计算z6、对服从 的任意随机变量X ,都可经z 变换转化成标准正态分布,7、正态性判定的方法有两类:一是图示法,二是计算法。

7、★频数表的用途:揭示计量资料的分布类型;揭示计量资料的分布特征;便于发现特大值和特小值;便于进一步进行统计分析8、描述定性资料的数据特征,通常需要计算相对数。

根据不同的研究目的,常用率、构成比、相对比(例数之比;相对危险度RR;比数比OR )等指标来进行统计描述。

9、比较两个不同人群的患病率、发病率、死亡率等资料时,为消除其内部构成(如年龄、性别、工龄、病程长短、病情轻重等)对率的影响,可以使用标准化率。

10、从外形上看,统计表可由标题、标目(包括横标目、纵标目)、线条、数字和备注5部分构成。

11、统计图通常由标题、图域、标目、图例和刻度5个部分组成。

12、统计表的编制原则和结构:重点突出,简单明了;主谓分明,层次清楚;数据表达规范、文字和线条尽量从简。

13、描述定量数据的统计图有直方图、线图、箱式图、误差条图和散点图。

14、描述定性数据的统计图有直条图和构成图(圆图和百分条图)。

15、样本均数标准误的估计值,计算公式为:16、样本率的标准差也称为率的标准误,用来描述样本率抽样误差的大小。

率的标准误越小,则率的抽样误差越小。

17、参数估计包括点估计和区间估计。

18、可信区间估计的效果由可信度1-α和区间的宽度来反映,有可信度计算出来的总体均数μ的概率越接近1越好,区间越窄估计越精确。

19、总体均数的区间估计:(1)δ已知:变量X 服从标准正态分布,95%的z 值在-1.96和1.96之间,则得到95%的可信区间是:(2)δ未知:这时可以用其估计量S 代替,但z 值已不再服从标准正态分布,而是服从著名的t 分布。

计算:小样本情况下,只要原始变量服从正态分布即可用:大样本(n>=50),无论变量是否服从正态分布将上式的t..改为z α/220、假设检验中,包括原假设H 0 和备择假设H 1 两种假设。

21、假设检验的基本步骤:建立假设和确定检验水准、选择检验方法和计算检验统计量和根据P 值做出统计推断。

22、两样本方差齐性检验:在正态分布情况下,检验统计量F 值按下列公式计算 ν1=n 1-1, ν2= n 2-1 若F > =F α/2(ν1,ν2)则P<=α,拒绝H0,接受H1,可认为两总体方差不齐。

23、采用t ’检验,主要有Satterthwaite 法近似t 检验、Welch 法近似t 检验和Cochran & Cox 法近似t 检验。

其中Cochran & Cox 法是对临界值校正 ;而Satterthwaite 法和Welch 法是对自由度进行校正。

24、I 类错误(假阳性错误,α)是指当H 0为真时,假设检验结论拒绝H 0,接受H 1;II 类错误(假阴性错误,β)是指当H 0不成立的时候,假设检验不拒绝H 0.25、U 检验的应用条件是:①大样本(如n>50);②小样本,σ已知且样本来自正态总体。

26、多个样本率间多重比较有X 2分割法、可信区间法和Bonferroni 方法,应用这些方法能够保证假设检验中I 型错误的概率α不变。

27、非参数检验方法有多种,如配对比较的Wilcoxon 符号秩和检验、两组比较的Wilcoxon 秩和检验 、多组比较的Kruskal-Wallis 秩和检验等,其中最常用的是Wilcoxon 秩和检验。

28、两个变量之间存在的线性相关关系称为线性相关或简单相关,用于分析双变量正态分布资料。

计算公式为X Xz S -=),(2σμN ()z X μσ=-)96.1 ,96.1(X X X X σσ+-). .()(2/)(2/X X S t X S t X νανα+,-2122()()S F S =较大较小22XY XX YY l (X X )(Y Y )r l l (X X )(Y Y )∑∑∑--==--X 2检验的通用的基本公式为: (n>=40且T>=5) ,v=(行数-1)(列数-1) 理论频数计算公式: ( i 行j 列) 四格表资料X 2检验的专用公式:(n>=40且T>=5)a b c d四格表资料X 2检验的校正公式:(n>=40,1=<T<5)四格表资料的Fisher 确切概率法:(n<40或T<1)Pi=[(a+b )!(c+d )!(a+c )!(b+d )!]/(a !b !c !d !)配对四格表的X 2检验公式: R*C 表X 2检验公式:多样本率之间多重比较重新设定检验水准α’:(k 实验组或样本率的个数)1、多个实验组之间两两比较:α’=2α/[k(k-1)]2、实验组与同一个对照组的比较:α’=α/(k-1)使用步骤:1)两个样本率或实验组1、建立检验假设并确定检验水准H0:π1=π2,即两XXX 的有效率/总体xx 率/xx 率相等H1:π1≠π2,即两XXX 的有效率/总体xx 率/xx 率不相等α=0.052、计算检验统计量X 2=? v=?3、确定P 值,做出推断结论。

根据v 值,查X 2界值表得X 2(v,α),X 2>X 2(v,α),P<0.05,在α=0.05的检验水准下,拒绝H0,可以认为两XXX 的有效率/总体xx 率/xx 率不相等。

若X 2<X 2(v,α),P>0.05,在α=0.05的检验水准下,不拒绝H0,尚不可以认为两XXX 的有效率/总体xx 率/xx 率不相等。

2)三个样本率或构成比等(1)1、建立检验假设并确定检验水准H0: 不同XXX 的有效率/总体xx 率/xx 率/构成比相等H1:不同XXX 的有效率/总体xx 率/xx 率/构成比不相等α=0.052、计算检验统计量X 2=? v=?3、确定P 值,做出推断结论。

根据v 值,查X 2界值表得X 2(v,α),X 2>X 2(v,α),P<0.05,在α=0.05的检验水准下,拒绝H0,可以认为两XXX 的有效率/总体xx 率/xx 率不相等。

∑-=T T A 22)(χi j ij n n T n ⋅⋅=))()()(()(22d b c a d c b a n bc ad ++++-=χ∑--=T T A c 22)5.0(χ22(/2)()()()()c |ad -bc|-n n =a+b c+d a+c b+d χ40)( ;1 ,)(22≥+=+-=c b c b c b νχ40)( ;1 ,)1(22<+=+--=c b c b c b c νχ)1-)(1-(),1(n 22列数行数=-=∑νχC R n n A若X 2<X 2(v,α),P>0.05,在α=0.05的检验水准下,不拒绝H0,尚不可以认为两XXX 的有效率/总体xx 率/xx 率不相等(2)1、建立检验假设并确定检验水准H0:π1=π2,即任两对比组的xxx 相等H1:π1≠π2,即任两对比组的xxx 不相等α=0.052、计算检验统计量(两两比较)X 2=? v=?3、确定P 值,做出推断结论。

根据v 值,查X 2界值表得X 2(v,α’),X 2>X 2(v,α’),P<α’,在α=α’的检验水准下,拒绝H0,可以认为两XXX 的有效率/总体xx 率/xx 率的差异有统计学意义。

若X 2<X 2(v,α’),P>α’,在α=α’的检验水准下,接受H0,两XXX 的有效率/总体xx 率/xx 率之间无显著差异。

28、线性回归方程:★.描述分类变量常用的指标有率、构成比、相对数。

10、★四格表卡方专用公式应用条件n ≥40,且Tmin ≥511、★从总体中抽取样本,一定要遵循科学原则:代表性; 随机性 ;可靠性12、编制频数表的步骤: 确定组数;确定组距; 确定组限;确定频数。

二、判断:(1)制订医学参考值范围的注意事项:1. 确定同质的参照总体;一般选择“正常”人,主要是排除了对研究指标有影响的疾病或有关因素的同质人群。

2. 选择足够例数的参照样本;通常情况下,确定参考值范围需要大样本,如果例数过少,确定的参考值范围往往不够准确3. 控制检测误差:为保证原始数据可靠,检测过程中要严格控制随机误差,避免系统误差和过失误差。

4. 选择单、双侧界值:依据专业知识确定,研究指标无论过高或过低均属异常,采用双侧界值;有些指标仅过大或者过小为异常,采用单侧界值。

5. 选择适当的百分数范围:百分数范围的不同将导致不同的假阳性率和假阴性率。

6. 选择计算参考值范围的方法:根据资料的分布类型,样本含量的多少和研究目的等,选用百分位数发和正态近似法(2)常用相对数及其使用的注意事项1、相对数是两个有关的绝对数之比,也可以是两个有关联统计指标之比。

2、相对数的性质取决于其分子和分母的意义,不同类型的相对数具有不同的性质。

3、计算相对数的意义主要是把基数化作相等,便于相互比较4、构成比之和应为100%,某一构成部分的增减会影响其它构成部分相应的减少或增加5、而某一部分率的变化并不影响其它部分的变化。

6、需要注意:死因构成比只能说明某病死亡人数在总死亡人数中所占比重,如果需要描述致死的严重程度, 则要计算病死率。

7、相对比是A 、B 两个有关联指标值之比,用以描述两者的对比水平,这两个指标可以是性质相同,如不同 时期的患病人数;也可以是性质不同,如体重与身高的平方之比 。

8、不要把构成比与率相混淆,构成比只能说明事物内部各组成部分的比重和分布,不能说明其强度及频率9、使用相对数时分母不宜过小,过小相对数不稳定,且观察例数小时,最好用绝对数,以免误解。

10、注意资料的可比性,比较相对数时,资料应同质。

内部构成不同时须标准化。

11、样本率或构成比存在抽样误差,不能单凭数字表面的大小下结论,须对各组样本率或构成比的差异做假设 检验 Y a bX ∧=+()()()222XY XX X Y XY l (X X )(Y Y )n b l (X X )X X n ∑∑∑-∑--===∑-∑∑-=-a Y bX(3)统计表与统计图统计表把统计资料和结果用表格的形式来表达,目的是简洁、清晰、直观,方便对比和阅读。

相关主题