当前位置：文档之家› 医学统计学第六版1-11章

医学统计学第六版1-11章

1、★医学统计学工作基本步骤：统计设计；收集资料.；整理资料；分析资料2、★统计分析包括：统计描述、统计推断，统计推断包括参数估计和假设检验。

★常见的统计资料的类型有：定量数据（计量资料）；定性数据(计数资料）；有序数据（等级资料）3、频数分布的两个重要特征：集中趋势和离散趋势4、正态分布的两个参数：均数；标准差。

μ=0、δ =1的正态分布即为标准正态分布。

5、当 μ和 δ 未知时，可以利用样本均数x 拔和标准差S 计算z6、对服从的任意随机变量X ，都可经z 变换转化成标准正态分布，7、正态性判定的方法有两类：一是图示法，二是计算法。

7、★频数表的用途：揭示计量资料的分布类型；揭示计量资料的分布特征；便于发现特大值和特小值；便于进一步进行统计分析8、描述定性资料的数据特征，通常需要计算相对数。

根据不同的研究目的，常用率、构成比、相对比（例数之比；相对危险度RR;比数比OR ）等指标来进行统计描述。

9、比较两个不同人群的患病率、发病率、死亡率等资料时，为消除其内部构成（如年龄、性别、工龄、病程长短、病情轻重等）对率的影响，可以使用标准化率。

10、从外形上看，统计表可由标题、标目（包括横标目、纵标目）、线条、数字和备注5部分构成。

11、统计图通常由标题、图域、标目、图例和刻度5个部分组成。

12、统计表的编制原则和结构：重点突出，简单明了；主谓分明，层次清楚；数据表达规范、文字和线条尽量从简。

13、描述定量数据的统计图有直方图、线图、箱式图、误差条图和散点图。

14、描述定性数据的统计图有直条图和构成图（圆图和百分条图）。

15、样本均数标准误的估计值，计算公式为：16、样本率的标准差也称为率的标准误，用来描述样本率抽样误差的大小。

率的标准误越小，则率的抽样误差越小。

17、参数估计包括点估计和区间估计。

18、可信区间估计的效果由可信度1-α和区间的宽度来反映，有可信度计算出来的总体均数μ的概率越接近1越好，区间越窄估计越精确。

19、总体均数的区间估计：（1）δ已知：变量X 服从标准正态分布，95%的z 值在-1.96和1.96之间，则得到95%的可信区间是：（2）δ未知：这时可以用其估计量S 代替，但z 值已不再服从标准正态分布，而是服从著名的t 分布。

计算：小样本情况下，只要原始变量服从正态分布即可用：大样本(n>=50)，无论变量是否服从正态分布将上式的t..改为z α/220、假设检验中，包括原假设H 0 和备择假设H 1 两种假设。

21、假设检验的基本步骤：建立假设和确定检验水准、选择检验方法和计算检验统计量和根据P 值做出统计推断。

22、两样本方差齐性检验：在正态分布情况下，检验统计量F 值按下列公式计算 ν１＝n １-1， ν2= n ２-1 若F > =F α/2（ν１,ν2）则P<=α，拒绝H0，接受H1，可认为两总体方差不齐。

23、采用t ’检验，主要有Satterthwaite 法近似t 检验、Welch 法近似t 检验和Cochran & Cox 法近似t 检验。

其中Cochran & Cox 法是对临界值校正；而Satterthwaite 法和Welch 法是对自由度进行校正。

24、I 类错误(假阳性错误，α)是指当H 0为真时，假设检验结论拒绝H 0，接受H 1；II 类错误（假阴性错误，β）是指当H 0不成立的时候，假设检验不拒绝H 0.25、U 检验的应用条件是：①大样本（如n>50）；②小样本，σ已知且样本来自正态总体。

26、多个样本率间多重比较有X 2分割法、可信区间法和Bonferroni 方法，应用这些方法能够保证假设检验中I 型错误的概率α不变。

27、非参数检验方法有多种，如配对比较的Wilcoxon 符号秩和检验、两组比较的Wilcoxon 秩和检验、多组比较的Kruskal-Wallis 秩和检验等，其中最常用的是Wilcoxon 秩和检验。

28、两个变量之间存在的线性相关关系称为线性相关或简单相关,用于分析双变量正态分布资料。

计算公式为X Xz S -=),(2σμN ()z X μσ=-)96.1 ,96.1(X X X X σσ+-). .()(2/)(2/X X S t X S t X νανα＋，－2122()()S F S =较大较小22XY XX YY l (X X )(Y Y )r l l (X X )(Y Y )∑∑∑--==--X 2检验的通用的基本公式为：（n>=40且T>=5），v=(行数-1)(列数-1) 理论频数计算公式：（ i 行j 列）四格表资料X 2检验的专用公式：(n>=40且T>=5)a b c d四格表资料X 2检验的校正公式：（n>=40,1=<T<5）四格表资料的Fisher 确切概率法：(n<40或T<1)Pi=[（a+b ）！（c+d ）！（a+c ）！（b+d ）！]/(a ！b ！c ！d ！)配对四格表的X 2检验公式： R*C 表X 2检验公式：多样本率之间多重比较重新设定检验水准α’：(k 实验组或样本率的个数)1、多个实验组之间两两比较：α’=2α/[k(k-1)]2、实验组与同一个对照组的比较：α’=α/(k-1)使用步骤：1）两个样本率或实验组1、建立检验假设并确定检验水准H0：π1=π2，即两XXX 的有效率/总体xx 率/xx 率相等H1：π1≠π2，即两XXX 的有效率/总体xx 率/xx 率不相等α=0.052、计算检验统计量X 2=？ v=？3、确定P 值，做出推断结论。

根据v 值，查X 2界值表得X 2(v,α)，X 2>X 2(v,α)，P<0.05,在α=0.05的检验水准下，拒绝H0，可以认为两XXX 的有效率/总体xx 率/xx 率不相等。

若X 2<X 2(v,α)，P>0.05,在α=0.05的检验水准下，不拒绝H0，尚不可以认为两XXX 的有效率/总体xx 率/xx 率不相等。

2）三个样本率或构成比等(1)1、建立检验假设并确定检验水准H0：不同XXX 的有效率/总体xx 率/xx 率/构成比相等H1：不同XXX 的有效率/总体xx 率/xx 率/构成比不相等α=0.052、计算检验统计量X 2=？ v=？3、确定P 值，做出推断结论。

根据v 值，查X 2界值表得X 2(v,α)，X 2>X 2(v,α)，P<0.05,在α=0.05的检验水准下，拒绝H0，可以认为两XXX 的有效率/总体xx 率/xx 率不相等。

∑-=T T A 22)(χi j ij n n T n ⋅⋅=))()()(()(22d b c a d c b a n bc ad ++++-=χ∑--=T T A c 22)5.0(χ22(/2)()()()()c |ad -bc|-n n =a+b c+d a+c b+d χ40)( ;1 ,)(22≥+=+-=c b c b c b νχ40)( ;1 ,)1(22<+=+--=c b c b c b c νχ)1-)(1-(),1(n 22列数行数=-=∑νχC R n n A若X 2<X 2(v,α)，P>0.05,在α=0.05的检验水准下，不拒绝H0，尚不可以认为两XXX 的有效率/总体xx 率/xx 率不相等(2)1、建立检验假设并确定检验水准H0：π1=π2，即任两对比组的xxx 相等H1：π1≠π2，即任两对比组的xxx 不相等α=0.052、计算检验统计量(两两比较)X 2=？ v=？3、确定P 值，做出推断结论。

根据v 值，查X 2界值表得X 2(v,α’)，X 2>X 2(v,α’)，P<α’,在α=α’的检验水准下，拒绝H0，可以认为两XXX 的有效率/总体xx 率/xx 率的差异有统计学意义。

若X 2<X 2(v,α’)，P>α’,在α=α’的检验水准下，接受H0，两XXX 的有效率/总体xx 率/xx 率之间无显著差异。

28、线性回归方程：★.描述分类变量常用的指标有率、构成比、相对数。

10、★四格表卡方专用公式应用条件n ≥40，且Tmin ≥511、★从总体中抽取样本，一定要遵循科学原则：代表性；随机性；可靠性12、编制频数表的步骤: 确定组数；确定组距；确定组限；确定频数。

二、判断：（1）制订医学参考值范围的注意事项：1. 确定同质的参照总体；一般选择“正常”人，主要是排除了对研究指标有影响的疾病或有关因素的同质人群。

2. 选择足够例数的参照样本；通常情况下，确定参考值范围需要大样本，如果例数过少，确定的参考值范围往往不够准确3. 控制检测误差：为保证原始数据可靠，检测过程中要严格控制随机误差，避免系统误差和过失误差。

4. 选择单、双侧界值：依据专业知识确定，研究指标无论过高或过低均属异常，采用双侧界值；有些指标仅过大或者过小为异常，采用单侧界值。

5. 选择适当的百分数范围：百分数范围的不同将导致不同的假阳性率和假阴性率。

6. 选择计算参考值范围的方法：根据资料的分布类型，样本含量的多少和研究目的等，选用百分位数发和正态近似法（2）常用相对数及其使用的注意事项1、相对数是两个有关的绝对数之比，也可以是两个有关联统计指标之比。

2、相对数的性质取决于其分子和分母的意义，不同类型的相对数具有不同的性质。

3、计算相对数的意义主要是把基数化作相等，便于相互比较4、构成比之和应为100%，某一构成部分的增减会影响其它构成部分相应的减少或增加5、而某一部分率的变化并不影响其它部分的变化。

6、需要注意：死因构成比只能说明某病死亡人数在总死亡人数中所占比重，如果需要描述致死的严重程度，则要计算病死率。

7、相对比是A 、B 两个有关联指标值之比，用以描述两者的对比水平，这两个指标可以是性质相同，如不同时期的患病人数；也可以是性质不同，如体重与身高的平方之比。

8、不要把构成比与率相混淆，构成比只能说明事物内部各组成部分的比重和分布，不能说明其强度及频率9、使用相对数时分母不宜过小，过小相对数不稳定，且观察例数小时，最好用绝对数，以免误解。

10、注意资料的可比性，比较相对数时，资料应同质。

内部构成不同时须标准化。

11、样本率或构成比存在抽样误差，不能单凭数字表面的大小下结论，须对各组样本率或构成比的差异做假设检验 Y a bX ∧=+()()()222XY XX X Y XY l (X X )(Y Y )n b l (X X )X X n ∑∑∑-∑--===∑-∑∑-=-a Y bX（3）统计表与统计图统计表把统计资料和结果用表格的形式来表达，目的是简洁、清晰、直观，方便对比和阅读。

e商务文档

医学统计学第六版1-11章

相关文档推荐：