第一章 绪论总体:根据研究目的确定的同质的所有观察单位某种变量值的集合。
总体包括有限总体和无限总体。
样本:从总体中随机抽取的部分观察单位,其实测值的集合。
获取样本仅仅是手段,通过样本信息来推断总体特性才是研究的目的。
资料的类型计量资料、计数资料和等级资料。
误差包括随机误差、系统误差和非系统误差。
抽样误差:由抽样造成的样本统计量和总体参数之间的差异或者是各个样本统计量之间的差异称为抽样误差。
概率:是描述随机事件发生可能性大小的一个度量。
取值范围0≤P ≤1。
小概率事件:表示在一次实验或观察中该事件发生的可能性很小,可以认为很可能不发生。
P ≤0.05或P ≤0.01。
医学统计学的步骤:设计、收集资料、整理资料和分析资料。
统计分析包括:统计描述和统计推断。
统计推断包括:参数估计和假设检验。
第二章计量资料的统计描述频数表和频数分布图的用途:(1)描述频数分布的类型,以便选择相应的统计指标和分析方法。
对称分布:集中位置在中间,左右两侧頻数基本对称。
偏态分布:正、负偏态分布正偏态集中位置偏向值小一侧,负偏态反之。
(2)描述頻数分布的特征;(3)便于发现资料中的可疑值;(4)便于进一步计算统计指标和进行统计分析。
计量资料集中趋势包括算术均数、几何均数和中位数。
算术均数:直接法(样本小):n x x ∑=;頻数表法(样本大)x =nfx ∑ 几何均数:直接法:)lg (lg 1n x G ∑-=;頻数表法)lg (lg )lg (lg 11n x f fx f G ∑∑∑--==(常用于等比资料或对数正态分布资料)中位数:直接法:n 为奇数2/)1(+=n x M ,n 为偶数2/)(12/2/++=n n x x M ;頻数表法:∑-⨯+=)%50(L M M f n f iL M 。
中位数的应用注意事项:可用于各种分布资料,不受极端值的影响,主要用于(1)偏态分布资料(2)端点无确切值的资料(3)分布不明确的资料。
百分位数:頻数表法:)%(∑-⋅+=L xx x f x n f i L P均数的特性:(1)各观察值与均数之差(离均差)的总和等于零,即∑=-0)(x x 。
(2)各观察值得离均差平方和最小,即∑∑-<-22)()(a x x x )(x a ≠。
均数的应用:(1)均数反映一组同质观察值的平均水平,并可作为样本的代表值与其他样本进行比较。
(2)均数适用于描述单峰对称分布,特别是正态或近似正态分布资料的集中趋势。
离散趋势包括:极差、四分位数间距、方差、标准差和变异系数。
中位数和四分位数间距一起全面描述偏态分布资料的分布特征。
极差:R=MAX-MIN四分位数间距:Q=P75-P25,Q 越大,说明数据变异越大,反之,Q 越小,变异越小。
离均差平方和(SS ):SS= ∑∑∑-=-n X X X X 222)()(方差(MA ):总体=2σ N X ∑-2)(μ ;样本1)(22--=∑n X X S 标准差:总体NX ∑-=2)(μσ;样本1)(2--=∑n X X S 或1)(22--=∑∑n nX X S 频数表法1/)(22--=∑∑n n fx fx S 变异系数:%100⨯=XS CV 正态分布特征:(1)正态密度函数曲线在横轴上方均数处最高;(2)正态分布以均数为中心, 左右对称;(3)正态分布中的X 取值范围理论上没有边界;(4)正态分布有两个参数,位置参数μ和变异参数σ;正态曲线下的面积分布有一定的规律。
(μ-σ,μ+σ)约为68.27% ;在(μ-1.96σ,μ+1.96σ)约为95.00% ;在(μ-2.58σ,μ+2.58σ)内约为99.00% .。
标准正态分布两个参数为0和1。
标准正态分布:sx x u -= 医学参考值范围计算包括:正态分布法和百分位数法。
正态分布法:s u x α± 单侧1.64,2.32;双侧1.96,2.58。
第三章总体均数的估计与假设检验标准差与标准误的区别和联系:区别:意义:标差反应个体值得离散度,标误反应样本均数的离散度,即描述样本均数抽样误差的大小。
应用:标差用于估计参考值范围(X 范围),标误用于可信区间的估计(μ的范围)。
联系:nS S X =。
t 分布ns x t μ-== xs x μ-,自由度υ=n -1。
t 分布特征:(1)单峰分布,以0为中心,左右两侧对称;(2)t 分布曲线不是一条曲线,是一簇曲线,其分布曲线的形态变化与自由度υ有关;(3)自由度υ越大,t 分布越近于正态分布,当自由度υ逼近∞,t 分布趋向于标准正态分布。
可信区间:).,.()()(X X S t X S t X νανα+-参数估计有点估计和区间估计。
可信区间优劣取决于可信度1-和宽度。
可信区间与参考值范围区别:含义:可信区间:按预先给定的概率所确定的未知参数μ的可能范围。
参考值范围:“正常人”的解剖、生理、生化指标的波动范围。
计算公式:可信区间:X S t X .)(να±(标准误) 正态分布:s u x α±(标准差)假设检验的基本思想小概率反证法。
假设检验旧称显著性检验。
它是利用小概率反证法思想,从问题的对立面(H0)出发间接判断要解决的问题(H1)是否成立。
然后在H0成立的条件下检验统计量,最后获得P 值来判断。
需注意所有检验统计量都是在H0成立的前提条件下计算出来的。
检验假设是针对总体而言的。
单个样本t 检验:H0:μ=μ0,H1:μ>μ0 ,α=0.05 nS X S X S X t X X 00μμμ-=-=-=,自由度υ=n-1 配对样本t 检验:H0:μd =0,H1:μd ≠0,α=0.05 n S d S d S d t d d d d =-=-=0μ,其中()122--=∑∑n n d d S dd 为没对数据的差值,d 为差值的样本均数,Sd 为差值的标准差,d S 差值样本均数标准误,n 为对子数。
成组设计的两样本均数的t 检验(完全随机设计):1.若n1,n2较小,σ12=σ22,两独立样本的t 检验 2121X X S X X t --=,其中⎪⎪⎭⎫ ⎝⎛+=-2121121n n S S C X X ,2)1()1(212222112-+-+-=n n S n S n S C υ=n 1+n 2-22.若n1,n2较大,两独立样本的u 检验 22212121n S n S X X u +-=假设检验中两类错误I 型错误:指拒绝了实际上成立的Ho ,即“弃真”的错误。
用α表示。
研究者可根据不同研究目的来确定α水平。
α表示检验有意义的水准,故亦称检验水准。
II 型错误:指接受了实际上不成立的Ho ,即“存伪”的错误。
用β表示。
β只1-β称为检验效能。
假设检验的注意事项:(1)要有严密的抽样设计;(2)不同的资料应选用不同检验方法;(3)正确理解“显著性”一词的含义;(4)结论不能绝对化;(5)统计“显著性”与医学/临床/生物学“显著性”;(6)可信区间与假设检验的区别和联系。
第四章多个样本均数比较的方差分析方差分析的基本思想:基本思想就是实验设计的类型,将总变异分解为几个部分,除随机误差作用外,每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释。
方差分析的应用条件:(1)各个样本是相互独立的随机样本;(2)各样本来自正态总体;(3)各总体方差相等,及方差齐。
完全随机设计方差分析:随机区组设计方差分析:多个样本均数间的多重比较,两两比较的t检验进行多重比较,将会加大犯I 类错误的概率。
多个样本均数间多重比较方法:LSD-t检验、Dunnett-t检验和SNK-q检验。
第五章计数资料的统计描述 常用相对数包括:率(强度相对数)、构成比(结构相对数)和相对比。
注意事项:(1)分析时不能以构成比代替率; (2)计算相对数尤其是率时要有足够数量的观察单位数或观察次数; (3)应分别将分子和分母合计求合计率或平均率;(4)注意资料和可比性;(5)样本率或构成比比较时应作假设检验。
率的标准化法的基本思想:就是采用统一的标准人口或人口构成作为参照,以消除因人口年龄、性别等因素构成不同对总率的影像,以增强可比性。
标准构成有:择一法、合并法和标准法。
第六章几种离散型变量的分布及其应用二项分布:是指在只会生产两种可能结果如“阳性”或“阴性”之一的n 次独立重复试验中,当每次试验的“阳性”概率π保持不变时,出现“阳性”次数X=0,1,2…n 的一种概率分布。
二项分布公式:二项分布的两参数试验次数n 和“阳性”的概率π。
二项分布的适用条件:互斥、等概率和独立。
二项分布为唯一的离散型分布。
第七章χ2检验(连续性分布)χ2检验的基本思想:是建议实际頻数和理论頻数的差别是否由抽样误差所引起的。
χ2值反应实际頻数和理论頻数的吻合程度。
χ2检验判别准则:若χ2<χ20.05(ν) , 则P >0.05,不拒绝无效假设H0;若χ2≥χ20.05(ν) ,则P <0.05,拒绝无效假设H0,接受H1 。
∑-=RC RC RC T T A 22)(χ,T 为理论頻数n n n T C R RC =,A 为实际頻数。
自由度v=(行数-1)(列数-1)=(R-1)(C-1)当n ≥40 且某一个理论数1≤T <5时用T T A 22)5.0|(|--=∑χ或))()()(()2|(|22d c b a d b c a n n bc ad ++++--=χ来校正完全随机设计:))()()(()(22d b c a d c b a n bc ad ++++-=χ(n ≥40且所有的T ≥5) 1. 建立检验假设并确定检验水准H0:π1=π2H1:π1≠π2α =0.052. 计算检验统计量:χ2=?3. 查表及统计推断:配对设计:1.b+c ≥40时c b c b +-=22)(χ 2.b+c <40时c b c b +--=22)1|(|χ 1. 建立检验假设并确定检验水准C B H CB H ≠=总体总体::10α =0.052. 计算检验统计量:χ2=?3. 查表及统计推断:行X 列表χ2检验(行和/或列超过两组时) 公式∑-=RC RC RC T T A 22)(χ 简化公式)1(22-∑=C R n n A n χ 1.建立检验假设并确定检验水准列多行二Ho :π1=π2=π3相同H1:……不全相等行多列二Ho :……总体构成比相同H1:……总体构成比不同2.计算检验统计量:χ2=?3.查表及统计推断:行X 列表χ2检验时的注意事项:(1)不宜有1/5以上的理论頻数小于5,或有1个格子的理论頻数小于1;(2)单向有序行列表;(3)双向有序且分类属性不同行列表;(4)双向有序且分类属性相同行列表;(5)当多个样本率(或构成比)比较的χ2检验,结论为拒绝检验假设,只能认为各总体率之间总的来说有差别,但不能说明它们彼此之间都有差别,或某两者之间有差别。