集中趋势的描述算术均数: 频数表资料(X0为各组段组中值)n fXffX x OO∑∑∑==几何均数:n nX X X G ...21= 或)log (log1nX G ∑-=频数表资料:⎥⎦⎤⎢⎣⎡=⎥⎥⎦⎤⎢⎢⎣⎡=∑∑∑--n X f f X f G log lg log log 11 中位数:(1)*21+=n X M (2))(21*12*2++=n n X X M百分位数⎪⎭⎫⎝⎛-⋅+=L X X f n X f i L P 100其中:L 为欲求的百分位数所在组段的下限 , i 为该组段的组距 , n 为总频数 , X f 为该组段的的频数 ,L f 为该组段之前的累计频数方差: 总体方差为:式(1); 样本方差为 式(2)(1)N X 22)(μσ-∑=(2)1)(22--∑=n X X S标准差:1)(2--∑=n X X S 或 1/)(22-∑-∑=n nX X S 频数表资料计算标准差的公式为1/)(22-∑∑∑-∑=f ffx fx S变异系数:当两组资料单位不同或均数相差较大时,对变异大小进行比较,应计算变异系数%100⨯=X SCV常用的相对数指标 (一)率 (二)相对比(三)构成比 1.直接法标准化NpN pii∑='∑=ii p NN p )('2.间接法标准化预期人数实际人数=SMR ∑=ii P n rSMRS M R P P ⨯='正态分布:密度函数:)2/()(2221)(σμπσ--=X e X f分布函数: 小于X 值的概率,即该点正态曲线下左侧面积)()(x X P x F <=特征:(1)关于x=μ对称。
(2)在x=μ处取得该概率密度函数的最大值,在σμ±=x 处有拐点,表现为钟形曲线。
(3)曲线下面积为1。
(4)μ决定曲线在横轴上的位置,σ决定曲线的形状 。
(5)曲线下面积分布有一定规律标准正态分布:对任意一个服从正态分布的随机变量,作如下标准化变换σμ-=X u ,u 服从总体均数为0、总体标准差为1的正态分布。
u 值左侧标准正态曲线下面积为标准正态分布函数,记作 )(u Φ医学参考值的确定方法:(1)百分位法:双侧(P 25,P 975),单侧P 95以下或P 5以上,该法适用于任何分布型的资料。
(2)正态分布法:若X 服从正态分布,双侧医学参考值范围为S X 96.1±样本均数标准误的估计值为Xs =t 分布的概念:小样本总体标准差未知时,服从自由度为n-1的t 分布X X X t s μ-=总体均数可信区间的计算:大样本或总体标准差已知:式(1); 小样本:式(2)(1)n SX ⋅±96.1 (2)nS n t t ⋅±-)1(,05.0(前一个t表示均数) 单样本t 检验:n S X t /0μ-=自由度为 n-1;配对样本t 检验: 检验统计量:nS d t d /0-=自由度为n-1(n 为对子数)两样本t 检验:检验统计量: )11(2121n n S X X t c +-=(错:Sc 的平方)2)()(2)1()1(21222211212222112-+-+-=-+-+-=∑∑n n X X X X n n S n S n S c方差齐性检验:H 0:两总体方差齐,H 1:两总体方差不齐,α=0.1检验统计量:(较小)(较大)2221S S F = 分子自由度为n 1-1,分母自由度为n 2-1方差分析的基本思想: 1、总变异:总离均差平方和:2() 1T ij ijSS SS X X N νν=-==-∑∑总总=∑∑-=N X X ij ij /)(22∑=N XC ij/)(22. 组间变异:组间变异反映了处理因素的影响(如处理确实有作用),同时也包括了随机误差(含个体差异和测量误差)。
21() 1B i i iSS SS n X X k νν-==-∑组间组间===Cn X iiij -∑∑2)(3. 组内变异:组内变异仅反映随机误差(含个体差异和测量误差),故又称误差变异。
222()(1) W E ij i i i i j i SS SS SS X X n S N kνν===-=-==-∑∑∑组内组内 2()(1) W E ij i i i ijiSS SS SS X X n S N k νν===-=-==-∑∑∑组内组内1(1)()N k N k ννν=-=-+-=+总组间组内组间均方与组内均方比值一般地服从分子自由度为ν1,分母自由度为ν2的F 分布12 1 MS F k N k MS νννν===-==-组间组间组内组内,二项分布的概率函数P (X ): Xn X X nC X P --=)1()(ππ;)!(!!X n X n C X n -=二项分布的均数和标准差:进行n 次独立重复试验,出现X 次阳性结果X 的总体均数为πμn = 总体方差为)1(2ππσ-=n总体标准差为)1(ππσ-=n如果将阳性结果用频率表示nXp =率的总体均数πμ=p 标准差np )1(ππσ-=n p p n p p S p )1(1)1(-≈--=又称率的标准误它反映率的抽样误差的大小。
单侧累积概率计算:出现阳性的次数至多为k 次的概率为∑∑==---==≤kX kX Xn X X n X n X P k X P 00)1()!(!!)()(ππ出现阳性的次数至少为k 次的概率∑∑==---==≥nkX nk X X n X X n X n X P k X P )1()!(!!)()(ππ率的可信区间的估计 正态近似法:当)1(,p n np -均大于等于5时np p p n p p P )1(96.1,)1(96.1-+-⋅-样本率与总体率的比较:检验假设H 0:π=π0,H 1:π≠π0 1 . 满足正态近似时,计算检验统计量)1(000πππ--=n n X Z 或n p Z )1(000πππ--=2. 不满足正态近似时用直接概率计算法两样本率的比较:H0:π1=π2,H1:π1≠π2, 检验统计量:)11)(1(||2121n n p p p p Z c c +--=2121n n X X p c ++= Poisson 分布的概率函数为!)(X e X P X λλ-=POISSON 分布的应用:单侧累计概率计算:稀有事件发生次数至多为k 次的概率为∑∑==-==≤k X kX X X e X P k X P 0!)()(λλ发生次数至少为k 次的概率为)1(1)(-≤-=≥k X P k X P总体均数的区间估计:正态近似法95%总体均数的可信区间为X X X X 96.1,96.1+- 样本率和总体率的比较正态近似法: 当满足正态近似条件时, 对检验假设 H0:λ=λ0,H1:λ≠λ0, 检验统计量为λλ-=X Z两组独立样本资料的Z 检验 :当两总体均数都大于20时, 对检验假设H0:λ1=λ2, H1:λ1≠λ2,当两样本观测单位数相等时,检验统计量为:式(1);当两样本观测单位数不等时,检验统计量为:式(2)(1)2121X X X X Z +-= (2)221121n X n X X X Z +-=四格表χ2检验的步骤: 1.检验假设, H0:两总体率相等,H1:两总体率不等。
Α=0.05 。
2.统计量3. 确定p 值。
4. 结论。
n ≥40,且T ≥5,ν=(行数-1)(列数-1)∑-=T T A 22)(χ,n n n T c r =,))()()(()(22d b c a d c b a nbc ad ++++-=χ 当n ≥40,如果有某个格子出现1<T <5,校正公式∑--=TT A 22)5.0(χ))()()(()2/|(|22d b c a d c b a n n bc ad ++++--=χ注意如果出现n <40或一个T <1则不能用χ2检验,用Fisher 确切概率法RxC 列表资料的χ2检验(多样本率和构成比的χ2检验):假设H0:各总体率相等,H1:各总体率不等或不全等,α=0.05,自由度 ν=(行数-1)(列数-1)。
统计量为⎪⎪⎭⎫ ⎝⎛-=∑122c r n n A n χ构成比的比较:假设H0:构成比相同,H1:构成比不同(公式同上)双向无序分类资料的关联性检验:Pearson 列联系数22χχ+=n C配对四格表的χ2检验:配对设计列表:假设H0:B=C 两阳性率相等; H1:B ≠C 两阳性率不等若b+c ≥40:式(1) 若 b+c <40:式(2) (1)cb c b +-=22)(χ (2)c b c b +--=22)1|(|χ两分类变量的关联性检验:假设:H0:两分类变量无关 (满足概率独立性) ,H1:两分类变量有关2χ分割法:1、多个实验组间的两两比较:()12,+=καα2)1()(2-=k k κk 为样本率的个数2、实验组与同一个对照组的比较:)1(2,-=k αα k 为样本率的个数配对设计资料的符号秩和检验:正态近似法:计算u 统计量,如果数据超出表的范围可计算u统计量。
当n ≤50,查T 界值表。
当n>50,如下公式:下式中t j 为第j(j=1,2…)次相持所含相同秩次的个数 48)(24)12)(1(4/)1(3∑--+++-=j j c t t n n n n n T Z两独立样本比较的秩和检验:确定P 值和作出推断结论。
如果n 1≤10或n 2-n 1≤10,查T 界值表如果n 1或n 2-n 1超出了成组设计T 界值的范围,可用正态近似检验。
12)1(2)1(2121211++++-=n n n n n n n T Zc Z Z c =)/()(133N N t t c j j ---=∑ 完全随机化设计多组独立样本的秩和检验(H 检验):统计量∑+-+=)1(3)1(122N n R N N H ii 确定P 值并做出推断结论:如取相同秩次个数较多时需校正c HH c =)()(133N N t tc j j ---=∑多个独立样本两两比较的Nemenyi 法检验 随机化区组设计资料的秩和检验(M 检验):计算统计量M 值,b 为每个区组内个数,k 为区组数(研究因素的水平数)∑-=2)(R R M j ,∑+-=4/)1(222k k b R M j确定P 值并做出推断结论: 当b ≤15和k ≤15时,查M 界值表; 当b>15和k>15时,χ2分布近似法:当处理数k 或区组数b 超出M 界值表的范围时,采用近似χ2 分布法)1(122+=k bk Mr χ 或)1(3)1(12122+-+=∑=k b R k bk kj j r χ自由度为(k-1) 。