医学研究的样本例数第一附属医院医学统计咨询室、研究生科读者须知在医学研究中样本例数的确定是一个难点医学统计学家认为[1]样本含量的确定有两种方法:公式法和查表法,公式法和查表法本质一样,查表法是统计学家由公式做出的,而公式法需要研究者自己做,因为医学研究中尚有不少问题还搜索不到相应的计算公式来确定样本例数,本书搜集到的公式也十分有限,那么通过搜索文献来估计样本例数也是读者需要学习的一种方法。
须知,不存在无限定条件的样本例数。
现行统计教材中的样本例数没有特别强调这一点,以导致使用时,常提出如下问题:“了解吸烟是否是肺癌的危险因素,需要调查多少人?”,类似这样的问题是没人能回答出的。
医学研究中样本例数都是建立在一组限定条件之下的样本例数,若这一组限定条件改变,那么样本例数的值随之改变。
简言之,样本例数是这一组限定条件的函数。
这种函数关系具体由计算样本例数的公式表述。
那么,确定公式等号右端的各参数就变成了计算样本例数的前提。
根据此思路我们设计了一个确定样本例数的流程图(见下页),同时,这个流程图也是我们撰写本书具体内容和阅读本书的思路。
这个小册子中的例题均来自各种卫生统计学的教材和相关著作,其本质没有变化,但读起来却更加符合人们的认知习惯,你会感觉到更容易读懂了。
本书由一附院医学统计咨询室集体讨论,具体由孙奇执笔撰写和排版,几经修订,历时超过百天。
尽管如此,鉴于我们知识的局限性,也只能做到抛砖引玉,而且书中错误肯定难免。
欢迎读者不吝指正,我们将深表谢意!样本例数估计流程图目录1. 两样本率比较的样本例数 (4)2.多个样本率比较的样本例数 (6)3.两样本均数比较的样本例数 (8)4.多个样本均数比较的样本例数 (10)5.诊断试验的样本例数 (12)6.现况研究的样本例数···············································13 137.病例对照研究的样本例数·········································15 158.队列研究的样本例数···············································17 179.多元统计的样本例数···············································19 1910.其他 (20)11.附表 (21)1 两样本率比较的样本例数1.1提出专业问题某课题的研究目的是比较两种药物治疗乙型肝炎后表面抗原HBsAg 的改善情况,问两组各需要乙肝患者多少名? 1.2转化为统计问题上述研究所对应的统计问题为:两样本率比较的样本例数 1.3选择相应的公式两样本率比较的样本例数公式(1.3)[1]139221222211112112/)(]/)1(/)1())(1(2[p p Q p p Q p p Z Q Q p p Z N a --+-++-=--β1.4确定公式等号右端各参数1.公式(1.3)中a Z 、βZ 、P 、1P 、2P 、1Q 、2Q 的确定方法如下: (1)a Z 的确定:统计学家建议05.0=a ,则96.12/05.0=Z 。
(2)βZ 的确定:统计学家建议10.0=β,则282.101.0=Z 。
预试验如下:一个研究组将随机抽取的乙肝患者分为2组,试验者要求两组例数不等,其中甲药组的样本含量占55%,乙药组的样本含量占45%;通过试验后测得甲药的转阴率为60%,乙药的转阴率为75%。
(3)1Q 、2Q 的确定:一般由研究者根据试验需要规定。
(4) 样本率1P 、2P :一般由研究者根据预试验或查文献来估计,见前述预试验:60.01=P 、75.02=P 。
(5)P 的确定:2211P Q P Q P +==(0.55×0.6+0.45×0.75)=0.6675。
1.5计算求出样本例数将96.12/05.0=Z 、282.101.0=Z 、55.01=Q 、45.02=Q 、60.01=P 、75.02=P 、6675.0=P 代入公式(1.3)后可得411≈N 名。
1.6结论比较两种药物治疗乙型肝炎后表面抗原HBsAg 的转阴情况,欲使保持置信水平为 95%,检验功效为0.9,两组共需要411名乙肝患者。
其中甲药组需要 22641155.011=⨯==N Q n 名;乙药组需要 18541145.022=⨯==N Q n 名。
1.7参考文献1.7.1本文参考文献1.方积乾主编.卫生统计学,第5版.北京:人民卫生出版社,2003.1391.7.2其他参考文献1.颜虹主编.医学统计学,供8年制及7年制临床医学等专业用.北京:人民卫生出版社,2005,2542.周利锋,高尔生主编.卫生研究中样本含量的确定.上海:复旦大学出版社、上海医科大学出版社联合出版,2001,113.孙振球主编.医学统计学,第二版研究生教学用书.北京:人民卫生出版社,2005,6264.王仁安主编.要医学实验设计与统计分析.北京:北京大学医学出版社,1999,235.徐天和主编.医学研究统计设计分册.北京:人民卫生出版,2004,1446.马斌荣主编.医学科研中的统计方法,第三版.北京:科学出版社,2005,1422 多个样本率比较的样本例数2.1提出专业问题某课题的研究目的是比较三种矫治近视眼方法的效果有无差异,问各法需观察多少例?2.2转化为统计问题上述研究所对应的统计问题为:多个样本率比较的样本例数 2.3选择相应的公式多个样本率比较的样本例数公式(2.3)[1]1482min 1max 1)sin 2sin2(2p p n ---=λ2.4确定等号右端各参数1.公式(2.3)中λ、m ax P 、m in P 的确定方法如下: (1)α 的确定:统计学家建议05.0=a 。
(2)β的确定:统计学家建议10.0=β预试验如下:防疫站在某小学采用三种方法矫治近视眼,治疗后得到A 法有效率为37.78%,B 法为18.75%,C 法为27.78%。
(3) λ的确定:附表1查得, 65.122,10.0,05.01,,==-λλβk a 。
(4) m ax P 、m in P 的确定:分别为最大率和最小率,由研究者根据预试验或查文献来估计,3778.0max =P 、1875.0min =P 。
2.5计算求出样本例数将65.12=λ、3=k 、3778.0max =P 、1875.0min =P 代入公式(2.3)后可得138≈n 名。
2.6结论比较三种矫治近视眼方法的效果即采用三种不同的方法矫治近视眼,欲使保持置信水平为95%,检验功效为0.9,每组各需要138名患者,三组共需要414名患者。
2.7参考文献 2.7.1本文参考文献1.杨树勤主编.卫生统计学,第3版.北京:人民卫生出版社,1992.1482.7.2其它参考文献1.颜虹主编.医学统计学,供8年制及7年制临床医学等专业用.北京:人民卫生出版社,2005,2552 孙振球主编.医学统计学,第二版研究生教学用书.北京:人民卫生出版社,2005,6273.徐天和主编.医学研究统计设计分册.北京:人民卫生出版,2004,1473 两样本均数比较的样本例数3.1提出专业问题某课题的研究目的是欲比较黄芪与生血散对粒细胞减少症的疗效,问每组需要观察多少例?3.2转化为统计问题上述研究所对应的统计问题为:两样本均数比较的样本例数 3.3选择相应的公式两样本均数比较样本例数公式(3.3)[1]146222)(δσβZ Z Na +=()1211--+Q Q3.4确定等号右端各参数1.公式(3.3)中 a Z 、βZ 、σ、δ、1Q 、2Q 的确定方法如下: (1) a Z 的确定:统计学家建议05.0=a ,则96.12/05.0=Z 。
(2) βZ 的确定:统计学家建议20.0=β,则842.020.0=Z 。
预试验如下:一个研究组将随机抽取的粒细胞减少症的病例平均分为两组,分别用黄芪和生血散治疗后测得,黄芪组平均增加粒细胞9101⨯个/L,生血散组平均增加粒细胞9102⨯个/L,标准差合值为9108.1⨯=σ个/L。
(3) σ的确定:此处标准差为两组标准差之合值由公式2/)(2221S S +=σ[2]32计算得出。
(4) δ的确定:见前述预试验,112=-=δ (L /109个⨯)。
(5) 1Q 、2Q 的确定:见前述预试验,5.01=Q 、5.02=Q 。