当前位置：文档之家› 8.样本含量的计算

8.样本含量的计算

甲法 + -
乙法 + P P2-P P2 1 P1-P P1
z 2P z 2 ( p 1 P )( p 2 P ) / P N p1 p2
• p1,p2分别为甲、乙两法阳性率， • p为甲、乙两法一致性阳性率， •

p ( p1 p2 2 p) / 2
z z
2
2

2
n=(1.6449+1.2816)2(25)2/(10)2=53.5
22
2.1.3 配对资料
n
z z
2
2

d

2
例3：某医师拟用新药治疗矽肺患者，预实验尿矽排出量平均比治疗前增加15mg/L，标准差为 25mg/L，问需要观察多少患者可以认为该药有效（单侧α=0.05，β=0.10）
• 试验样本量过小，无论试验结果是否存在差异，均
不能排除因机遇（随机误差）造成的假阳性或假阴性错误。
• 样本量过少：结果不稳定，检验效能过低，结论缺
乏充分依据。
• 样本量过大：增加临床研究难度，造成人力、无力
、时间和经济上的浪费，伦理问题，一些临床意义不大的微弱疗效最终也可能会出现统计学上的显著差异。
• -对照组死亡率为50%
• -试验组和对照组的样本量均为n=50 • -显著性水平为双侧0.05
• -检验方法=卡方检验
• 结果：16次试验（100次）中未能显示出统计学差异
84次试验显示有统计学差异 1次试验成功率为84%-power
16
计算机模拟举例2
• 假设： • -试验组死亡率为20%
• -对照组死亡率为50%
2
n 2 pq ( z z ) /( p1 p0 )
2
2
2.3.3 队列研究样本量计算
2
z 2pq z p q p q 0 0 1 1 n 2 p1 p 0
n 2 pq ( z z ) /( p1 p0 )
2
2
医学研究样本量总结
N
z
z 1 1 / k p(1 p )
δ为容许误差，即样本均数与总体均数间的容许差值；α取双侧，Z值可以查表。
单侧α
双侧α/2 β 1-β Z值
0.40
0.80 0.40 0.60 0.2532
0.30
0.60 0.30 0.70 0.5243
0.20
0.40 0.20 0.80 0.8417
0.10
0.20 0.10 0.90 1.2816
医学研究认为有意义的差值
• 有些情况下，只要有差异（和零值有差别）即可 • 临床上，很多情况下，需要更大的具有临床意义的
差别
平均舒张压的差值≥5mmHg 如一种新疗法治疗儿童白血病比旧疗法治愈率提高5%，则
认为可取如治疗头痛，新药和阿斯匹林比较可能要有30%的差别才会被认为有价值
• 要达到临床有意义的差别，需要更大的样本量
• 无论是病例对照、队列研究还是实验性研究，当结局是二
分类时，公式都相似。
z 2pq z p q p q 0 0 1 1 n p1 p 0 2
2
n
z
z 1 1 / k p(1 p )
2
p e
pc
2
医学研究样本量总结
4
定义
样本含量估算就是在保证科研结论具有一定可靠性条件下，确定的最少观察例数。
样本含量的确定有关因素
• 设计的类型 • 主要变量的性质 • 医学研究认为有意义的差值 • 一类错误α值（检验水准） • 二类错误β值（把握度、检验效能1-β）
• 失访率
设计的类型
• 观察性研究 • 实验性研究 • 配对设计 • 随机化设计
试验组发生率
pβ水平相应为1的标准正态差
N：为计算所得一个组的样本大小
2.3 观察性研究样本量
• 2.3.1 横截面调查的样本量考虑 • 定量资料的样本量计算 • 定性资料的样本量计算
n
z
2
2

2
z p 1 p n 2
2
2.3.2 病例对照样本量计算
z 2pq z p q p q 0 0 1 1 n 2 p1 p 0
• 上述情况均为单因素的研究，如果多因素，需要考
虑回归方程对样本量的要求（1/10） • 生存分析，包括logRANK检验，COX回归对样本量要求更为复杂，甚至难以用公式表达，可直接借助软件进行计算。
三、临床试验的样本量考虑
• 差异性检验
优效性检验等效性检验
非劣效性检验
38
按假设检验类型
• 优效性检验：反应试验药效果优于对照药物（安慰
n
z
2
2

2
n=(1.96)2(1.5)2/(0.2)2=216.1≈217
21
2.1.2 样本均数与总体均数比较例2：某院普查市区2-6岁幼儿体格发育情况，其中体重未达标的幼儿，血红蛋白平均为100g/L，标准差25g/L。现欲使用抗贫血药物，如果治疗前后血红蛋白预计 n 上升10g/L。设单侧α=0.05， β=0.1时，试问应治疗多少人，可以认为该药是有效的？
0.05
0.10 0.05 0.95 1.6449
0.025
0.05 0.025 0.975 1.960
0.01
0.02 0.01 0.99 2.3263
0.005
0.01 0.005 0.995 2.5758
20
• 例1：某医院拟用抽样调查评价本地区健康成人白细
胞数的水平，要求误差不超过0.2*109/L。根据文献报告，健康成人的白细胞数的标准差约1.5*109/L。问需要调查多少人（双侧α=0.05）
z 1 1 / k p(1 p )
2
p e
pc
2
pe k pc p 1 k
N=111.4≈112（k=0.75）
两样本率较为复杂的一个公式
• 样本量相同时
α水平相应
的标准正态差对照组发生率
N
[z 2P(1 P ) z Pc(1 Pc ) Pe (1 Pe)]2 (Pc Pe)2
z p 1 p N 2
2
• P为总体率，δ为允许误差，即允许样本率和总体率的最大
容许误差为多少。
• 例5：某口腔医院研究青少年龋齿发病情况，拟了
解某市青少年龋齿患病情况，期望误差在平均患龋齿率30%的1/6范围内，当α=0.05，问需要抽样调查多少人？
• z0.05=1.96 • P=0.3
• Δ=0.3/6=0.05
z p 1 p N 2
2
n=(1.96)2(0.30)(1-0.30)/(0.05)2=322.7
27
2.2.2 样本率与总体率比较
• 当目标事件发生率为0.2-0.8（0.3-0.7）时，用下列公式
N
(z z ) P 1 P
一类错误α
• 一般取0.05
• Ⅰ型(或假阳性)错误的概率 • 有单侧检验还是双侧检验之分
把握度1-β
• 一般取0.8、0.9、0.95 • 即组间确有差别，则在100次试验中能发现 • 此差别的平均概率 • 检验效能不宜低于0.75 • β一般取单侧Z值
15
计算机模拟举例1
• 假设： • -试验组死亡率为20%
n
z z 1 1 / k
2
2

2

e
2
( se k sc ) /(1 1 / k )
2
2
均数吲达帕胺安慰剂 17.1（
x） 9.9（ x ）
c
8.175（
s） 3（ s ）
e c
标准差
设k=0.7 n=20 kn=14
2.2 二分类资料的样本含量估计
• 2.2.1 估计总体率（抽样） • 当目标事件发生率为0.2-0.8（0.3-0.7）时，用下列公式
7
按试验类型
• 估计总体
• 样本与总体比较
• 配对资料 • 两样本比较 • 多样本比较
主要变量的性质
• 分类变量 • 数值变量 • 一般情况下，分类变量所需要的样本量多于数值变
量
9
按结局指标
• 计数（定性）指标
死亡与存活，阳性与阴性，正常与异常
• 计量（定量）指标
血压、血糖、血清酶
• 结局指标有多个时，估计样本含量时需要选择其中
第八讲医学研究样本含量的计算方法
2
一、为什么要计算样本量？
• 理论上，验证某一干预措施与对照之间的差异，样
本量越大，试验结果越接近于真实值，即结果越可靠。
• 大样本试验还有助于探讨亚组疗效，发现罕见结局
。
• 临床试验报告中有无预先的样本量估计是评价试验
质量的重要依据之一。
3
为什么要计算样本量？(续)
p ( p1 p2 2 p) / 2

本设计至少需要观察235例
30
2.2.4 两样本率比较
• 例8：某医师研究某药对产后宫缩痛、外阴创伤痛
效果，预试验旧药镇痛率为55%，新药镇痛率为75% ，当α=0.05，β=0.1时需要观察多少例能说明新药镇痛效果优于旧药？
N
z
最重要的结局指标。或按照所需样本量最多的指标。
10
分类计算
• 数值变量资料的样本含量估计 • 无序分类资料的样本含量估计

e商务文档

8.样本含量的计算

相关文档推荐：