样本含量估计56480
含量越大。
容许误差δ
➢ 即预计样本统计量和相应总体参数的最大相应误差控制在 什么范围。即本研究有研究意义或临床实际意义的最小差 值。计量资料,δ为两均数差值或实验前后差值。计数资 料,δ为具有实际临床意义的有效率或患病率等差值。其 他条件确定的情况下,δ越小,所需样本含量越大。
确定样本量的方法---计算法
临床试验计数资料结局根据假设检验可能出现的结果
➢I类错误的概率:单侧为α,双侧为α/2,α越小所 需样本越大,一般取α≤0.05; ➢检验效能:1-β,β为II类错误,一般β=0.1或 β=0.2,β越大,检验效能越低,样本数量也越小;
总体标准差σ和总体率π
➢ 总体标准差σ反映计量资料总体中各观察单位计量值的变异 程度。如:计量(定量)指标血压、血糖、血清酶等。
1.2 估计总体率所需样本含量
例2:某口腔医院研究青少年龋齿发病情况,拟了解
某市青少年龋齿患病情况,期望误差在平均患龋
齿率30%的1/6范围内,当双侧α=0.05,问需要抽
样调查多少人?Nu2
p1p
2
ua/2=u0.05/2=1.96 p=0.3 δ=0.3/6=0.05 n=(1.96)2(0.30)(1-0.30)/(0.05)2=322.7≈323
➢ 总体率π反映计数资料总体率的变异程度。如:计数(定性 )指标死亡与存活,阳性与阴性,正常与异常等。
➢ 通过以往的实验得出的经验或查阅文献资料作出估计。 ➢ 如无依据,可从研究者所作的预备实验结果中获取的样本的
标准差s或样本率P分别作为σ和π的估计值。 ➢ 在其他条件相同的情况下,σ越大,π越接近0.5,所需样本
u 少人?(双侧α=0.05) 2 2
n
2
uα/2=1.96(查界值表所得) σ=1.5 δ=0.2 n=(1.96)2(1.5)2/(0.2)2=216.1≈217
1. 单纯随机抽样样本含量的估计
率 1.2 估计总体率所需样本含量公式
Nu2
p1p
2
❖ P为总体率π的估计值,若π同时有几个估计值供参考,应 取最接近0.5者;若对总体一无所知,亦可设π=0.5。因为 此时π(1-π)=0.52=0.25为最大,以免样本量n过小。δ为 允许误差,即允许样本率和总体率的最大容许误差为多少。 α取双侧,uα值可以查表。
u 2
2
n
2
❖ σ为总体标准差,一般用样本标准差s表 示;δ为容许误差,即样本均数与总体 均数间的容许差值;α取双侧,u值可以 查表。
1.1估计总体均数所需样本含量
❖ 例1:某医院拟用抽样调查评价本地区健康成人白细胞数
的水平,要求误差不超过0.2*109/L。根据文献报告,健
康成人的白细胞数的标准差约1.5*109/L。问需要调查多
2.实验研究设计样本含量估计
2.1 样本均数与总体均数比较(或配对设计均数比较)公式
u u nຫໍສະໝຸດ 222n 为所需样本含量,如为配对设计时n为对子数。 ua是检验水准a所对应的u值,查表可得。 uβ是第二类错误的概率β相对应u值,查表可得。 δ=µ1-µ0为研究者提出的差值,µ0为已知的总体均数, µ1为估计实验结果的总体均数。 σ用样本标准差s代替。
地区性研究:平均样本人数500-1000人; 全国性研究:1500-2500人 描述性研究:样本最少占总体的10%,如果总体较小,则最
少占总体20% 相关性研究:受试者至少30人以上
确定样本量的方法---计算法和查表法
❖ 样本含量估计常用的两种方法。
❖ 需要提前确定以下参数:
TEXT
α
1-β
σ和π
检验效能(1-β)
又称把握度,为1-β,即在特定的α水准下,若总体参数 之间确实存在着差别,此时该次实验能发现此差别的概率。β 即假设检验第二类错误出现的概率,为假阴性错误出现的概 率。检验效能即避免假阴性的能力,β越小,检验效能越高, 所需的样本量越大,反之就要越小。β水平由研究者具情决定 ,通常取β为0.2,0.1或0.05。即1-β=0.8,0.9或0.95,也 就是说把握度为80%,90%或95%。
2.1.1 样本均数与总体均数比较
例3:已知某地成年男性的血红蛋白含量(135±15)g/L,
拟在当地煤矿工人中对成年男性进行抽样调查,研究
煤矿工人的血红蛋白量水平与当地一般成年男性无差
异。根据专业医学知识,当血红蛋白含量相差10g/L以
增加研究困难 难于控制条件 浪费人力物力
估计样本含量的目的
❖ 在保证某项研究/临床试验的结论具有一定科 学性、真实性和可靠性前提下,确定某研究所 需的最小观察例数。
确定样本量的方法
❖ 经验法 ❖ 查表法 ❖ 计算法 ❖ 计算机软件协助
确定样本量的方法---经验法
❖计量资料:30-40例 ❖计数资料:50-100例 ❖调查研究在100以上:
第五章总体和样本
第一节基本概念 第二节抽样过程及方法 第三节样本含量估计
第三节 样本含量估计
样本含量估计的目的 确定样本量的方法
样本含量估计的注意事项
样本含量(sample size)
按照总体客观存在的性质与特征和 研究者所欲承担的误差风险而决定的最 小样本量。
样本含量过小
样本含量过大
指标不稳定 检验效能低
❖ 通过数学公式估算出所需样本含量。其计 算公式往往是根据检验统计量的公式反推 过来求样本含量。
❖ 研究的性质不同、研究的科研设计不同、 抽样方法不同,估计样本量的计算公式也 不同。
❖ 不同的检验方法都有确定样本含量的方法 计算公式。
1. 单纯随机抽样样本含量的估计
1.1估计总体均数所需样本含量公式
δ
检
检
总总
容
验
验
体体
许
水
效
标率
误
准
能
准
差
差
检验水准(a值)
即假设检验第一类错误出现的概率,也称假阳性率,,即检验水 准或显著性。α越小,所需的样本量越大,反之就要越小。α水平由 研究者根据具体情况决定,通常α取0.05或0.01。 ❖ 另外还应明确是单侧或双侧检验。
用统计学检验时,当研究结果高于和低于效应指标的界限均有 意义时,应该选择双侧检验,所需样本量就大;当研究结果仅高于 或低于效应指标的界限有意义时,应该选择单侧检验,所需样本量 就小。当进行双侧检验或单侧检验时,其α或β的U界值通过查标准 正态分布的分位数表可得。