样本量
样本量估算的依据 样本量估算方法 样本量的说明方法 样本量合理性的判断 减少样本量的方法
确定样本含量时应当具备的条件
• 定出检验水准(α)
• 提出所期望的检验效能(1- )
• 必须知道由样本推断总体的一些信息
–允许误差
–总体变异度指标
检验水准(α)
• 统计学检验绝大多数的时候是p<0.05为差 异有统计学意义,那么α=0.05
• 相应的公式中Z α/2=1.96,Z α=1.645 • 以常数形式出现
检验效能(1- )
• 一般取90%和80%,相应的=0.1或0.2。 • Z =1.282或Z =0.842
• 1-又称为把握度,是指预期的估计与实际
的研究结果一致有多大把握 • 以常数形式出现
允许误差
–调查研究时,允许的误差 –非劣效检验时,临床认可的差距 –优效性检验时,两组的差距
抽样调查—— 整群抽样时样本含量的估计
• 整群抽样的样本含量估计方法:
先使用单纯随机抽样的方法估计出n,然后 乘以设计效率k即可(如果整群抽样的方差是 单纯随机抽样的k倍,就确定设计效率为 k) 。
至于抽取的群的数目以及每群的平均大小 ,还涉及群间的变异与费用大小。
组间均数比较—— 样本均数与总体均数比较
样本量估算
样本量的估算是指研究结论在一定可靠性(检验效 能)的基础上确定最少的观察单位数。
当各对比组例数相等时检验效能最高,因此多数情 况下都是按各组样本含量相等来估计。
在个别情况下,也可能要求各组样本含量按一定比 例来估计。
在同样的要求和条件下完全随机设计所需样本含量 最大,故一般要按完全随机设计估计样本含量。
总体变异度指标
• 计量资料是均数和标准差 • 分类资料是各分类的百分比
样本量估算的依据 样本量估算方法 样本量的说明方法 样本量合理性的判断 减少样本量的方法
样本量估算方法
凭经验估计 查公式手工计算
•Excel——函数
软件实现
• SAS——编程 •PASS——自动计算
【例3】据文献报道,高血压患者血清同型半胧氨酸 (Hcy)的均数和标准差分别为15.10 (umol/L)和7.61 (umol/L)。现试验用中西医结合治疗,期望试验结 果至少使 Hcy 平均下降 5 (umol/L),问至少需要观 察多少病例数?
单侧取1.64,双侧取设计
组间率比较—— 样本率与总体率的比较
【例6】已知中医拔罐治疗颈型颈椎病的显效 率为65%,现试验一种特色药罐法,预计 有效率为90%,求所需例数。
组间率比较—— 配对设计分类资料
【例7】已知金黄色葡萄球菌接种于甲、乙两种培养基 的=。0现结.0准果5 备如,研下甲究:培甲一养培种基新养阴的基性阳与、性该乙、菌培乙种养培相基养似阳基的性阴菌的性种π的,-+ 问π =0需+.-2观5 察多少样本对子数?
组间率比较—— 两样本率比较
【例8】某医院用中医治疗、中西医结合治疗两种方 法治疗慢性气管炎患者,经初步观察,用中医治 疗组的近控率甲药为 35 %,中西医结合治疗为 45 %。现拟进一步试验,间每组需观察多少例, 才可能在 α= 0.05 的水准上发现两种疗法近控率 有相差?
• 配对设计包括异体配对、自身配对、自身 前后配对及交叉设计的自身对照,均可按下 列公式进行样本含量估计。
【例4】某研究者欲了解中药的降血糖效果,以年龄 、性别、病情和病程作为配对条件,随机将患者 分配到常规治疗组和中西医结合治疗组,各对子 的血糖平均差值为 2.5mmol/L,标准差为 2.0mmol/L ,为了进一步观察该中药的疗效,问: 需要观察多少病例数?
抽样调查—— 分层随机抽样时样本量估计
• 分层随机抽样样本含量计算步骤: (1)求分层随机抽样总体参数估计值:参数估计值
为对各层的参数估计值进行加权平均(权重为各层 在总体中所占的比例)。 (2)根据单纯随机抽样的样本含量计算式估计样本 含量。 (3)根据各层的大小按比例分配各层样本量。
样本量
临床评价分析中心 季聪华
医学研究的基本要素
研究对象 研究因素 效应指标
研究因素
研究对象
效应指标
解释专业问题
研究因素
研究对象
非研究因素
效应指标 解释专业问题
医学研究的基本原则——对照
研究因素
研究对象
效应指标
研究对象A
研究对象B
研究因素 + 非研究因素 非研究因素
对照原则
医学研究的基本原则——均衡
•软件下载地址: •/pass.html
常用的样本估算方法
抽样调查 组间均数比较(均数±标准差) 组间率的比较(百分比) 直线相关(相关系数r) 多因素分析 生存分析(中位生存时间) 病例对照研究(OR) 队列研究(RR)
抽样调查—— 单纯随机抽样和系统抽样时样本含量的估计
研究因素
研究对象
效应指标
? 研究对象A =
研究对象B
非研究因素
随机、均衡原则
医学研究的基本原则——重复
研究因素
研究对象
效应指标
研究对象A
研究对象B
各1例?
重复原则
重复多少是合适的?
• 样本量太少,不能得出有统计学的意义的 结果。
• 样本量太多,资金、工作量、病人来源、 周期、伦理等不许可。
• 权衡的方法——样本量估算
【例1】若用单纯随机抽样的方法了解某医科大学大 学生SCL-90的平均水平,该大学有在校学生15000人 ,允许误差不超过5分,根据预调查结果,医学生 SCL-90总分的标准差为39.2分,取α=0.05。问需要 调查多少医学生?
【例2】某校医预调查该校医学生的失眠患病率,如 果文献报道医学生的失眠患病率为15%,允许误 差不超过5%,取α=0.05。先用单纯随机抽样的 方法了解该校医学生的失眠患病率,间需要调查 多少人?
组间均数比较—— 两样本均数比较
【例5】某医院欲研究中药治疗某病的临床疗效,以 血沉作为疗效指标,临床预试验该中药可使病人 血沉平均下降3.4 mm/h,标准差为1.2mm/h,西 药可使病人血沉平均下降4.8mm/h,标准差为 2.5mm/h,为了进一步观察该中药的疗效,问: 需要观察多少病例数?