当前位置:
文档之家› 第四讲医学实验设计原则与方法
第四讲医学实验设计原则与方法
文章编号: 1000- 4955( 2005) 04- 0472- 02
实 验 设 计 的 思 想 由 R.A. Fisher 创 立 。20 世 纪 初 , Fisher 在 Rothamsted 农 业 站 工 作 的 14 年 中 ( 1919 ~1933) , 最 先 接 触到的一大批数据( 用同一方式施肥达 60 年的 13 块田地的 日降水量及年收获量) 被他称为在"粪堆上受罪", 当时 Fisher 很快被引入到这样一个问题, 即如何进行实验才能够得到课 题的明确答案? 正是从这批有严重缺陷的数据中产生了最重 要的结果— ——实验设计的发明。Fisher 提出了随机化、重复试 验 和 区 组 等 思 想 , 并 于 1921 年 出 版 了《Statistical methods for research workers》一书。10 年后这些思 想 被 用 到 了 生 物 医 学 实验中。
实现随机化的方法有很多, 但以利用随机数字表和计算 机产生随机数进行编程的方法最为规范。在动物实验中, 由 于例数相对较少, 为方便进行可采用查随机数字表的方法; 临床或现场干预试验规模大, 最好采用计算机编程或使用现 成软件的方法, 一般由统计专业人员协助完成。 1.3 重复原 则 : 单 个 个 体 的 试 验 具 有 一 定 的 偶 然 性 , 也 无 法 估计抽样误差。不可否认, 一些典型的个案是非常有意义的, 因为只有在详细、定性描述的基础上, 才能进行统计学工作。 但是由于生物个体的变异性, 如果需要揭示和表现医学中一 些特有的规律, 则必须有一定的样本量。对一项具体研究而 言, 样本量究竟需要多少? 这是实际中常遇到的问题。样本量 太少, 处理效应被自身变异所遮掩, 无法表现出来; 样本量过 大, 会造成不必要的浪费, 甚至难以完成, 因此要正确地估计 实验所需要的样本量。 2 实验设计的基本内容 2.1 确定研究项目( 处理因素) : 研究项目与要解决的问题有 着密切的联系, 应根据不同问题建立所要验证的各种假设。 研究项目有探索性和验证性两种, 探索性项目一般是动物实 验或早期临床试验, 研究目的并不一定是对预先提出的假设 进行简单检验, 可采用灵活可变的方法进行设计; 验证性研 究多限于临床和现场的干预研究, 主要是对提出的假设提供 坚实的论据, 应坚持按照试验方案及标准操作步骤进行, 对 实验设计的要求较高, 而且试验的主要方面( 包括质量控制 和统计分析) 须在研究方案中陈述。项目的选择对科研水平 有决定性的意义, 应保证最低目标能够实现。 2.2 拟定观察指标( 变量) : 应尽量选择对说明处理效果最有 意义, 并具有一定特异性、灵敏性、客观性的观察指标。观察
临床试验需要分期进行, 不同试验期所需要的样本量不 同 : Ⅰ期 试 验 可 以 在 20 例 以 下 , 一 般 选 用 正 常 人 , 主 要 分 析 药代动力学和人体对药物的耐受情况; Ⅱ期主要是探索性试 验, 对药物或营养品的效果和安全性做初步的研究, 一般要 求 在 100 例 以 上 , 可 以 设 对 照 组 ; Ⅲ期 是 对 疗 效 和 安 全 性 的 验 证 性 试 验 , 要 求 在 300 例 以 上 , 同 时 必 须 设 置 至 少 100 例 的对照组。 2.4 设计类型 及 分 析 方 案 : 同 一 项 研 究 可 有 多 种 设 计 方 案 , 如 何 选 择 可 根 据 处 理 因 素 的 多 少 结 合 实 际 情 况 决 定 。具 体 可 以从三个方面考虑: ①采用序贯方法还是固定样本数的方 法; ②如何分配受试对象进入试验组和对照组( 选择设计模 型) ; ③如何进行统计学分析。 3 常用实验设计方法 3.1 完全 随 机 设 计 : 将 受 试 对 象 编 号 后 随 机 分 配 到 两 组 或 多组, 然后给予不同的处理。这种设计的假设与其他设计相 比要简单得多, 易于操作, 统计分析也较简单, 是实际中最常 用的实验设计方法; 缺点是组内误差较大, 在个体变异较大 而样本量又较小的情况下, 各组的非处理因素分布不易均
如何做实验很有学问, 例如一个 8 因素 3 水平的抗生素 培 养 基 试 验 , 有 38 = 6 561 种 组 合 , 按 照 析 因 设 计 每 种 组 合 至少重复一次, 需要做 6 561 ×2 = 13 122 次试验, 而用正交 设计则只需 27 次试验。另外, 医学实验不同于一般的理化实 验, 实验的结果最终要用到人身上, 如果结果出现错误, 可能 会对人 体 造 成 伤 害 。1962 年 美 国 明 尼 苏 达 医 院 的 外 科 教 授 Wagensteen 根 据 动 物 实 验 结 果 认 为 , 将 胃 冷 冻 在 - 10 ~- 5 ℃能 明 显 减 少 胃 酸 分 泌 , 相 当 于 胃 切 除 手 术 , 随 后 在 对 24 名胃溃疡病人进行胃冷冻的治疗过程中, 多数病人症状改 善、溃疡愈合, 由此做出了肯定胃冷冻方法的结论, 并在学术 会上进行报告。该治疗方法曾风行一时, 先后制造胃冷冻机 2 500 台 , 治 疗 上 万 人 , 但 最 终 却 被 正 确 的 临 床 试 验 所 否 定 。 实际工作中, 要高效、合理地安排实验, 最大限度地获得资料 并不简单, 需要弄清楚有关实验的目的和全部想法。 1 实验设计的基本原则 1.1 对照原则 : 处 理 与 非 处 理 之 间 要 有 一 个 科 学 的 对 比 , 如 治疗老年慢性支气管炎, 患者从二月份开始连续服药, 半年 后多数患者的各种症状明显减轻, 究竟是药物的作用还是由 于气候转暖的原因呢? 在实验中如果没有其他条件相似的对 照组, 很难肯定实验药物的作用, 即使是安慰剂, 也可能会出 现一定的疗效。1950 年 Best 发表了下述的研究结果: 有人用 X 线照射脑垂体治疗高血压, 得 到 了 良 好 的 效 果 , Best 为 了 验证这一结果, 将高血压患者随机分为两组, 实验组 25 人采 用 X 线照射脑垂体进行治疗, 对照组 18 人采用假照射, 结果 治疗组的改善率为 68.0%, 对照组的改善率为 77.8%, 从而说 明高血压的改善并不是由于照射 X 线的结果。
衡, 降低了结果的可靠性。当实验组与对照组不均衡时, 可以 采用协方差分析方法。 3.2 配对 或 随 机 配 伍 组 设 计 : 将 实 验 个 体 按 照 条 件 相 近 的 原则组成对子或配伍组( 如同一窝别的动物) , 再将不同的处 理按不同的方式随机安排在不同组内, 使结果的比较变成组 内比较, 从而减少了实验误差。与完全随机设计相比, 配伍组 设计能进一步保证非处理因素在各处理组中分布均衡, 并将 配伍组的影响在方差分析时从组内误差项中分解出来, 减少 了误差均方, 使处理组间的 F 值更容易出现显著性。 3.3 析因设计 : 是 一 种 多 因 素 实 验 设 计 方 法 , 即 通 过 处 理 的 不同组合, 对两个或多个处理因素同时进行评价, 一般要求 每 种 处 理 的 例 数 相 同 。这 种 设 计 适 合 同 时 对 多 个 处 理 因 素 的 效应进行研究, 尤其各种因素的相互影响( 交互作用) 。最简 单的是 2 ×2 析因设计, 即有两个因素( A 和 B) , 每个因素各 有两个水平, 组合起来共有 4 种不同处理。分析的基本思路 是 进 行 变 异 分 解 , SS 总= SSA + SSB + SSA×B + SS 误 差, 其 中 SSA×B 表示 A 和 B 两个因素的交互效应, 算出各项均方与误差均 方的比值 F, 由此判断其显著性。 3.4 正交设计 : 析 因 设 计 是 各 因 素 不 同 水 平 的 全 面 组 合 , 当 因素较多时( 如超过 4) , 由于组合产生的处理数急剧增加而 难以实现, 此时采用正交设计方法可以明显减少样本量。正 交设计需要利用规范的正交表 ( 可以在一些工具表中查到, 也可以利用现成的统计软件如 SPSS 来获得) , 结果的统计分 析 也 需 要 依 据 正 交 表 进 行 。正 交 设 计 与 析 因 设 计 的 统 计 分 析 方法基本相同, 可以筛选出不同因素和水平的最佳组合, 但 只能对部分交互作用进行分析。 3.5 重复 测 量 设 计 : 重 复 测 量 通 常 指 某 一 项 指 标 在 不 同 时 点进行多次测量, 例如比较两种药物治疗高血压的效果, 治 疗过程中 0 ~8 周重复测量 9 次血压, 如果在统计分析时只 分析最后一次测量结果, 将会丧失很多过程信息, 比如测量 指 标 的 时 间 变 化 趋 势 、药 物 在 血 中 达 到 的 最 大 浓 度 、治 疗 效 果的时间作用等。重复测量设计在实际工作中经常遇到, 科 研论文中这类数据的统计分析和表达误用的情况极为严重, 主要表现在对各时点的测量结果进行多次 t 检验或方差分 析, 增大了假阳性错误, 对此应利用各种统计软件提供的分 析工具做重复测量方差分析。 3.6 其他设计 : 除 上 述 常 用 的 设 计 方 法 外 , 科 研 中 还 有 交 叉 设 计 、拉 丁 方 设 计 、序 贯 设 计 , 以 及 裂 区 设 计 、不 完 全 析 因 设 计 、嵌 套 设 计 、平 衡 不 完 全 配 伍 组 设 计 、均 匀 设 计 等 复 杂 实 验 设计方法。对于一些重要的实验, 研究者应一开始就与生物 统计专业人员合作共同做好研究设计。
对照的设立主要要求均衡性要好, 即除研究的处理因素 外, 其他实验条件应尽可能的一致。对照有多种形式, 如外部
作者单位: 150086 哈尔滨医科大学医学统计学教研室 作者简介: 李康( 1957- ) , 男, 黑龙江省哈尔滨市人, 博士, 教授, 博士生导师, 主要从事医学统计学方法与应用研究
对照( 早些时候记录良好的观察对象) 、历史对照、自身对照、 平行组对照等。平行组对照在实际中采用得最多, 它既可以 是阳性或安慰剂对照, 也可以是量效平行对照; 外部对照和 历史对照( 有时也称之为无对照实验) 由于比较的基线不同, 论证强度差, 通常是不可取的; 自身对照要求前后相隔时间 不能过长, 并且最好同时增加一组平行对照。 1.2 随机原则: 按照设计类型对实验个体随机进行分组或安 排实验顺序。随机不是随便, 不能凭主观决定实验个体的分 组, 正确分组是保证均衡性的关键。例如, 在比较保守疗法与 手术疗法对胃溃疡合并穿孔治疗的疗效时, 把那些不伴有休 克 、穿 孔 范 围 小 的 患 者 分 到 保 守 疗 法 组 , 而 把 那 些 全 身 状 况 严重、穿孔范围大、不得不进行手术的患者分到手术组, 其结 果 必 然 掩 盖 两 种 疗 法 之 间 的 差 别 。正 确 的 做 法 是 要 保 证 两 组 患者条件一致, 如将所有受试对象限制为病情较轻的患者。