当前位置:文档之家› 第12章 实验设计

第12章 实验设计

12 实验设计中山大学公共卫生学院 医学统计学与流行病学系 骆福添★ 前面学过变量的统计分析方法,例如: t S t x S x fxa ± ± 可简称数据分析方法。

数据怎么来的 ??12.1 实验设计的概念【例】1987 年某产科医师为研究胎次与儿童智力的关系,收集病案资料(考上大学人数) :第一胎 19 人、第二胎 18 人、第三胎 10人、第四胎 7 人、第五胎 4 人。

由 此得出结论:智力与胎次有关,胎次愈多智力愈差,第一胎智力最好。

?? 科研设计就是制订科研工作计划科研设计包括专业设计和统计设计两部分 (高血压病因)为制订好统计设计-搜集数据的计划,有必要回顾一下统计学要点(附件) 统计设计类型:· 实验研究 因®果。

动物实验证实病因/效应,如启东肝癌动物实验。

正向推理· 临床试验 因®果。

临床观察验证/探索[n 小或回顾],如新药"A 脂"降脂。

正向推理 · 调查研究 果®因。

疾病分布探索病因,如中山NPC 病因。

逆推理(置信度)【例】某研究所有这样一个研究目的:希望考察“A 脂”的降血脂的疗效。

拟选择 40 只 小鼠作为实验研究对象,考察 A 脂(用 20 只小鼠)与公认有效的降血脂药物“洛伐 他丁”(用 20 只小鼠)降低血脂的疗效之间的差别是否有统计学意义,以 LDL(低 密度脂蛋白)为评价疗效的主要指标。

具体实施方法如下:· 根据预实验和前人的经验,获得关于估计动物只数所需要的基本信息,并估算出每 个药物组所需要的最低小鼠数为 20 只,两个药物组共需要 40 只小鼠;先将小鼠喂 以高脂饮食,使其达到高脂血症状态(称为造模),待造模成功(即指标 LDL 高于 某特定数值)后,采取非人为的方法(即随机化法)将 40 只小鼠均分入 A 脂组和 洛伐他丁组,分别服用相应药物一段时间(药物有规定的剂量和用法),测出每只 小鼠 LDL 值的改变量(即用药前的 LDL 值减去用药后的 LDL 值)。

选用适当的统计 分析方法分析两组小鼠的 LDL 改变值, 从而得出关于两种药物疗效之间差别是否具 有统计学意义的结论。

若两种药物疗效之间的差别无统计学意义,仅从降血脂的疗 效角度看,可以初步认为:能用新药“A 脂”取代现在公认的降血脂药物“洛伐他丁”。

主要内容:(1)选择什么作为受试对象(本例为小鼠); (2) 如何确定样本含量 (应按已知条件和设计类型估计合适的样本含量, 本例 N=40); (3)如何设立合适的对照组(本例以洛伐他丁药物为对照药); (4)确定拟考察的实验因素(本例为药物的种类,即 A 脂与洛伐他丁); (5)确定实验效应(本例通过测定血脂指标 LDL 的改变值来反映药物的疗效); (6)采取科学的方法对受试对象分组进行分组,通常是完全随机化方法(即非人为 因素影响的分组方法);(7)确定合适的实验设计类型(本例将受试对象随机分为两组,称为成组设计)。

· 从这些内容中可以提炼出构建实验设计的三大支柱: 实验设计的三要素 (受试对象、 实验因素、实验效应)、实验设计的四原则(随机、对照、重复、均衡)和实验设 计类型。

12.2 实验设计的三要素·“要素”即关键,缺一便不成为研究Luo Nov­08: 【例】黑米皮 对家兔 动脉粥样硬化的抑制作用。

(因素) (对象) (效应)12.2.2 实验因素· 处理因素:根据研究目的确定的欲施加或欲观察的因素,简称处理或因素(factor) · 实验性∕观察性:施加的或客观存在的(如婴儿母乳喂养) · 处理∕协变∕混杂: Luo Nov­08: 观察项目 作用类别 统计分类 黑米皮、白米皮、对照 外加因素 研究因素、处理因素(3 水平) 性别、体重 内在因素 混杂因素、协变量 进食量 偶然因素 协变因素、协变量 处理因素:研究的主要因素协变因素:影响处理因素效应的因素(协同效应)混杂因素:一是非研究因素(早有定论,如年龄、性别等)二是确实有作用(不均衡,目测判断∕P<0.05)·要求:(1)分清处理因素和混杂因素 (2)保持处理因素恒定不变(3)尽量用单因素设计(控制/均衡 协变因素)12.2.1 受试对象2010-10-30 羊城晚报:2006 年起,河南省平顶山市将“幸福指数”作为考核官员的指 标。

《河南商报》11 月 29 日报道平顶山市统计局长说“幸福指数高并不代表每个公 民就幸福了,这只是通过统计学来测量一个地方的社会综合发展状况” ,…“把所有 个体感受都加进来,都没法做指数了。

”· 受试对象:或称研究对象是处理因素作用的客体,是根据研究目的确定的研究总体 · 对象选择:(1)个体:动物、个人、器官(眼) (组织、细胞、分子-常忽略误差) (2)标准: (动物模型/人体)适应症:病种、病情、病程 (大范围)纳入标准:同质性,反映平均效应 (年龄、志愿、总分) 排除标准:禁忌症,保证安全性 (孕妇、器质性病变)剔除标准:误纳、新发禁忌症、信息缺乏(年龄虚报、新近怀孕、从未复诊)12.2.2与12.2.1位置对调12.2.3 实验效应· 实验效应:是处理因素作用于受试对象的反应(response)和结局(outcome)· 效应指标:要求(1)客观性:效应指标要观指标,主观指标要数量化(2)精确性:包括准确度和精密度(3)特异性和灵敏性:特异度=真阴性 (贫血↔HB)灵敏度=真阳性 (贫血↔HB)(4)指标的观察:要避免偏倚,必须盲法( “面子疗效” )12.3 实验设计的四原则·“原则”即规则,违规使研究结果偏性(还算“研究”)· 必须遵循的原则:对照、均衡、随机、重复12.3.1 对照原则· 对照作用:分离处理效应(如小鼠毒物实验)· 对照要求:应满足均衡性(后述)· 对照种类:(1)空白对照:对照组无任何处理(非盲)(2)标准对照:常规、参考值(3)自身对照:前后对比、左右对比(4)相互对照:不同处理组之间(5)实验对照:对照组常规处理,实验组附加因素(6)历史对照:历史上同类(同一)研究作为对照12.3.4 均衡原则• 均衡是指各处理组的协变量“齐同”∕一致,使样本有代表性• 设计时:对均衡性提出要求(1)差值限度:如年龄平均差 2 岁,性别构成差 10%(2)检验水准:如规定双侧检验、检验水准 =0.20• 分析时:对均衡性进行核查(1)描述:所有资料,要对组间均衡性作统计描述(2)检验:对于很大的样本,可作假设检验12.3.3 随机原则· 随机:即“公平”,使每个受试对象有同等的机会被抽取或分到不同的组· 随机是手段、均衡和代表性是目的· 随机≠随便,任何随便都不是随机的· 随机方式:(1)随机抽样:每个个体都有相同机会被抽中(2)随机分组:每个受试者被分配到各组的机会相等(3)随机顺序:每个受试者先后接受处理的机会相等· 随机方法,例如 20 只白鼠随机分为 A 组和 B 组(1)编号:将n个受试对象编号。

1~20号(2)取随机数:随机表、计算器或计算机获得。

得20个随机数、排队编秩号(3)确定组别:根据受试对象获得的随机数决定。

秩号单数为A组,双数为B组12.3.2 重复原则· 即样本含量。

重复是指实验组和对照组的实验单位应具有一定的数量· 广义来讲,重复包括三种情形:(1)整个实验的重复:即实验的可重现性(正宗定义)(2)用多个受试对象进行重复:换言之, 要有足够的样本含量(简化)· 为了可重现性好 à 必须误差要小 à 必须样本量足够大。

· 每组:探索性30、有效性100、安全性1000(3)同一受试对象的重复观察:例如测血压 3 次,均数作为最终结果(设计类型)12.4 实验设计类型12.4.1 单因素设计在实验研究中所考察的的实验因素只有一个,其水平数或多或少,视具体情况而 定。

当考察的实验因素的水平数k=1 时,叫做“单组设计(a single group design)”; 当k=2 时, 可分为“配对设计(a paired design)”和“成组设计(a two-group divisible design)”;当 k³3 时,叫做“单因素多水平设计(one-way design with multiple levels)”。

12.4.1.1 单组设计相当于标准对照设计(给定标准值或理论值)例 12-1 已知我国婴儿平均出生体重为 3309 克,现调查某低经济状态地区某医院产 科病房中足期分娩的 100 例活婴的平均体重为 2900 克,问是否该地区上述医院足 期分娩的活婴平均体重低于全国平均水平?(测得的具体数据从略)。

12.4.1.2 配对设计· 主要指自身对照设计(前后对比、左右对比)· 动物:同窝动物可配成对子· 人:一般不宜配成对子 (病例对照研究有不同个体“配对” ,匹配差些不要紧。

不管怎样,其结果都是很初步的、“大海捞针”似的)例 12-2 欲研究某药物在体内抗乳腺癌的作用,选取 10 只已诱发乳腺肿瘤的大鼠皮 下注射该药物,一段时间后观察每只大鼠乳腺肿瘤体积,数据列在下面。

问治疗前 后的乳腺肿瘤体积之间的差别是否有统计学意义。

问该研究属于何种实验设计类 型?大 鼠 编 号 1 2 3 4 5 6 7 8 9 10治疗前体积(cm 3 ) 4.3 5.1 4.9 5.8 6.1 4.5 5.5 4.2 4.9 5.2治疗后体积(cm 3 ) 3.1 4.2 4.5 5.1 4.8 6.1 5.3 3.1 3.5 5.112.4.1.3 成组设计· 相当于相互对照设计,或实验对照设计· 成组设计有两种情况,一是从同一总体中随机抽取两个样本,分别接受两种不同的 处理; 另一是分别从两个总体中各随机抽取一个样本, 接受同一种处理。

例如,……, 只能从男性、女性两个子总体中分别随机抽样(Luo:“总体”改为群体好些,如果 知道“总体”就不用统计检验了)12.4.1.4 单因素多水平设计·“多水平”是个新词,是指按某特征数量等级分组(如高、中、低)· 以往将“多水平”等同于“多组”,忽略了“数量组”特性12.4.2 随机区组设计· 随机区组设计(a randomized blocks design)是配对设计的扩展。

相关主题