常见统计学错误(2013)
6.5
胆固醇(mg%)的对数
6.0 5.5 5.0 4.5 4.0 3.5 实验前
血药浓度(μ mol/L)
处理组 对照组
180 150 120 90 60 30
旧剂型 新剂型
5周后
10周后
0 图22.2
4
8
图22.1 两组家兔血清胆固醇的对数随时间的变化
回归方程: Y=61.786 - 6.886 log(剂量) 决定系数: R2=0.914。
) 数 均 ( 率 菌 噬
对 数 剂 量
为什麽不对? 均数做因变量造成“好”的假象 ! * 回归方程是否有统计学意义与反应的变异状况有关 * 以诸个体反应值的均数作回归计算, 掩盖变异性
正确作法:用个体资料作回归分析
家兔号 1 2 3 4 5 6 7 处理组 实验前 0.744741 0.904141 0.357641 1.077741 0.584441 0.985041 1.050841 5周后 2.013341 2.054141 1.137841 1.948741 1.668441 1.926241 1.638641 10周后 2.621341 1.628441 2.196741 2.239241 0.985041 2.915641 1.225541 家兔号 8 9 10 11 12 13 14 对照组 实验前 0.375741 0.994741 0.598841 0.719741 0.157041 0.861241 0.872141 5周后 0.667841 0.584441 0.955541 1.354241 0.246141 0.882941 0.555041 10周后 0.569941 0.461241 0.598841 1.032441 0.613041 0.757041 0.540041
错在哪里?
哪些指标可能有组间差异,必须心中有数。 科研的结果应当预见 —— 假说是科研的灵 魂 心中无数,不要“先上马再说” 指标多,实验工作量大。 大海捞针—— 碰运气,不是科研 指标多,翻来覆去分析,制造假阳性 Nature杂志统计学指南:常见错误之一
为何翻来覆去分析,会制造假阳性?
常见统计学错误与纠正
---- 设计与分析
方积乾
中山大学公共卫生学院 医学统计与流行病学系
2013年12月
1. 终点指标过多, 大海捞针
临床试验时,不知道哪个指标在组与组间有差 异; “确定某个指标后,万一组间没有差异,岂 不被动!” 生理、生化、组织学、基因,都做; “内容丰富,显得水平高!” 许多仪器一下子可以做许多项目; “许多项目一一分析,哪个有意义,就报告 哪个指标标”
90
80
噬 菌 率 ( 原
70
60
50
40
30
始 数 据
20 -.5 0.0 .5 1.0 1.5 2.0 2.5
对数剂量
回归方程: Y = 61.782-6.884 log(剂量) 决定系数: R2=0.095 回归方程无统计学意义,无剂量-反应关系!
6. 重复测量资料不能时点间两两比较
例 各取7只兔子,分别以正常食物和待研究食物喂 养,在实验前、喂养5周、10周后,各取血测量其中 胆固醇浓度,自然对数转换后, 数据见表22.1, 问血清 胆固醇浓度随时间变化的趋势是否受该食物影响。
2
2
2
5.剂量-反应关系 不能作均数比较或回归
例 有人分析蛇毒因子(CVF)的剂量对血液白细 胞噬菌率的影响,得如下数据,欲讨论剂量-反应 关系。
组数 1 2 3 4 5 6 CVF 剂量 0 10 20 40 80 160 例数 5 5 5 5 5 5 噬菌率(均数) 60.0±17.0 57.0±15.2 54.0±16.6 51.0±17.2 48.0±16.0 45.0±16.4
Nature常见错误之一
多重比较: 对一组数据作多项比较时,必须 说明如何校正α 水平,以避免增大第一类错 误的机会
应当如何?
主要终点(primary end point) :只能一个 次要终点(secondary end point) : 可以几个, 但勿过多 Bonfferoni 校正 当同一组数据同时作k次分析时,若限定 犯假阳性错误的概率总共不超过 , 则每次分析要用 / k 来控制假阳性的概率。 例
做法 1:单因素方差分析?!
F=0.701,P>0.5, 均数间差别无统计学意义
为什麽不对?
有负初衷 —— 探讨反应随剂量变化的趋势 * 由多个剂量组的比较只能得知均数间是否有差异 * 有统计学差异也不等于有剂量-反应关系
做法 2: 反应的均数关于剂量作回归分析 ?!
62 60 58 56 54 52 50 48 46 44 -. 5 0. 0 .5 1. 0 1. 5 2. 0 2. 5
参加者的流程图 (强烈推荐)
合格对象82例
拒绝参与7例
随机分组75例 分配至实验组38例 接受干预38例
随访例数: 7 周 n=38 , 11 周 n=38 , 15 周 n=38 , 19 周n=36 分配至对照组37例。接受 干预36例,1例因颈部损伤未 接受干预
随访例数:7周n=37,11 周 n=36 , 15 周 n=36 , 19 周n=35
仅分析一个指标时, P(假阳性) 0.05, P(一次分析不犯错误) 0.95 同时分析 2 个指标时, 2 P(两次分析均不犯错误) [ P(两次分析均不犯错误) ]
P(假阳性) 1 - 0.952 1 0.90 同时分析 3 个指标时, P(假阳性) 1- 0.953 1 0.86 0.14 同时分析 10 个指标时, 10 P(假阳性) 1 - 0.95 1 0.60 0.40
2
2 1.96 0.14(1 0.14) 0.84 2 0.20(1 0.20) 2 0.08(1 0.08) 0 . 20 0 . 08 2 1.96 0.14(1 0.14) 0.84 2 0.20(1 0.20) 2 0.08(1 0.08) 0 . 20 0 . 08 1.3602 0.5742 259.85 0.12
例 某药物有新、旧两种剂型。为比较两种剂型的 代谢情况,对16例某病患者服药后0、4、8、12小 时的血药浓度作了测量,问该药新旧两种剂型的 血药浓度-时间曲线的差别是否具有统计学意义。
表 5 4 个时点的某药新旧剂型血药浓度( m o l / L) 编 号 1 2 3 4 5 6 7 0 小时 90.53 88.43 100.01 46.32 73.69 105.27 86.32 旧剂型 4 小时 142.12 163.17 144.75 126.33 138.96 126.33 121.06 8 小时 65.54 48.95 86.06 48.95 70.02 75.01 78.95 12 小时 73.28 71.77 80.01 39.54 60.89 83.66 70.24 编 号 8 9 10 11 12 13 14 15 16 新剂型 0 小时 70.53 68.43 57.37 105.80 80.01 56.32 53.69 85.27 66.32 4 小时 97.38 95.27 78.43 120.54 104.75 75.27 110.02 110.01 115.27 8 小时 112.12 133.17 83.16 136.33 114.75 96.33 138.96 126.33 129.06 12 小时 58.50 56.90 48.34 84.03 65.61 47.52 45.44 69.47 55.29
欧洲研究的样本量估算
( Z / 2 Z ) N 4
2
(1.96 0.84) 0.35 4 0.18
2
(1.96 0.84) 0.35 4 118.6 0.18
2
决定每组含61名患者。
比较两组发生某结局的百分比
处理分配的随机化为什么这么重要? (1) 消除分配处理有意或无意的偏倚。 (2) 为实施盲法创造条件。 (3) 使有可能利用概率论来描述各干预组之间 的差异有多大可能仅仅是由偶然性造成的。 将随机化当作“廉价名词”,实际没做,却 写“随机分成两组” —— 科研道德?
说错和做错
将随机化当作“廉价名词”,实际没做,却 写“随机分成两组” —— 科研道德? 将“随意分组”当作随机化 将“机械分组”当作随机化 略去筛选过程,简单地报告将多少人随机分 组 略去实施过程中丢失对象,将最后两组人数 说成是随机分组人数
应当如何?
成功的随机化取决ation concealment )这个 序列,直到分配完毕(必须建立一个分配处 理的系统) 。 报告如何随机分组,如何“隐蔽” :谁做随 机序列,谁收病人,谁分药和发药;分组方 案如何保管……
(1)预计两组发生某结局的百分比约为 (2)允许犯假阳性错误的机会 (3)允许犯假阴性错误的机会
1, 2
c
1 2
2
2
2Z / 2 c (1 c ) Z 21 (1 1 ) 2 2 (1 2 ) N 1 2
南韩对比剂研究
南韩研究
(1)预计两组发生某结局的百分比约为 20%和 8% (2)允许犯假阳性错误的机会 5% (3)允许犯假阴性错误的机会 1 80% 20% 可能会有一部分患者失访、数据不全、违反研究方案, 计划每组 150 名
南韩研究的样本量估算
2 Z / 2 c (1 c ) Z 2 1 (1 1 ) 2 2 (1 2 ) N 1 2
0.05, k 10,
/ k 0.005