临床试验中的统计学若干问题——《小胖说统计》系列日志节选(一)前言“统计学基本上是寄生的。
靠研究其他领域内的工作而生存。
这不是对统计学的轻视,这是因为对很多寄主来说,如果没有寄生虫就会死。
对有的动物来说,如果没有寄生虫就不能消化它们的食物。
因此,人类奋斗的很多领域,如果没有统计学,虽然不会死亡,但一定会变得很弱”-L.J.Savage“统计思维总有一天会像读与写一样成为一个有效率公民的必备能力。
”-H.G.Wells统计学研究的是来自各领域的数据,由解决其他领域内的问题而存在并发展。
这一点对临床试验生物统计学也不例外,临床试验的大力发展催生并发展了统计在制药行业的应用。
对于每个从事临床试验工作的人来说,我们并不都需要你通晓每种统计方法的由来,我们需要的是你用一种统计的思维方式来看待和判断临床试验中的问题。
基于此小胖结合自己在临床试验生物统计方面微不足道的经历,于2008年6月推出了自己的日志系列《小胖说统计》,初衷在于在不侧重复杂的统计理论和计算的基础上,通过一些浅显易懂的语言,简单介绍一下临床试验中一些生物统计的基本知识,并希望能成为和广大临床试验同行进行交流的平台。
承蒙广大网友的抬爱,《小胖说统计》推出后受到了大家的认可,至今已发表约180篇博文。
为了方便大家的阅读,应广大网友的要求,特对《小胖说统计》中的主要内容加以节选,所有内容均属个人观点,仅供参考,欢迎大家批评指正。
《小胖说统计》系列日志将会继续进行持续更新,详细内容可参见以下链接: /2113/ucenterhome/5612在此对长期关注和支持《小胖说统计》系列日志的公卫论坛和药物临床试验论坛的广大坛友表示感谢。
统计学是一门科学、一种技术和一门艺术,小胖也只是个入门者,最后借用一论坛网友的话,我是一只小蜗牛,笨笨的,不懈的……小胖(Michael Wen,闻增玉)2009年10月目录前言 (2)一、认识α和β (5)二、临床试验生物统计的BIBLE (6)三、如何从统计角度来review研究方案 (8)四、验证性试验和探索性试验 (11)五、临床试验研究人群的选择 (13)六、主要终点和次要终点 (14)七、复合终点 (17)八、盲法 (20)九、随机化 (23)十、研究设计 (33)十一、多中心临床试验 (38)十二、优效性试验 (42)十三、非劣效试验 (47)十四、非劣效试验和优效试验的转换 (55)十五、从临床试验实例来看样本量的计算 (57)十六、中期分析 (78)十七、分析集 (99)十八、缺失值 (114)十九、离群值 (138)二十、参数估计、可信区间和假设检验 (146)二十一、基线数据分析 (152)二十二、协变量 (155)二十三、亚组分析 (162)二十四、临床试验中的多重性问题 (171)一、认识α和β要了解生物统计在临床试验中的应用,首先需从认识α,β开始,就是这两个不起眼的符号几乎贯穿了临床试验生物统计的始终。
α和β的定义是比较拗口的,特别是对于那些没学过统计的人来说,这两个东西是比较难搞明白具体是怎么回事的。
虽然比较拗口,但咱还得在这里重复一下α和β的科学定义:α又称第I 类错误或显著性水平,指拒绝了实际上成立的H0;β又称第II类错误,指不拒绝实际上不成立的H0。
对应β的还有一个概念叫power,翻译为把握度,它等于1-β,指拒绝实际上不成立的H0的概率。
说得通俗一点,临床试验中你会犯俩错误,一种错误是两种药本来没啥区别,却说成您的药优于人家的药,这就是α;另一种错误是你的药的确优于人家的药,却说成两种药没啥区别,这就是β。
那1-β呢,就是优秀药物被发现的概率啊。
不知道,上边的解释,您听明白了吗?如果听明白了,小胖要问您了,谁应该最关心α啊,那又谁应该最关心β啊?最关心α的当然是我们伟大的SFDA以及诸如FDA之类的药品审批机构啊,为啥?他们当然不希望一种药明明和别的药没啥区别,却被药厂说成疗效更好,换言之,他们可不希望审批无效的药物进入市场。
所以啊,它们要限定这种错误发生的概率,也就是我们的α了,一般情况下,α被限定为0.05。
最关心β的当然是我们的药厂了,为啥?为钱,哈哈!药厂当然不希望明明他的药优于别人的药,却被说成两种药没啥区别吧,所以它们希望降低这种错误发生的概率,也就是降低β了。
换言之,他希望提高把握度(1-β),使自己的药能有更高的概率作出来优于别的药物,从而进入市场,赚取钞票。
一般情况下,β应小于0.2,甚至0.1,对应的把握度为80%或90%。
当然药厂降低β,也就是提高把握度,会提高你试验成功的概率,但这也同时意味着同等条件下样本量的增加,样本量的增加就意味着money的增加,这些都是矛盾的,没办法,谁让这世界本来就是一个矛盾的世界呢,你只好去权衡利弊,找个平衡点呗。
二、临床试验生物统计的BIBLE如果想了解生物统计在临床试验中的应用,那么我们最好有一个gulideline的东西来指导我们。
ICH E9 临床试验的统计学指导原则便是这么一个guideline,它是我们临床试验生物统计的依据和基础。
ICH E9 Statistical principles for clinical trials (临床试验的统计学指导原则)可谓生物统计师的bible,目的在于协调欧洲、日本和美国在进行药品上市申请的临床试验时所应用的统计学方法的指导原则。
虽说中国是协调三方之外的国家,SFDA还为此另外制定了自己的《化学药物和生物制品临床试验的生物统计学技术指导原则》,但其内容基本还是翻译节选了ICH E9的内容。
ICH E9的内容主要内容包括:1. 引言2. 整个临床试验的基本考虑3. 试验设计中的基本考虑4. 试验进行中的基本考虑5. 数据分析6. 安全性与耐受性评价7. 研究报告通过阅读ICH E9,你可以对临床试验生物统计有一个初步的轮廓上的了解,这一点很重要,临床试验生物统计和我们在学校里学的卫生统计或者数理统计还是有所不同的,ICH E9可以使你初步认识到这两者的一些不同,可以使你在思维上实现向临床试验生物统计的一些初步转变,当然这个转变不是简单地阅读ICH E9就能实现的,更重要的是通过一些临床试验生物统计的实践,以及你本身对整个临床试验的流程的进一步理解来实现的。
ICH E9是你的第一步。
那我们就从第一步开始吧,你可以在以下链接下载ICH E9并开始自己的第一步学习,小胖也将在下面的系列文章中对ICH E9涉及到的内容做进一步的阐述。
/cder/guidance/ICH_E9‐fnl.pdfSFDA 的《化学药物和生物制品临床试验的生物统计学技术指导原则》可在以下链接下载:/zdyz.do?method=largePage&id=2057三、如何从统计角度来review研究方案一个临床试验研究方案的撰写,离不开统计,那么对于一个完整的研究方案,从统计角度它应该包括什么内容,或者一个统计师应从那些方面来review呢,小胖在此小谈一下,个人愚见,仅供参考。
1.必须有具体明确的研究目的。
这点勿容置疑,如果你连研究目的和用来证实研究目的的终点指标都没搞清楚,你就别做了,准备洗洗睡吧。
研究目的是啥?研究目的就是你做这个试验想要回答的问题。
设立正确的研究目的是临床试验最关键的一部分。
研究目的一旦确定,它就直接决定着你的临床试验设计、数据的收集、数据的分析乃至最后的结论的确立和解释,因此研究目的可谓整个临床试验的基石。
当我们review我们临床试验的研究目的时,首先要问自己两个问题:-这个研究目的是否合理和切合实际?很简单咱不能做不切实际的幻想。
-这个研究目的可否可以被证实,就是说根据我们的研究方案能否回答我们的研究目的。
研究目的应该尽量具体化,而不是仅仅说确立某某药的疗效和安全性。
研究目的不宜过多,如果研究目的不止一个,那么应对研究目的进行排序。
2.统计学假设(Hypothesis)。
就是你统计检验要检验的东西,这个必须与你的研究目的相对应。
3.必须有清楚的终点(endpoints)。
一般会有主要终点和次要终点。
主要终点是临床试验最重要的指标,能最确切地反应药物的疗效或安全性。
通常情况下,主要终点只有一个,这也是最理想的状态,当然在一些疾病的临床试验中,需要同时从两个方面对疗效进行评估,这时会出现co‐primary endpoints。
如果存在多个主要终点时,就要考虑控制I类错误。
所以小胖建议大家在设计临床试验时,尽量选择单一的主要终点,比较易于设计、分析和解释。
主要终点也是样本量计算的依据,这一点很重要哦。
还有一点小胖要提醒大家的是,在选择主要终点时,尽量选择客观性指标。
如果选择一些生活质量评分诸如此类的主观性指标,很容易在研究者评分或受试者评分时产生较大的偏倚,小胖就曾看到过双盲安慰剂对照的临床试验因为把所谓的受试者评分作为主要终点,结果因为产生较大的偏倚而导致失败的例子,因此说实话,特别是在国内,这种主观性的评分还是不要作为主要终点为好,来自研究者、受试者以及各方面的偏倚会很多。
关于次要终点,就强调两点,一是必须与试验目的相关,二是数目不要太多。
4.合适的临床试验设计。
在review研究设计时,可首先问自己一个问题,就是这个试验设计能不能回答你的研究目的?这是最重要的。
啥临床试验设计类型那,有平行设计、交叉设计、析因设计以及现在hot的成组序贯设计等。
当然大家接触的最多的是平行设计。
当然在比较类型上还有优效、等效和非劣效。
这里的临床试验设计包括很多方面,review啥呢,其实把研究方案中的study flow chart看好了,就基本差不多了。
5.终点指标的定义和测量方法。
在研究方案中必须加以详细描述,特别注意一些关键的时间点的定义,比如基线和终点时间等。
这对以后的统计分析至关重要。
这里需要强调的是在一些肿瘤临床试验中,终点指标的定义比如应答的定义等。
测量方法比如MMR等的描述必须详细准确。
6.符合入选/排除标准的研究人群。
小胖在这里简单说两句。
你可以简单问自己两个问题,一是你选择的人群的疾病是不是太轻度以至于无法检测出差异,二是你选择的人群的疾病是不是太严重以至于无法检测出差异。
另外,小胖需要说的是,一些标准可以在入选标准中出现,也可以在排除标准中出现,而不用在入选/排除标准中同时出现。
现在很多方案,明明在入选标准中已经说明了,非要在排除标准中再不厌其烦地反着说一遍。
比如你在入选标准里规定了18-75岁的受试者,结果你还要在排除标准里写上年龄<18或>75。
不是说不对,但小胖认为这样不大专业。
7.入组和随机化分配方法。
方案中应详细说明受试者入组和随机化分配方法。
随机化方法主要有简单随机化、区组随机化和分层随机化。