本刊特稿文章编号:1005-2208(2010)01-0014-04外科临床研究的偏倚和真实性分析楼文晖【摘要】外科临床研究的结果有内在和外在的真实性,内在真实性与研究的设计和实施有关,反映的是临床研究的真实可信性;外在真实性反映的是研究结果是否有推广价值。
临床研究的设计和实施过程中因各种原因而产生偏倚,会影响研究的内在和外在真实性。
通过双盲、随机、研究方案的标准化等措施可一定程度上避免偏倚的产生。
外科医生熟悉临床偏倚产生的环节和原因,有助于判断外科临床研究结论的真实性,从而在自己的临床实践中更好地运用研究结果。
【关键词】外科;临床研究;偏倚;真实性中图分类号:R6文献标志码:CBias and validity in surgical clinical trial LOU Wen-hui.Department of General Surgery,Zhongshan Hospital, Fudan University,Shanghai200032,ChinaAbstract There are internal validity and external validity in clinical trial.Internal validity closely related to clinical trial design and execution,which reflects the accuracy of its conclusions about an intervention’s effects on a given group of subjects under a study’s specific circumstances.External validity deals with the applicability of a study’s conclusions to the real world.Bias generated during the design and execution of clinical trial will jeopardize the internal and external validity。
These biases may sometimes be ameliorated by randomization,blinding,and intervention standardization.It is helpful for surgeons to understand the reason behind bias,so as to judge the validity of a surgical clinical trial and properly apply the conclusion in real clinical setting.Keywords surgery;clinical trial;bias;validity循证医学已成为现代医学的基础。
循证医学证据来源于不同的临床研究,认识临床研究真实性,一方面有助于外科医生设计和实施合格的临床研究;另一方面也能判别不同的临床研究的真伪,并采纳这些循证医学证据应用于自己的日常工作。
当外科医生阅读一份临床研究报告时,通常会问两个问题:(1)这份报告可信吗?(2)研究结果如何应用于我的临床实践?第一个问题针对的就是研究的内在真实性(internal validity),第二个问题针对的是外在真实性(external validity)。
临床研究的内在真实性与研究的设计和实施有关,反映的是临床研究的真实可信性,是内涵和生命;临床研究的外在真实性反映的是研究结果是否有推广价值,是临床研究的外延,反映的是离开了研究设计的特定环境,在真实的日常临床实践中该研究的结论是否依然具有适用性。
一个好的临床研究一定是兼具内在和外在真实性的,没有内在真实性就没有外在的真实性。
但有内在真实性,不一定有外在真实性,再好的研究,如果研究报告撰写得很糟糕,表述不清,读者无处判读何时(when),如何(how),哪些人群(who)中推广研究结果;或者研究设计中实施的条件尤其是入组和排除标准很苛刻(特定医院,特定从业者,特定干预措施,特定的人群),则这样的研究就缺乏外在真实性。
临床研究中的偏倚(bias)是危及其内在真实性和外在真实性的主要原因。
识别偏倚的不同形式,有助于临床医生判断研究的真实性。
本文着重分析外科临床研究中可能产生的常见偏倚及对临床研究的影响。
1研究开始前的偏倚1.1易感性偏倚(susceptibility bias)易感性偏倚的一种形式是选择偏倚。
研究开始前,要制定入组标准,但如果入组标准本身蕴含了可能影响研究结果的因素,那就产生了选择偏倚。
譬如比较开腹胃癌根治手术和腹腔镜胃癌根治术的并发症,把肥胖(BMI>30)作为选择指标之一,即可产生选择偏倚,因为肥胖对开腹手术切口感染的影响要显著大于对腹腔镜手术。
影响研究结果的因素很多,有些可知、有些未知,逐一检验哪个因素可能影响研究结果是不可能的。
避免选择偏倚的最佳方法是前瞻性双盲随机对照研究(RCT)。
但很多外科研究涉及手术操作,让研究者(外科医生)和病人完全双盲其实是做不到的。
因为手术是外科医生做的,他很清楚自己在哪例病人身上做了什么手术,而很多时候病人也知道自己接受了何种治疗。
在NSABP研究中[1],乳腺癌病人随机接受三种治疗中的一种:区域乳腺切除、区域乳腺切除联合放疗、全乳腺切除。
在这样的研究中,医生、病人都知道接受的是何种治疗,从而不可避免地会影响治疗的选择以及治疗效果的评价,因此选择偏倚的产生是不可作者单位:复旦大学附属中山医院普外科,上海200032 E-mail:wenhuilou@避免的。
这种选择偏倚是主动的,还有一种选择偏倚是被动的。
例如比较急性降结肠癌梗阻时手术与支架的疗效,但在实施的过程中,身体状况很差、不能耐受全麻的病人只能接受支架置入,这就使得在最后分析时,支架组和手术组人群基线特征明显不一致,从而影响了研究的内在真实性。
避免选择偏倚的另一个方法是分层分析,按可能影响研究结果的因素对样本分层,比如年龄、TNM分期等。
但分层分析需要很大的样本量,否则很有可能分层后,每一亚组的样本量减小,从而影响了统计的效能。
易感性偏倚的另一个形式是时相偏倚(chronology bias)。
如果一个临床研究持续很长时间,临床实践中很多因素都发生了变化,临床经验更丰富了,更先进的麻醉、监护、影像甚至缝线的进步都有可能影响研究结果。
胰腺癌辅助治疗中GITSG研究就是一个例子[2]。
这个研究持续了8年,入组了43例病人。
很多对该研究的批评即指出研究持续的时间过长:医生的手术经验、影像、放疗的设备在8年间取得了巨大的进步,后期治疗的病人效果要优于早期治疗的病人,导致了时相偏倚的产生。
在设计有历史对照的临床研究时,也要注意平衡历史条件和现实的区别。
1.2设计偏倚(design bias)研究设计中很多环节的疏忽都可以造成设计偏倚。
无论是观察性研究还是RCT研究,设计越完善,产生偏倚的机会就越少。
例如研究的终点、观察指标、不良反应的定义力求精确,减少研究者按自己的理解自由量裁的机会。
设计偏倚产生的一个主要因素是使用替代终点(surrogate endpoint)。
有些研究的观察终点,如死亡、远期复发等,可能需要随访很长时间才能获得结果。
为了便于尽快获得研究结果,往往设计替代研究终点。
需要注意的是,替代研究终点与真实研究终点间的关系往往存在不确定性。
例如在冠状动脉支架术后心肌梗死的发生率是否下降的研究中,如直接随访病人的心肌梗死事件,可能需要很长时间,因此现在很多临床研究把冠状动脉造影中冠状动脉的狭窄作为心肌梗死事件的替代指标。
问题是冠状动脉的狭窄与心肌梗死直接的对应关系究竟如何,结论尚不明确[2]。
因此,外科医生选择替代终点时首先要确定其可靠性、科学性,与真实的研究终点之间的联系,尤其是用来替代远期疗效和并发症。
同时要认识到替代终点的局限性。
尤其是如果替代终点不能最后和一个相关的临床结果相关联,那这个研究就失去了外在真实性。
2研究实施过程中的偏倚2.1信息偏倚(information bias)信息偏倚的一种形式是检出偏倚(detection bias),源自研究组内或组间检出标准的不一致,尤其是检出标准涉及主观判断的时候。
如手术后生活质量的改善,不同的受试者和研究者由于对生活质量的不同理解,其对量表或问卷的回答会有很大的偏倚。
即使是客观信息,也存在检出偏倚的问题。
如判断肿瘤切除术后的无病生存期,随访间隔时间过长,就有可能造成检出偏倚。
如果是多中心研究,不同医院的影像设备和读片医生的水平不一致,也会造成检出偏倚。
信息偏倚的另一种形式是确认偏倚(ascertainment bias),这类偏倚往往发生在病例回顾研究中,需要病人回忆既往的事件。
病人往往在潜意识里要为自己的疾病找一个原因,因此可能在研究者的诱导下,也可能不自觉地会把既往一些不确定的事件(既往史、家族史)当成确定事件报告。
我们自己的临床实践中经常碰到这样情况,结肠癌病人在回忆自己的家族史时会说“我爷爷或奶奶好像是死于结肠癌,那时我小,听我父母说的”。
信息偏倚直接危及了临床研究的内在真实性。
在有主观评价指标的情况下,尽量把评价标准细化、采用双盲法或引入独立的第三方评价者有助于避免信息偏倚。
2.2传递偏倚(transfer bias)如果临床研究的特性导致了不同研究组间的随访率显著不同,就产生了传递偏倚。
一个临床研究中如果某一组的预后(或效果)特别好,或特别差,就会导致该组随访率的大幅下降。
在效果好的情况下,病人可能觉得没有必要再随访;而在很糟糕的情况下,可能病人不愿意接受随访。
例如无张力疝修补术后要随访远期疗效,观察补片的长期影响,一方面手术复发率低,另一方面随访时间很长,很多病人可能就疏于随访了。
传递偏倚同样会影响研究内在的真实性。
避免的方法在于采取一切办法鼓励病人随访,如给予交通补偿、将随访时间、地点尽可能安排得比较方便等。
2.3执行偏倚(performance bias)执行偏倚危及临床研究的内在真实性,是外科临床研究中最常见、也最难避免的偏倚。
因为外科手术不可能像内科药物临床研究中那样完全做到标准化。
事实上同一个手术,没有两位外科医生的做法是一模一样的;即使是同一位外科医生,在不同的时间,随着手术经验、技巧的发展,他的操作也可能不一样。
这种非标准化的状况是外科的特点。
但从另一个角度看,外科临床研究实施过程中一定程度的不一致,反而增强了其外在的真实性,使得研究结论可以转化到不同医院和不同外科医生的临床实践中去。