Cox比例风险模型——Hazard model(一)方法简介1概念界定COX回归模型,全称Cox 比例风险回归模型(Cox’s proportional hazards regression model),简称Cox 回归模型。
是由英国统计学家D.R.Cox(1972)年提出的一种半参数回归模型。
该模型以生存结局和生存时间为因变量,可同时分析众多因素对生存期的影响,能分析带有截尾生存时间的资料,且不要求估计资料的生存分布类型。
由于上述优良性质,该模型自问世以来,在医学随访研究中得到广泛的应用,是迄今生存分析中应用最多的多因素分析方法。
(绕绍奇,徐天和,2013)与参数模型相比,该模型不能给出各时点的风险率,但对生存时间分布无要求,可估计出各研究因素对风险率的影响,因而应用范围更广。
2 方法创始人:Cox (1972) proportional (成比例的)hazard regression model.详细介绍了该方法的具体推演过程以及相关的实例。
参考文献:Cox, D. R. (1992). Regression models and life-tables. Journal of the Royal Statistical Society, 34(2), 187-220.3 基础知识h(X,t)由两部分组成:h0(t)不要求特定的形式,具有非参数方法的特点,而exp(…) 部分的自变量效应具有参数模型的形式,所以Cox 回归属于半参数模型。
等比例风险假设是最为关键的适用条件,类似于线性回归模型中的线性相关假设。
比例风险( PH) 假定的检验方法目前,检验Cox 回归模型PH 假定的方法主要有图示法和假设检验法[6]两种。
图示法包括: ( 1)Cox &K-M 比较法,( 2 ) 累积风险函数法,( 3 )Schoenfeld 残差图法; 假设检验法包括: ( 1) 时协变量法,( 2) 线性相关检验法,( 3) 加权残差Score 法; ( 4) Omnibus 检验法。
(了解每种方法的优劣详见严若华, & 李卫. 2016)。
参考文献:严若华, & 李卫. (2016). Cox回归模型比例风险假定的检验方法研究. 中国卫生统计, 33(2), 345-349.注意:如果Cox PH Model中的变量会随时间变化,那么就成了extended Cox model,此时HR不再是一个常量。
很简单的例子,如果病人的居住地也是一个变量,病人有可能会搬家,例如在北京吸霾了5年,再跑去厦门生活,那么他旧病复发的概率肯定会降低。
所以住所这个变量是和时间相关的。
一种简单的做法是,按照变量改变的时刻,把时间切割成区间,使得每个区间内的变量没有变化。
然后再套用Cox PH模型。
注意:考虑到不可观测的个体异质性问题,可以在模型中加入高斯弱项。
例如——stata实现(参考ON FRAILTY MODELS IN STATA)Data generated so that time to failure given the covariates is Weibull (韦布尔分布,即韦伯分布(Weibull distribution),又称韦氏分布或威布尔分布,是可靠性分析和寿命检验的理论基础).Omitting a covariate here and there creates unexplained heterogeneity which we can capture via a frailty model.The LR test compares Weibull frailty model to the standard WeibullHere we know which model is more appropriate, but in practice ask yourself: Do I want observation{level frailty or do I want to impose a grouping constraint on the frailties?(二)适用情境instantaneous probability of an event事件的瞬时概率,例如online relationship formation参考文献:Kozlenkova, I. V., Palmatier, R. W., Fang, E., Xiao, B., & Huang, M. (2017). Online relationship formation. Journal of Marketin, 81(3), 21-40.(三)模型估计方法semiparametric partial likelihood method半参数偏似然方法(Mitra and Golder 2002; Thompson and Sinha 2008).(四)stata实现如何使用Stata进行Cox回归分析以及比例风险假定(Proportional hazard assumption, PH 假定)的检验。
1. 问题与数据问题:在一个抗癌药物的临床试验中,48名患者被随机分配到新药组(28人)和安慰剂组(20人),研究人员想知道新药是否影响患者的生存情况。
进行过了数据的初步观测、将数据转化为生存数据格式。
2. Cox回归Step 1:通过Statistics > Survival analysis > Regression models > Cox proportional hazards model 找到操作的对话框。
Step 2:选项设置。
由于我们已经在一开始将数据转化为生存数据的时候指定过终点事件、时间变量,我们在这里只需要设置需要在回归方程中控制的变量即可。
例如,我们想看drug对于生存的影响,便在Independent variables的下拉菜单中选择drug,点击OK。
屏幕上出现结果:我们可以看到,Drug变量的Hazard Ratio (风险比) 是0.133,95%置信区间为0.056至0.314。
这说明和Drug=0 (安慰剂组) 相比,Drug=1 (新药) 可显著降低终点事件(died=1) 发生的风险(p<0.001)。
然而,在这个模型中,我们没有调整其他的混杂因素。
研究人员思考,有没有可能患者的年龄也是终点事件发生的一个独立危险因素呢? 为了解决这个问题,我们可以把age也纳入cox回归的模型。
得到的结果如下:我们可以看到,drug变量的风险比变成了0.105 (95% CI: 0.043, 0.256), age变量的风险比为1.120 (95% CI: 1.041, 1.205)。
我们得出结论:1)在控制了患者年龄后,和安慰剂相比,新药可显著降低终点事件发生的风险(p<0.001)。
2)患者年龄是终点事件发生的独立危险因素。
在控制了治疗方法后,患者年龄每增加1岁,发生终点事件的风险增加到原来的1.120倍(p=0.002)。
3. PH假定的检验在cox回归之后,我们需要检验模型是否满足PH假定。
通过Statistics > Survival analysis > Regression models > Test proportional-hazards assumption找到操作的对话框。
我们选择默认的Schoenfeld Residuals方法,点击OK。
屏幕上出现结果如下:请注意,PH假定的检验基于上一步cox回归纳入的变量。
如果上一步没有进行cox回归分析,屏幕上会显示“last estimates not found”的错误代码。
在这个例子中,在stcox drug age这个命令后,我们进行了PH假定的检验。
该检验的零假设是纳入Cox回归模型的变量满足PH假定(drug变量和age变量满足PH假定),因为p=0.8064,大于0.05,不能拒绝零假设。
因此,PH假定成立。
我们也可以通过图像直观地观测某个变量是否满足PH假定,更加直观地在论文中展现结果。
不同于上述的检验方法,在使用图像展示时,我们只能看某一个变量是否满足PH假定(我们可以控制其他变量,下文提到)。
我们可以通过Statistics > Survival analysis > Regression models > Graphically assess proportional-hazards assumption找到操作的对话框。
我们在Independent variable 这里选择drug, 看一看drug是否满足PH假定。
点击OK。
我们可以看到在下图中,在任何一个时间节点上,drug=1几乎都是平行于drug=2的线,因此PH假定成立。
在这个例子中,如果我们勾选上对话框中的“adjust estimates”,便可以控制其他一个或多个变量,然后看drug变量是否满足PH假定。
4. 其他注意事项1)所有对话框操作均可通过command实现cox回归的命令:cox var1 var2 var3解释:在这个命令中,var是自变量名字。
请注意,cox回归中不需要指定因变量(y变量),因为我们在stset时已经指定过结局变量了(请参考上期推送)检验PH假定的命令:estat phtest解释:请注意,这个命令需要紧跟在cox回归的命令之后,否则Stata不知道检验哪个回归的PH假定。
绘制PH假定图像的命令:stphplot, by(var1) adjust(var2)解释:var1是自变量名,var2是希望控制的变量。
注意,这个命令不一定要跟在cox回归之后。
2)我们也可以在回归模型中控制更多的危险因素。
如果选择将哪些危险因素放入模型可以参考我们之前的文章:SPSS详细操作:生存资料的Cox回归分析3)如果某变量不满足PH假定,我们则应当将变量放入Strata框中进行分层变量控制。
我们可以在Cox回归的对话框中选择需要分层的变量。
4)在解读结果时,一定要强调3点:控制了哪些变量? (e.g. 在控制了患者年龄、性别后…)和谁比? (e.g. 和安慰剂相比,治疗组…; 和体重正常的人比,超重的人…)量化(给出95%置信区间、p值)(五)参考书籍绕绍奇主编;徐天和总主编.中华医学统计百科全书遗传统计分册:中国统计出版社,2013.05景学安主编;段爱旭,孔浩副主编.医学统计学供临床医学、预防医学、口腔医学、医学影像学、医学检验学等专业用:江苏科学技术出版社,2013.01马振中. (2007). Cox回归比例风险假定的考察和影响点的识别及其SAS和SPSS实现. (Doctoral dissertation, 山西医科大学).。