第十二章生存分析及COX回归在临床医学中, 对病人治疗效果的考查. 一方面可以看治疗结局的好坏,另一方面还可以通过治疗时间的长短来衡量。
例如某种疾病治愈的时间, 某癌症病人手术后的存活时间等, 把这类与时间有关的资料统称为生存资料。
生存资料一般通过随访收集,从某标准时刻(发病、手术或出院等)开始,按某种相等或不等时间间隔,对观察对象定期观察预定项目所得的资料,它的结局是死亡,治愈、复发、阳性等。
但在临床上,往往由于各种原因:(1)因迁移原因失去联系;(2)死于其他原因而造成失访;(3)预定终止结果迟迟不发生,致使在一定时期内,一部分病例得不到确切的生存期,但它们提供了其生存期长于观察期的信息,这种数据称为删失数据,也称截尾数据或终检值(censored data),包含终检值的数据即为不完全数据。
处理这类数据的统计分析方法称为生存分析。
它包括三个方面的内容1)生存过程的描述,主要是生存率的估计;2)生存过程的比较;3)影响因素的分析。
§12.1 生存率的估计生存率估计常用的有两种方法乘积极限法和寿命表法。
1乘积极限法又称Kaplan-Meier 法适用于小样本资料。
基本思想:将生存时间由小到大依次排列,在每个死亡点上,计算其期初人数、死亡人数、死亡概率、生存概率和生存率。
CHISS实现:点击重复测量→生存分析→乘积极限法应用举例:例12-1某疗法治疗白血病后的存活月数为: 2+,13,7+,11+,6,1,11,3,17,7。
试估计其生存率。
带“+”为存活终检值。
解步骤:1 进入数据模块此数据库已建立在CHISS\data文件夹中,文件名为:a9_0生存分析.DBF。
打开数据库点击数据→文件→打开数据库表找到文件名为:a9_0生存分析.DBF →确认2 进入统计模块进行统计计算点击重复测量→生存分析→乘积极限法时间变量: time 终检值指标:censor→确认3 进入结果模块查看结果点击结果乘积限估计法生存分析, 数据来自文件: C:\CHISS\Data\a9_0生存分析.DBF数据过滤条件:━━━━━━━━━━━━━━━━━━━秩观察死亡观察生存率次时间序号数生存率标准误(i) t(i) (j) n(i) S(j) Ss(j)───────────────────0 0 0 10 1.0000 ...1, 1 1 10 0.9000 0.09492, 2+ ... 9 ... ...3, 3 2 8 0.7875 0.13404, 6 3 7 0.6750 0.15515, 7 4 6 0.5625 0.16516, 7+ ... 5 ... ...7, 11 5 4 0.4219 0.17378, 11+ ... 3 ... ...9, 13 6 2 0.2109 0.172610, 17 7 1 0.0000 ...━━━━━━━━━━━━━━━━━━━注:删失数据为1。
平均生存期= 9.7750 标准差= 2.2664§12.2 时序检验(log rank test)用于比较两个或多个样本生存期,即对各样本不同时点生存率的综合分析。
其原理是计算出不同时期两种疗法的观察人数和死亡人数,并由此根据两种疗法疗效相同的假设计算出两种疗法在该日期的理论死亡数,若无效假设是对的,则实际值和理论值不会相差很大,如相差过大,则不象仅仅由于机遇所产生的差异,对此可作 2检验以推断。
CHISS实现:点击重复测量→生存分析→时序检验例12-2两种疗法治疗白血病后的存活月数如下:对照组: 2+,13,7+,11+,6,1,11,3,17,7中药组: 10,2+,12+,13,18,6+,19+,26,9+,8+,6+,43+,9,4,31,24带“+”为终检值试分析两种疗法治疗的生存期有无差别解步骤:1 进入数据模块此数据库已建立在CHISS\data文件夹中,文件名为:a9_1生存分析(小样本).DBF。
打开数据库点击数据→文件→打开数据库表找到文件名为:a9_1生存分析(小样本).DBF →确认2 进入统计模块进行统计计算点击重复测量→生存分析→时序检验时间变量: time 终检值指标:censor分组因素:g →确认3 进入结果模块查看结果点击结果小样本时序检验(生存期比较, 处理分组为g数据来自文件: "C:\CHISS\Data\a9_1生存分析(小样本).DBF"),━━━━━━━━━━━━━━━━━━━━━━━观察时间期初观察数发理论发生数──────────生──────1 2 1 2 小计数 1 2───────────────────────1 ... 10 16 26 1 0.385 0.6152+ 2+ 9 16 25 03 ... 8 15 23 1 0.348 0.652... 4 7 15 22 1 0.318 0.6826 ...7 14 21 1 0.333 0.667... 6+ 6 14 20 07 ... 6 12 18 1 0.333 0.6677+ ... 5 12 17 0... 8+ 4 12 16 0... 9 4 11 15 1 0.267 0.733... 9+ 4 10 14 0... 10 4 9 13 1 0.308 0.69211 ... 4 8 12 1 0.333 0.66711+ ... 3 8 11 0... 12+ 2 8 10 013 13 2 7 9 2 0.444 1.55617 ... 1 6 7 1 0.143 0.857... 18 0 6 6 1 0.000 1.000... 19+ 0 5 5 0... 24 0 4 4 1 0.000 1.000... 26 0 3 3 1 0.000 1.000... 31 0 2 2 1 0.000 1.000... 43+ 0 1 1 0━━━━━━━━━━━━━━━━━━━━━━━注:删失数据为1。
实际发生数与期望发生数━━━━━━━━━━━━━━━━━━━━组别总例数删失数实际发生理论发生────────────────────g.1 10 3 7 3.21g.2 16 8 8 11.79━━━━━━━━━━━━━━━━━━━━Log-Rank检验,QPH = 5.683 自由度 =1 P =0.0171 说明两种疗法治疗的生存期差别有显著性。
§12.3 COX 比例风险模型生存时间的长短不仅与治疗措施有关, 还可能与病人的体质, 年龄, 病情的轻重等多种因素有关, 把这类因素称为伴随变量或协变量。
由于失访、试验终止、意外事故、改变治疗方案等原因造成某些数据观察不完全,这些数据称为删失数据。
这种数据显然不服从正态分布和方差齐性, 不能用多元线性回归分析。
1972年英国统计学家Cox DR. 提出了一种能处理多因素生存分析数据的比例危险模型 ( Cox's proportional harzard model)。
Cox 回归模型: 在p 个危险因素同时影响生存过程的情况下, 在时点t 的危险率模型为:H(t)=h0(t)exp(b1x1+b2x2+….b pxp)其中h(t)-- 表示在时点t 的死亡率;h 0(t)--表示在时点t 的基本死亡率; 即不存在p x x ~1因素影响时的死亡率;1β--回归系数, 其意义是: 当因素x 1每改变一个测量单位时所引起的相对危险度的自然对数改变量即)exp(11β=RR 。
若x 1对生存无影响, 则理论上1β=0。
例12-3 现有50例急性淋巴细胞性白血病病人的随访记录. 在入院治疗时, 测得外周血中白细胞数x 1和浸润淋巴结等级x 2,经过治疗达到完全缓解后, 有的病人有巩固治疗有的没有x 3, 并随访取得每例病人的生存时间的资料如下。
50例急性淋巴细胞性白血病病人的随访记录病例号 X 1 X 2 X 3 T (月) 病例号 X 1 X 2 X 3 T (月)1 2.5 0 0 3.40 26 4.7 0 0 11.002 1.2 2 0 3.73 27 6.0 0 0 11.77 3 173.0 2 0 3.73 28 128.0 2 1 11.834 3.5 0 0 3.83 29 3.5 0 1 11.83 5 119.0 2 0 4.00 30 35.0 0 0 11.976 39.7 0 0 4.03 31 62.2 0 0 13.16 7 10.0 2 0 4.17 32 2.0 0 0 14.838 62.4 0 0 4.20 33 10.8 0 1 15.179 502.2 2 0 4.20 34 8.5 0 1 18.23 10 2.4 0 0 5.00 35 21.6 0 1 18.23 11 4.0 0 0 5.27 36 2.0 2 1 19.16+ 12 34.7 0 0 5.67 37 2.0 0 1 20.17+ 13 14.4 0 1 7.07 38 2.0 0 1 20.17+ 14 28.4 2 0 7.26 39 3.4 2 1 20.17+ 15 2.0 2 0 7.33 40 4.3 0 1 20.57 16 0.9 0 1 7.53 41 5.1 0 1 21.00 17 40.0 2 0 7.53 42 244.8 2 1 21.87 18 30.6 2 0 7.60 43 2.4 0 0 23.77 19 6.6 0 0 7.67 44 4.0 0 1 26.00 20 5.8 0 1 7.67 45 1.7 0 1 28.33 21 21.4 2 1 8.30 46 5.1 0 1 31.3322 6.1 0 1 8.33 47 1.1 0 1 37.7723 2.8 0 0 8.33 48 32.0 0 1 66.8324 2.7 2 1 8.80 49 12.8 0 1 73.5725 2.5 0 0 9.23 50 1.4 0 1 124.17+表中“+”代表仍存活, X1代表白细胞数(千个/mm3), X2代表浸润淋巴结程度,分为0、1、2三级, X3代表是否有巩固治疗,1为有, 0为无。
试进行COX回归分析。
解步骤:1 进入数据模块此数据库已建立在CHISS\data文件夹中,文件名为:a9_3cox模型.DBF。
打开数据库点击数据→文件→打开数据库表找到文件名为:a9_3cox模型.DBF →确认2 进入统计模块进行统计计算点击模型→数学模型→COX模型解释变量x1,x2,x3反应变量:time删失标记变量:CENSOR→确认3 进入结果模块查看结果点击结果Cox 模型的估计参数(生存时间=TIME, 删失标记=CENSOR, 数据来自:C:\CHISS\Data\a9_3cox模型.DBF)━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━参数名估计值标准误 u值 p值 RR 95%CI────────────────────────────────X1 0.001 0.002 0.591 0.5543 1.00 0.997~1.005X2 0.456 0.206 2.211 0.0270 1.58 1.053~2.364X3 -1.885 0.376 5.008 0.0000 0.15 0.073~0.317━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━G(卡方)= 244.7115 自由度=3 p值=0.0000。