当前位置:文档之家› 第17章--生存分析

第17章--生存分析


Kaplan-meier过程 (4)生存曲线
分析结果
Life-Tables过程
Life Tables过程用于: 制作寿命表 绘制各做曲线如生存函数、风险函数曲线等。
对某一研究因素的不同水平的生存时间分布进行比较,控
制另一个因素后对研究因素不同水平的生存时间分布进行 比较,包括从总体上比较和不同水平间进行两两比较。
124,143,12+,159+,190+,196+,197+,205+,219+
Kaplan-meier过程
Kaplan-meier过程
时间变量 结局变量
分组变量
Kaplan-meier过程
当变量为二分类变量时,一般以死亡、复发、恶化等为 终结事件,如本例就是以恶化为终结事件,标记值为1,所 以在Single value框中输入1;如果生存状态变量取值为连续 变量时,则在Range of values 框分别输入下限值和上限值。
Cox回归模型 上面介绍的两种生存分析方法只能研究一至两 个因素对生存时间的影响,当生存时间的影响因 素有多个时,它们就无能为力了,下面介绍Cox Regression过程,这是一种专门用于生存时间多 变量分析的统计方法。
Cox回归模型
模型结构:设有n名病人,第i名病人的生存时间为ti,同时该 病人具有一组伴随变量xi1,xi2…xip。该病人生存到时间ti的 风险函数hi(t)是其基础风险函数ho(t)与相应伴随变量的函数 的乘积,其数学表达式为: hi(t)= h0(t)f(β1xi1+….+βpxip) Cox建议伴随变量的函数为指数形式,故Cox比例风险回 归可写为: hi(t)= h0(t)exp(β1xi1+….+βpxip) 式中的h0(t)是当所有伴随变量xi1,xi2,…xip都处于0或标 准状态下的风险函数,是一个不确定的值,β1,β2…,βp为回 归系数,须用实际资料来估计。
2.截尾数据 (Censored Data):由于某种原因未能观察到观察 对象的明确的结局,所以不知道该观察对象的确切的生存时间, 就象该观察对象的生存时间在未到达规定的终点之前就被截尾 了。 截尾数据提供了部分关于生存时间的信息,使研究者知道 该观察对象至少在已经经历的这个时间长度内没有发生终点事 件,其真实的生存时间只能长于我们现在观察到的时间而不会 短于这个时间。(符号t+)
分析结果
对回归方程各参数进行估计,trt(有无术中放疗)的回归 系数B=-0.818,p=0.012,按0.05的标准认为术中接受放疗可
以降低胰脏癌患者死亡的风险,平均来说,在一个时间点上,
接受放疗的患者死亡风险都是未接受患者的e-0.818=0.441倍。
Cox回归模型 (4)相关矩阵
分析结果
生存时间资料的特点
有2个效应变量:一是生存时间(天数),二是结局
(死亡与否、是否阳性等)。
存在截尾数据 :由于某种原因未能明确观察到随访 对象发生事先定义的终终事件。 分布类型复杂 :生存时间资料常通过随访获得,因 观察时间长且难以控制混杂因素,故其分布常呈偏态,
影响因素较多,规律难以估测。
寿命表 生存曲线 风险函数曲线
Life-Tables过程
分析结果
1.生存时间的组段下限 2.进入该组段的观察例数 3.该组段的删失例数 4.暴露于危险因素的例数 5.所关心的事件的例数,即死亡例数 6. 所关心事件的观察单位数的比,即各组的死亡概率 7.各组的生存概率 8. 至本组段上限的生存函数估计值,由各组的生存概率累积相乘所得。 9. 概率密度,所有个体在时点t后单位时间内死亡概率估计值。 10. 风险率。活过时点t个体在时点t后单位时间内死亡概率的估计值 11. 生存函数估计的标准误。 12. 概率密度的标准误 13. 风险率的标准误。
Cox回归模型
例3 数据pancer.sav是关于胰脏癌术中接受放疗会否延长病人生存时间
的研究。该研究的终点为死亡,接受手术被定义为计算生存时间的起点。 由于该研究是一项未经随机化的观察研究,要正确估计术中接受放疗提 高患者生存时间的效果,还需考虑对其他因子的效果进行调整。
变量名 caseno time censor age trt sex bui ch p stage 变量说明 患者编号 生存时间(月) 删失 手术时的年龄 处理组别(有无手术中放疗) 性别 占位处 胰胆管浸润程度 有无腹膜转移 TNM 分类 变量类型 连续 2 分类 连续 2 分类 2 分类 2 分类 有序多分类 2 分类 2 分类 分类变量的编码
Life-Tables过程
例2:某医院对114名男性胃癌患者接受手术后的生存情况 进行了11年的随访,得到数据(lifetb.sav)如下
Life-Tables过程
Life-Tables过程
输出生存时间范围及组距:前一个框输入生存 时间上限,后一个框输入生存时间的组距
Life-Tables过程
生存分析
生存分析
生存分析 :在临床诊疗工作的评价中,慢性疾病的预
后一般不适用于治愈率、病死率等指标来考核,因为其无
法在短时间内明确判断预后情况,为此,只能对患者进行 长期随访,统计一定时期后的生存或死亡情况以判断诊疗
效果。
生存分析还适用于现场追踪研究(发病为阳性)、临床 疗效试验(痊愈或显效为阳性)、动物试验(发病或死亡) 等。
Cox回归模型
相关性估计
Cox回归模型 (1)记录汇总表
分析结果
上表输出总例数、删失例数、失访例数
Cox回归模型 (2)哑变量对照表
分析结果
Cox回归模型 (3)模型结果
分析结果
p=0.034,表明加入这些自变型 (3)模型结果
Cox回归模型
将h0(t)移至等式左边并去自然对数得:
ln[hi(t)/ h0(t)]=β1xi1+….+βpxip 等式左边的部分为相对风险度的自然对数值,等式右边部分
为伴随变量与相应回归系术的线性组合。
βj(j=1,2,…,p)的实际意义是:在p-1个伴随变量为一 定值时,当伴随变量 xj每改变一个测定单位时所引起的相对 风险度自然对数值的改变量。 Cox模型假定各自变量 xj的回 归系数 βj与危险度间呈指数函数关系。当 βj= 0 时,说明 xj对 危险度不起作用; βj 为正值时 xj 为危险因子,增大了危险度; βj 为负值时 xj = 1 与 xj = 0 的两个危险度相比,则得到一个与 h0(t)无关的比值,称为相对危险度。
自变量的相关系数矩阵
Cox回归模型 (5)自变量均数
分析结果
输出自变量均数
Cox回归模型 (6)生存曲线
分析结果
输出各自变量均值取值水平时的累积生存函数曲线
基本概念
生存时间(Survival Time): 从狭义的角度来说:生存时间是患某病的病人从发病到 死亡所经历的时间跨度。 生存时间 开始发病 病人死亡
从广义的角度:从某种起始事件到达某种终点时间所经历 的时间跨度。 生存时间 起始事件 终点事件
生存时间的数据类型
1. 完全数据( Complete Data)指达到了明确结局的观察对象 的生存时间数据。某个观察对象具有明确的结局时,该观察 对象所提供的关于生存时间的信息是完整的。
0:死亡、1:删失 0:无术中放疗、1:有术中放疗 0:男、1:女 0:胰脏头部、1:头部以外 1:ch0、2:ch1、3:ch2、4:ch3 0:无、1:有 3:Ⅲ期、4:Ⅳ期
Cox回归模型
Cox回归模型
Cox回归模型
ch为有序多分类,将其指定为哑变量进行分析
Cox回归模型
累积生存 函数曲线
分析结果
5

6
Kaplan-meier过程 (2)生存时间估计
分析结果
Mean是生存时间的算术均数, Median为中位生存时间, 同时表格中也给出它们的95%的可信区间。
Kaplan-meier过程 (3)水平间的整体比较
分析结果
Log Rank、Breslow和Tarone-Ware三种检验方法的检验统计 量分别为3.282、2.861和3.360,它们的p值分别为0.194、0.239 和0.186,说明三组疗法之间生存时间的差异无显著性
Kaplan-meier法用于:
估计某因素不同水平的中位生存时间
比较研究因素不同水平的生存时间有无差异 控制一分层因素后对研究因素不同水平的生存时间比较
Kaplan-meier过程
例1:3种疗法治疗66例白血病患者缓解时间(天),数据
(kaplanm.sav)如下 A疗法:4,5,9,10,11,12,13,28,28,28,29,31, 32,37,41,41,57,62,74,100,139,20+,258+,269 B疗法:8,10,10,12,14,20,48,70,75,99,103, 162,169,195,220,161+,199+,217+,245+ C疗法:8,10,11,23,25,28,28,31,31,40,48,89,
生存分析方法
Kaplan-meier过程 这是一种非参数法,主要用于小样本,适用于能够准 确记录事件和删失发生时点的数据。
Life Tables过程
也叫寿命表法,适用于样本量大,且不太可能准确记 载每个观察对象的死亡或删失发生时间的数据。 Cox回归模型分析法 用于描述多个变量对生存时间的影响
Kaplan-meier过程
Hazard:累积风险函数估计
Cumulative events:终结事件的累积频数
Kaplan-meier过程
生存分析表 平均生存时间和中位
生存时间及其标准误
和可信区间 累积生存函数曲线
相关主题