生存分析 SPSS
l n l n St ( |x ) ' l n H () t x 0
St ( |x ) [ S () t] 0
e x p (x ' )
或 者
例18.1数据拟合Cox回归模型的SPSS输出:
可以得到各种点图(1)
S u rviva l Fu n c tio n fo r p a tte rn s 1 - 2
SPSS软件使用说明(Kaplan-Meier方法 )
• 选择Analyze-Survival-Kaplan-Meier; • 然后把变量time选入Time;把变量censored选入 Status,再点击Define Event来定义未删失值为1; 再把变量treat选入Factor; • 之后点击Options,在其中点击Survival Table(s) (默认值)和其他需要的表格;在Plot选择需要 的图,比如Survival; • 回到主对话框后,点击Compare Factor Levels来 选择需要的检验;也可点击Save来存储一些输出。 然后在点击Continue之后,最后点击OK来运行。
统计学
─从数据到结论
第十七章 生存分析
什么是生存分析的内容?
• “我的期望年龄是多少岁?” • “到底这个新疗法能使得这类绝症 患者多存活多久?”“还有什么别 的因素和存活长短有关?” • 保险公司也要考虑各种人群的寿命, 以确保其人寿保险或医疗保险既具 有竞争力又有利可图。 • 在工程上,人们也会考虑一个材料, 一个原件,甚至一个设备的寿命是 多少。
17.1 对生命数据的简单描述:生命表
• 生命表 (Life Table) 是对生存分析 数据的一种数量和图形的描述。 • 生命表计算出一些估计,并依此 画出描绘性的图。 • 下页的生存函数图是从简单生命 表得到的:
Survival Function
1.1 1.0 .9 .8 .7 .6 .5 .4 .3 .2 .1 0.0 0 20 40 60 80 100 120 140 160 180 1.00 .00
例子
• 这里的所谓删失 (censored) 是由于某 种原因,无法继续观测;这意味着老 鼠至少活过了这个最后记录的时间, 但最终活了多久就不得而知了。 • 这种删失在对于人类疾病的跟踪研究 中经常出现;虽然不如未删失 (uncensored) 的数据完整,但也包含 了其至少活了多久这样的信息。 • 这里数据中的删失称为右删失。
17.3 回归:COX 比例危险模型 • 回归的方法对于统计推断是十分重 要的。那么,如何在生存数据的分 析上建立回归模型呢? • 人们一般希望生存函数能表示为某 些相关的自变量的一个函数。在例 18.1中的自变量就是判别治疗组和对 照组的哑元; • 自变量还可能是连续变量,比如年 龄,药物剂量等等。
组别
1.00 1.00-censored
存活时间
治疗组与对照组的生存函数是否不同:三种检验 • 在存在任意右删失 ( 例 18.1 数据的删失就是右 删失)的情况下,利用SPSS软件可以得到三种 对治疗组和对照组进行比较的检验;检验的 零假设均为:这两组的生存函数相同。这三 种检验是对数秩(logrank)检验(Mantel-Cox 检验)、Breslow检验(对前面Wilcoxon检验的 改进),以及Tarone-Ware检验。通过软件计 算可以得到这三种检验的结果:
横坐标为生存的时间,而纵坐标是生 存函数的大小。显然,随着时间流逝, 生存的概率应该递减;因此这种曲线 都是呈下降趋势。治疗组的生存概率 要比对照组看上去要高。
组别
存活时间
还可以得到生命表中的其他量的图,比如估计 的概率密度函数和危险函数。由于它们并不比 生存函数更直观,这里就不给出了。
检验治疗组与对照组的生存函数是否不同: Wilcoxon (Gehan)检验。
SPSS软件使用说明(Cox 比例危险模型 )
• 选择Analyze-Survival-Cox Regression; • 然后把变量time选入Time;把变量censored选入Status, 再点击Define Event来定义未删失值为1;再把变量treat 选入Covariates;之后点击Categorical,把treat选入; • 在主对话框点击Options,在其中选择需要的表格输出 内容; • 在主对话框点击Plots,选择需要的图形,其中可以把 Covariate Values Plotted at中的treat选入Separate Lines for以把定性协变量的不同水平的曲线放到一张图中 [1]。 然后在点击Continue之后,回到主对话框,最后点击 OK来运行。 • [1] 注意在SPSS12.0之前的SPSS版本,这个操作有问题 (不能实现)。
一些概念
• 在生存分析中,人们往往希望知道 存活过时间 t 的概率,这就是所谓的 生存函数(survival function)S(t)。 • 显然它等于 1 减去生存时间少于 t 的 概率,即S(t)=1-F(t)。 • 还有一个在 t 时刻处 ( 附近 ) ,对死亡 发生的可能性进行度量的函数,称 为危险函数(hazard function),用h(t) 表示,它实际上是 -lnS(t) 的关于 t 的 导数(见后面公式)。
S u rviva l Tim e
SPSS软件使用说明(描述性生命表 )
• 选择Analyze-Survival-Life Tables; • 然后把变量time选入Time; • 再在Display Time Intervals选0 though 200 by 1 (或者诸如5等任意间隔); • 把变量censored选入Status,再点击Define Event 来定义未删失值用1代表;再把变量treat选入 Factor,再点击Define Range,在Minimum和 Maximum分别选0和1; • 之后点击Options,在其中点击Life Table(默认 值);在Plot选择需要的图,比如Survival; • 在Compare Levels of First Factor处,可点 Overall或根据需要。然后在点击Continue之后, 点击OK来运行。
什么是生存分析的内容?
• 对于某一特定个体“能够活多久” 这一类的问题,任何负责任的人都 不会作出确定的回答。 • 但是对于具有某些性质的一类人群, 则可以通过对数据的分析来得到活 过一定时间的概率。 • 如果关心不同治疗手段的效果,则 可以通过数据分析来比较这些方法, 看它们是否有效,还能建立可以预 测的量化的模型。下面引进一个例 子。
• 在上面得到的生存函数的估计下,可 以对治疗组和对照组进行比较。所用 的检验为Wilcoxon (Gehan)检验。 • 这里的零假设是:这两组的生存函数 相同。 • 可以很容易从计算机输出得到检验的 p- 值等于 0.0564 。因此,如取显著性 水平为0.05,就不能拒绝零假设。
17.2 对简单生命表的改进:Kaplan-Meier方法
附录:对生命数据的简单描述:生命表
• 简单生命表对每个分析者确 定 的 宽 度 为 hi 的 时 间 段 i: (ti, ti+1) , 给 出 了 如 下 信 息 (以SPSS输出为例):
简单生命表 • 在这个输出中的多数概念都是很容易 理解的,最多参见最后一列的简单定 义。 • 这种表格仅仅是数据通过初等运算的 一些汇总。具体的生命表就不在这里 展示了。后面一节还将介绍并展示改 进的生命表。根据这里的生命表可以 绘出描述性的图。 • 图18.1是根据例18.1数据绘出的对治 疗组(组1)和对照组(组0)所估计 的生存函数图。返回到生存函数图
Group
.00 1.00 0.8
1.0
0.6
0.4
根据Cox模型所估计的 治疗组(group=1)和对照 组(group=0)的生存函数 图
Cu m S u rviva l
0.2
0.0 0.00 20.00 40.00 60.00 80.00
S u rviva l Tim e
可以得到各种点图(2)
例子
• 例 18.1 (数据 surv.txt )为了研究对农 药中毒的治疗,需要进行动物试验。研 究人员利用 40只老鼠进行某种农药中毒 后的某种治疗方法试验。 • 其中有20只鼠接受治疗处理;而作为对 照的另外20只鼠没有接受治疗。 • 在此之后观察这些老鼠的生存时间 ( 天 数)。对每一个鼠都记录了其存活时间(t)、 是否属于治疗组以及是否在某观测时间 段数据出现删失。
17.3 回归:COX 比例危险模型
• 用 x 表示自变量(变量可能是向量,即有 多个自变量); • 用S(ห้องสมุดไป่ตู้|x)表示在时间t的生存函数,这里的x 表示有关的自变量; • 用 S0(t) 表 示 待 估 计 的 基 本 生 存 函 数 (baseline survival function);它和自变 量x无关; • Cox 比例危险模型为
• 前面的描述性生命表有些粗糙,对于删失数 据的处理也过于简单。 • Kaplan-Meier 方法对其进行了改进。主要是 对 累 积 生 存 函 数 ( 输 出 列 为 Cumulative Survival)的估计方法和前面的不同。 • 下 面 的 表 格 为 根 据 例 18.1 数 据 按 照 KaplanMeier方法所产生的生命表。 • 这里一共两个表:第一个是对照组的 ( treat=0 ),第二个是治疗组的( treat=1 )。 这里 Status=1 意味着没有删失,而 Status=0 意 味着有删失。
本章的内容和公式(基本)
本章的内容和公式(Kaplan-Meier)
本章的内容和公式(Cox模型)
Ha za rd Fu n c tio n fo r p a tte rn s 1 - 2
Group
.00 1.00 4