应用统计学生存分析
1 2 3 4 5
分析结果
1.生存时间的组段下限 3.该组段的删失例数
2.进入该组段的观察例数 4.暴露于危险因素的例数
5.所关心的事件的例数,即死亡例数
2013年11月30日星期六
重庆交通大学管理学院
22:24:27
Life-Tables过程 (1)寿命表Ⅱ
1 2 3 4
分析结果
1. 所关心事件的观察单位数的比,即各组的死亡概率 2.各组的生存概率 3. 至本组段上限的生存函数估计值,由各组的生存概率累积相乘所得。
2013年11月30日星期六
重庆交通大学管理学院
22:24:27
Kaplan-meier过程
Kaplan-meier法用于:
估计某因素不同水平的中位生存时间
比较研究因素不同水平的生存时间有无差异 控制一分层因素后对研究因素不同水平的生存时间比较
2013年11月30日星期六
重庆交通大学管理学院
重庆交通大学管理学院
22:24:27
Kaplan-meier过程
生存分析表 平均生存时间和中位
生存时间及其标准误
和可信区间 累积生存函数曲线
2013年11月30日星期六
重庆交通大学管理学院
22:24:27
Kaplan-meier过程 (1)生存表分析
1.观察时间 2.生存状态 3.累积生存率 4.累积生存率 的标准差 5.累积死亡数 6.组中剩余人数
22:24:27
Life-Tables过程
寿命表 生存曲线 风险函数曲线
2013年11月30日星期六
重庆交通大学管理学院
22:24:27
Life-Tables过程 (1)寿命表(分三部分讲解)
分析结果
2013年11月30日星期六
重庆交通大学管理学院
22:24:27
Life-Tables过程 (1)寿命表Ⅰ
影响因素较多,规律难以估测。
2013年11月30日星期六
重庆交通大学管理学院
22:24:27
生存分析方法
Kaplan-meier过程 这是一种非参数法,主要用于小样本,适用于能够准 确记录事件和删失发生时点的数据。
Life Tables过程
也叫寿命表法,适用于样本量大,且不太可能准确记 载每个观察对象的死亡或删失发生时间的数据。 Cox回归模型分析法 用于描述多个变量对生存时间的影响
4. 概率密度,所有个体在时点t后单位时间内死亡概率估计值。
2013年11月30日星期六
重庆交通大学管理学院
22:24:27
Life-Tables过程 (1)寿命表Ⅲ
1 2 3 4
分析结果
1. 风险率。活过时点t个体在时点t后单位时间内死亡概率的估计值 2. 生存函数估计的标准误。 4. 风险率的标准误。
2013年11月30日星期六
重庆交通大学管理学院
22:24:27
基本概念
生存时间(Survival Time): 从狭义的角度来说:生存时间是患某病的病人从发病到 死亡所经历的时间跨度。 生存时间 开始发病 病人死亡
从广义的角度:从某种起始事件到达某种终点时间所经历 的时间跨度。 生存时间 起始事件 终点事件 重庆交通大学管理学院
124,143,12+,159+,190+,196+,197+,205+,219+
2013年11月30日星期六
重庆交通大学管理学院
22:24:27
Kaplan-meier过程
2013年11月30日星期六
重庆交通大学管理学院
22:24:27
Kaplan-meier过程
时间变量 结局变量
分组变量
2013年11月30日星期六
做出的生存曲线不同
统计学检验方法不同:Life Tables过程采用Wilcoxon法 ,Kaplan-Meier过程 用Log rank 法、Breslow法、Tarone-are法
2013年11月30日星期六
重庆交通大学管理学院
22:24:27
Cox回归模型 上面介绍的两种生存分析方法只能研究一至两 个因素对生存时间的影响,当生存时间的影响因 素有多个时,它们就无能为力了,下面介绍Cox Regression过程,这是一种专门用于生存时间多 变量分析的统计方法。
2013年11月30日星期六
重庆交通大学管理学院
22:24:27
Cox回归模型
将h0(t)移至等式左边并去自然对数得:
ln[hi(t)/ h0(t)]=β1xi1+….+βpxip 等式左边的部分为相对风险度的自然对数值,等式右边部分
为伴随变量与相应回归系术的线性组合。
βj(j=1,2,…,p)的实际意义是:在p-1个伴随变量为一 定值时,当伴随变量xj每改变一个测定单位时所引起的相对 风险度自然对数值的改变量。 Cox模型假定各自变量xj的回 归系数βj与危险度间呈指数函数关系。当βj=0时,说明xj对 危险度不起作用;βj 为正值时xj 为危险因子,增大了危险度; βj 为负值时xj =1与xj =0的两个危险度相比,则得到一个与 h0(t)无关的比值,称为相对危险度。
生存分析
2013年11月30日星期六
重庆交通大学管理学院
22:24:27
生存分析
生存分析 :在临床诊疗工作的评价中,慢性疾病的预
后一般不适用于治愈率、病死率等指标来考核,因为其无
法在短时间内明确判断预后情况,为此,只能对患者进行 长期随访,统计一定时期后的生存或死亡情况以判断诊疗
效果。
生存分析还适用于现场追踪研究(发病为阳性)、临床 疗效试验(痊愈或显效为阳性)、动物试验(发病或死亡) 等。
Kaplan-meier过程
Survival:累积生存率估计,选中,表明要求将各观察
样本的生存率存入原始数据库中 Standard error of survival:累积生存率估计的标准误
Hazard:累积风险函数估计
Cumulative events:终结事件的累积频数
2013年11月30日星期六
22:24:27
Kaplan-meier过程 (3)水平间的整体比较
分析结果
Log Rank、Breslow和Tarone-Ware三种检验方法的检验统计 量分别为3.282、2.861和3.360,它们的p值分别为0.194、0.239 和0.186,说明三组疗法之间生存时间的差异无显著性
2013年11月30日星期六
2013年11月30日星期六
重庆交通大学管理学院
22:24:27
生存时间资料的特点
有2个效应变量:一是生存时间(天数),二是结局
(死亡与否、是否阳性等)。
存在截尾数据:由于某种原因未能明确观察到随访 对象发生事先定义的终终事件。 分布类型复杂:生存时间资料常通过随访获得,因 观察时间长且难以控制混杂因素,故其分布常呈偏态,
2013年11月30日星期六
重庆交通大学管理学院
22:24:27
2013年11月30日星期六
重庆交通大学管理学院
22:24:27
Kaplan-meier过程
对组间生存函数的差异进行检验的方法 Log Rank法和Breslow法较为常用
2013年11月30日星期六
重庆交通大学管理学院
22:24:27
2013年11月30日星期六
分析结果
1
2
3
4
5
…
6
重庆交通大学管理学院
22:24:27
Kaplan-meier过程 (2)生存时间估计
分析结果
Mean是生存时间的算术均数, Median为中位生存时间, 同时表格中也给出它们的95%的可信区间。 重庆交通大学管理学院
2013年11月30日星期六
2013年11月30日星期六
重庆交通大学管理学院
22:24:27
Life-Tables过程
2013年11月30日星期六
重庆交通大学管理学院
22:24:27
Life-Tables过程
输出生存时间范围及组距:前一个框输入生存 时间上限,后一个框输入生存时间的组距
2013年11月30日星期六
重庆交通大学管理学院
2013年11月30日星期六
22:24:27
生存时间的数据类型
1.完全数据(Complete Data)指达到了明确结局的观察对象 的生存时间数据。某个观察对象具有明确的结局时,该观察 对象所提供的关于生存时间的信息是完整的。
2.截尾数据 (Censored Data):由于某种原因未能观察到观察 对象的明确的结局,所以不知道该观察对象的确切的生存时间, 就象该观察对象的生存时间在未到达规定的终点之前就被截尾 了。 截尾数据提供了部分关于生存时间的信息,使研究者知道 该观察对象至少在已经经历的这个时间长度内没有发生终点事 件,其真实的生存时间只能长于我们现在观察到的时间而不会 短于这个时间。(符号t+)
2013年11月30日星期六
3. 概率密度的标准误
重庆交通大学管理学院
22:24:27
Life-Tables过程 (2)累积生存函数曲线
分析结果
2013年11月30日星期六
重庆交通大学管理学院
22:24:27
Kaplan-Meler法和寿命表法的比较
基本思想不同:Life Tables 过程是将生存时间分成许多小的时间段,计算 该段内生存率的变化情况,分析的重点是研究总体生存规律;而KaplanMeier过程则是计算每一“结果”事件发生时点的生存率,分析的重点除 了研究总体生存规律外,还热心于寻找相关影响因素。 对于分层变量的处理不同:Life Tables 过程仅按该分层变量进行分层,没 有考虑其对生存时间的影响,即没有提供控制该分层变量的情况下对研究 因素对生存时间的影响进行统计分析的能力; Kaplan-Meier过程则是在控 制该分层变量的情况下对研究因素对生存时间的影响进行统计分析。