当前位置：文档之家› 第15章生存分析

第15章生存分析

观察对象在时间区间 t，t t ]内的死亡人数 [ f (t ) 观察总人数 [t，t t ]时间区间所包含的单位时间数
风险函数
它表示已存活到时刻t的观察对象在时刻t的瞬
时死亡率，又称危险函数，常用h(t)表示：
h(t ) lim Pr ob(t T t t T t ) t f (t ) S (t )
生存分析的基本方法
统计描述
非参数检验半参数模型回归分析参数模型回归分析
统计描述

包括求生存时间的分位数、中数生存期、平均数、生存函数的估计、判断生存时间的图示法，不对所分析的数据作出任何统计推断结论。用描述法进行生存分析的基本方法是根据样本观察值提供的信息，直接用上述给出的估计公式计算出在每一时间点或每一个时间区间上的生存函数、死亡函数、风险函数以及计算出生存时间的百分位数、平均数、半数生存期等，并采用列表或绘图的形式显示生存时间的分布规律。
死亡密度函数

死亡密度函数简称为密度函数，观察对象在某时刻t 的瞬时死亡率，常用f(t)表示：
Pr ob(t T t t ) f (t ) lim F (t ) t
该函数表示观察对象死于(t，t+△t)小区间内的概率的极限。在具体问题中，该函数在ｔ时刻的取值可用下式来估计∶ f(t)≈t时刻开始的区间内(t，t+△t)的死亡人数／ (观察总人数×区间宽度)
非参数分析方法 SAS程序
DATA＝数据集：规定PROC FREQ语句使用的数据集； METHOD=方法：指定估计生存率所用的方法；① PL，要求用乘积极限法(即Kaplam-Meier法)估计生存率并计算中位生存时间等，为缺省方法。②LT，要求用寿命表法估计生存率等。③INTERVALS=(初值 TO 终值 BY 步长) 只能在指定分析方法为寿命表法时使用。用寿命表法分析时，程序会自动给定生存时间的区间。如果人为规定生存时间的分组区间，则需用该选项指定。步长的缺省值为1。
Hale Waihona Puke 非参数分析方法 SAS程序
NOTABLE：指令不输出生存函数估计结果，
只输出生存时间的截尾数据和完全数据的个数以及散点图和检验结果。 TIME语句用于定义生存时间和截尾指示变量。对截尾指示变量可以指定发生失效事件的数值，默认失效事件用0来表示，截尾事件用1 来表示。
非参数分析方法 SAS程序
该函数表示一个已存活到时刻t的观察对象死
于(t,t+△t)小区间内的概率的极限，它实际上是一个条件瞬时死亡率。在具体问题中，该函数在ｔ时刻的取值可用下式来估计：
t ) f (t ) h(
S (t ) 观察对象在时间区间 t，t t ]内的死亡人数 [ t时间生存者人数 [t，t t ]时间区间所包含的单位时间数

生存时间函数
描述生存时间分布规律的函数统称为生存时
间函数。常用的有生存函数、死亡函数、死亡密度函数和风险函数。
生存函数

生存函数也称为生存概率或累积生存率，它表示观察对象生存时间T大于某时刻t的概率常用S(t)表示：
S (t ) Pr ob(T t )
在具体问题中，该函数在ｔ时刻的取值可用下式来估计∶ S(t)≈生存时间长于ｔ的观察对象人数／观察对象总数显然，S(t)是一个随时间增加而下降的函数，它表示观察对象随访到t时刻的累积生存率。
第15章生存分析
学习目标
了解生存分析的应用范围和数据特点；
熟悉常见的生存时间分布规律的函数；掌握生存率的两种估计方法：乘积极限法和
寿命表法；掌握估计和比较生存函数的SAS程序； Cox回归的形式、数据格式、应用和SAS程序。
生存分析简介
在医学研究中，常常用随访的方式来研究事物发展的规律。例如，了解某药物的疗效，了解某仪器设备的使用寿命，了解手术后的存活时间等等。这种研究的特点是追踪研究的现象都要经过一段时间，统计学上将这段时间称为生存时间。生存分析就是用来研究生存时间的分布规律以及生存时间和相关因素之间关系的一种统计分析方法。生存分析在医学科学研究中具有广泛而重要的应用价值，它对人群寿命的研究，各种慢性疾病的现场追踪研究，临床疗效试验和动物试验等研究中随访资料的处理起着举足轻重的作用。

生存数据

生存时间资料与多元线性回归资料很相似，只不过因变量通常为观测对象生存的时间，常用ｔ来表示。当然，生存时间是广义的，可以指在通常意义下生物体的生存时间、也可以指所关心的某现象（如疾病治愈后、合格品使用后）持续的时间。若生存时间是准确观测到的，则称为完全数据，它提供的关于生存时间的信息是完整确切的，也就是说它准确地度量了观察对象实际生存时间。但是生存资料的一个明显特点是：所收集的资料中常常包含不完全数据，也称为截尾数据、删失数据。包括删失数据的资料，称为删失资料（或截尾数据）。它提供的关于生存时间的信息是不完整不确切的，也就是说它没有准确地度量观察对象实际生存的时间。

均数、中位数和半数生存期
总之，生存分析主要包括四个方面的内容：
①描述生存过程，即研究生存时间的分布规律；②比较生存过程，即研究两组或多组生存时间的分布规律，并进行比较；③分析危险因素，即研究危险因素对生存过程的影响； ④建立数学模型，即将生存时间与相关危险因素的依存关系用一个数学式子表示出来。
生存数据

一般地，截尾数据可分为右截尾、左截尾、区间截尾等不同类型。右截尾数据表示观察对象至少存活到时刻t，即生存时间的上界是未知的。右截尾数据一般出现在随访过程中某些观察对象失访或死于其它原因，或在规定的研究过程结束时观察对象的终止事件还未发生。左截尾数据表示观察对象至多存活到时刻t，即生存时间的上界是已知的，但确切的生存时间是未知的。区间截尾数据表示观察对象至少存活到t1时刻且至多存活到t2时刻。
非参数分析方法 SAS程序

SAS系统中，LIFETEST过程提供非参数分析方法，用乘积极限法和寿命表法估计生存率和中位生存时间等；用对数秩检验(Log-rank test)、Wilcoxon检验和似然比检验等做分组比较。该过程主要用于估计生存率及进行单因素分析。 LIFETEST过程的语法格式如下： PROC LIFETEST <options>; TIME 生存时间变量*截尾指示变量（数字）; TEST <分组变量名列>; STRATA <分组变量名列>; FREQ <变量名列>; BY <变量名列>;] Run;

Cox模型

像通常的回归分析一样，人们也希望能建立起生存时间（因变量或反应变量）随危险因素（自变量或协变量）变化的回归方程，以便对危险因素的作用大小有一个全面的了解和掌握、并根据危险因素的不同取值对生存概率进行预测。由于很难获得准确的生存时间，前述目的较难直接实现。1972年Cox 提出了比例危险模型，简称为Cox模型。由于此模型在表达形式上与参数模型相似，但在对模型中各参数进行估计时却不依赖于特定的假设，所以又称为半参数模型。
均数、中位数和半数生存期
除了上述的生存时间函数外，均数、中位数、半数生存期等也反映一组生存时间平均水平常用的统计指标。由于生存资料多呈正偏态分布，更适宜选用百分位数，包括中位数指标。半数生存期，指寿命的中位数，表示有且只有50% 的观察对象可以活这么长时间。由于截尾数据的存在，半数生存期的计算不同于普通的中位数，它可应用生存函数曲线图或生存函数公式，令生存率等于50%，然后推算生存时间。
统计描述
用描述法估计生存时间分布规律的优点是方
法简单且对数据的分布无要求，但它的缺点是①不能比较两组或多组生存时间分布函数的区别；②不能分析危险因素对生存时间的影响；③不能建立生存时间与危险因素之间的数量依存关系模型。
非参数检验

检验分组变量各水平所对应的生存曲线是否一致，对生存时间的分布没有要求，并且检验危险因素对生存时间的影响。非常数法可以用来完成：①估计生存函数； ②比较两组或多组生存函数；③分析危险因素对生存时间的影响。缺点是不能建立生存时间与危险因素之间的数量依存关系的数学模型。常用的方法有乘积极限法（PL法）和寿命表法（LT法）。

生存数据
生存数据，指的是生存时间以及与生存时间有关联的一组独立变量。这里主要解释与生存时间有关的几个概念。在生存分析中将生存时间定义为从某起始事件起到某终止事件为止所经历的时间跨度。例如，在临床研究中，冠心病患者在两次发作之间的时间间隔；在流行病学研究中，从开始接触危险因素到发病所经历的时间；在动物研究中，从开始给药到发生死亡所经历的时间。所以，生存时间也称为失效时间。

死亡函数
观察对象的生存时间T不大于某时刻t的概率
称为死亡函数，又称为死亡概率函数简称为死亡概率，它表示一个体从开始观察起到时刻ｔ为止的死亡概率，常用F(t)表示：
F (t ) Pr ob(T t )
显然，F(t)是一个随时间增加而上升的函数，
它表示观察对象随访到t时刻的累积死亡率。
生存数据

导致数据删失有很多原因，较常见的为失访和研究截止。由随机因素引起的，称为随机删失；若事先就定了截止日期，则称为定时删失；若事先就定了观察完多少例就截止研究，则称为定数删失。在表达删失数据时，常在其右上角放一个“＋”号；而用SAS软件分析时，常在其前放一个“－”号或产生１个指示变量（例如，Ｃ=０表示删失数据、Ｃ= １表示完全数据），便于计算时区别对待。为了使数据的表达与计算在形式上统一起来，本章一律用负数表示删失数据，因生存时间不可能为负值，故不会产生混淆。
生存数据

e商务文档

第15章生存分析

相关文档推荐：

e商务文档

第15章 生存分析

相关文档推荐：

第15章生存分析