当前位置:文档之家› 生存分析论文

生存分析论文

《生存分析论文》题目:基于非参数分析法研究改进手术对患者生存时间的影响专业:班级:姓名:2015年6月25日摘要生存分析(survival analysis)是将事件的结果(终点事件)和出现这一结果所经历的时间结合起来分析的一种统计分析方法。

生存分析不同于其它多因素分析的主要区别点就是生存分析考虑了每个观测出现某一结局的时间长短。

临床随访,又称为前瞻性研究(prospective study),本文采用此方法进行两组肾移植的病人手术后的生存时间和结局的研究。

研究过程中主要面临的问题有:(1)结局及生存时间据需要考虑—经典的统计分析方法不能同时分析结局和生存时间;(2)随访研究中研究对象可能会失访或死于其他疾病;或因研究经费和时间的限制不可能等到所有的对象都出现结局---截尾(censoring)或终检。

生存分析能解决以上问题。

本文通过比较A组和B组两组实验数据来探究改进手术对患者生存时间的影响,通过最后结果可以看出,改进手术组会大大提高患者生存率,因此,今后医生应致力于手术改良,以多加提高患者的生存率。

关键词 Kaplan-Meier估计 Nelson-Aalen估计 Cox模型 SAS软件一、估计原理1.乘积极限法(Kaplan-Meier )Kaplan-Meier 分析方法,又称乘法极限估计、PL 法或最大似然估计法,是由Kaplan 和Meier 在1958年提出的一种求生存函数的非参数方法。

寿命表分析适用于大样本情况,在处理小样本时,为充分利用每个数据所包含的信息,Kaplan-Meier 分析便成为首选的分析工具。

乘积极限法(Kaplan-Meier )适用于离散数据,它用于建立时刻t 上的生存函数。

Kaplan-Meier 法是根据t 时刻及其之前各时间点上的条件生存率的乘积,来估计时刻t 的生存函数S(t)和它的标准误SE(S(t))。

设12t t tk ≤≤≤代表k 个观察对象的生存时间,设i n 为i t 时刻开始之前生存的个体数目,即危险集的大小(i=1,2,…,k ),再设i d 表示生存时间的截尾性质,i=1,2,…,k 。

又令i p 表示观察对象在时刻i t 的条件生存率,即对于i=1,2,…,k ,有:i ii i n d p n -=,其中1,0i i i i d ⎧=⎨⎩如果第个生存时间t 是完全数据;,如果第i 个生存时间t 是截尾数据;那么,观察对象在时刻t i 时的条件死亡率如下:1i i q p =-对于i=1,2,…,k ,Kaplan-Meier 法定义时刻t i 上的生存函数和它的标准误的估计公式如下:0(),1,2,.(())(ii k k i i S t p i k SE S t S t ∧=∧∧===除了生存函数,均数和中位数也是反映一组生存时间平均水平常用的统计指标。

但由于生存资料多呈偏正态分布,因而更适宜选用中位数,包括百分位数等指标。

2.log-rank 检验Log-rank 检验的渐进平均值E 和方差V :()()()11111/221112111211121211E=111kk kkd Kk ki ki k i k kiki d K ki k i ki d Kk ki k i k ki dK kik i ki ki ki ki ki ki kiV n n h h φθφφθφφφφθφθφφφθ========⎛⎫- ⎪++⎝⎭⎡⎤⎢⎥+⎢⎥⎣⎦+=+==∑∑∑∑∑∑∑∑12ki ki n n 、分别为实验组和对照组在第K 时间间隔第i 个病人死亡前生存的人数,12ki ki h h 、分别为实验组和对照组在第K 时间间隔第i 个病人死亡前的死亡危险率,k d 为第k 个时间间隔的死亡人数。

设/,k k k d d d d ρ==∑,则(E e D =其中,11/21()Ki ik K i i k e D ργρη===⎛⎫⎪⎝⎭∑∑,11i ii i i ii φθφγφθφ=-++,()21i i i φηφ=+ 将log-rank 统计量的分布视作N (E ,1),有:/2E αβμμ=+根据区间上两组概率分配向量中的治愈率,很容易求出所需总样本含量:2/()E C n d P P =+式中,E C P P 、为试验组和对照组的事件发生率。

在随访研究中,样本含量除受统计学要求及治疗效果影响外,还有许多不确定性影响因素,例如患者入组、失访、治愈时间的分布,患者在试验阶段的依从性,以及是否满足比例风险等等。

Log-rank 检验除考虑最后结局,还考虑了出现结局的时间,并充分利用失访资料所提供的不完全信息。

对于具体的试验,本法都能拟合一个独特的生存过程,较好反应实际情况,应用灵活,因此是一种有效、可行的样本含量估计方法,能更好适应临床试验的复杂性和多样性,巧妙解决多种复杂因素并存对样本含量的影响问题。

3.Nelson-Aalen 估计在有删失的情况下,可以根据累积死亡率与生存函数的关系()ln[()]H t S t ∧=-来估计累积死亡力函数H(t)。

这时估计式为:()ln[()]H t S t ∧∧=-。

另外有一个累积死亡 力估计式,它与以乘积限估计式为基础的估计式相比,具有更好的小样本性质,这一估计式由Nelson 建议,然后由Aalen 重新发现并加以改进,这就是Nelson-Aalen 估计式,即在最大的时间观察范围内的定义如下:0,(),i ii i t t it t H t d t t y ≤⎧⎪≤⎪=⎨≥⎪⎪⎩∑ 该估计式的方差可以从下式得到:22()i iH i t tid t y σ≤=∑以累积死亡率的Nelson-Aalen 估计式为基础,生存函数的另一个估计式为:()exp[()]S t H t ∧∧=-。

Nelson-Aalen 估计式在分析数据时主要有以下两方面的应用,其一是在选择事件发生时间的参数模型方面的应用,其二是为死亡率h(t)提供粗估计,这些估计值是Nelson-Aalen 估计式的斜率。

4.Cox 模型像通常的回归分析一样,人们也希望能建立起生存时间(因变量或反映变量)随危险因素(自变量或协变量)变化的回归过程,以便对危险因素的作用大小有一个全面的了解和掌握,并根据危险因素的不同取值对生存概率进行预测。

由于很难获得准确的生存时间,前述目的较难直接实现。

1972年Cox 提出了比例危险模型,简称Cox 模型。

由于此模型在表达形式上与参数模型相似,但在对模型中的各参数进行估计时却不依赖于特定的假设,所以又称为半参数模型。

设12(,,,)k x x x x =是影响生存时间t 的k 个危险因素。

设()i h t 为i 名受试者在时刻t 的风险率,即t 时刻外后一瞬间的死亡速率。

又设0()h t 表示不受危险因素x 的影响下,在时刻t 的风险率,又称为基准风险率或基准函数。

其模型的具体形式如下:01122()()exp()i i i m im h t h t x x x βββ=+++式中,()i h t 为第i 名受试者生存到t 时刻的危险率函数,0()h t 是当所有的危险因素(即0ij x =)不存在时的基础危险率函数,'12(,,,)i i im X x x x =是可能与生存时间有关的m 个危险因素所构成的向量。

在SAS 系统中,可以利用PHREG 过程对生存数据进行回归分析,结局变量(因变量)为生存时间,可以处理有截尾数据的生存时间。

模型中的自变量可以是连续性、分类变量、时间依存的自变量。

可以对比例风险模型是否成立作出检验,利用最大似然法迭代求出模型的参数估计,对模型的参数作似然比、比分和Wald 等检验。

PHREG 过程的语法格式如下: PROC PHREG DATA=[选项];MODEL <生存时间变量*截尾指示变量(数值)>=<自变量名>/[选项]; STRATA<分组变量名列>; FREQ<变量名列>; BY<变量名列>; RUN;二、实例背景:某医院泌尿外科于1979-1982年做了19例肾移植手术,拟了解肾移植后病人的生存时间(天)。

规定对方开始时间为病人术后一天,死亡事件为改病人因与肾移植有关的各种原因而死亡。

后改进手术方式,于1983-1986年又作了14例,该资料如下(有+的数据表示该病人截尾)。

数据:一般手术组(A组)改进手术组(B组)3 109 70+15 70+20 12020 22526 36630 390+41 475+46 518+64 647+64 801+135 1001+226 1045+365 1045+450596+680+900+900+三、SAS程序以及运行结果及分析1、Kaplan-Meier和Nelson-Aalen程序:data fujy;/*定义数据集*/input t@@; if t<0 then censor=1; else censor=0; /*如果时间小于0,为删失变量赋值为1,否则赋值为0*/if _n_<20 then group='A'; else group='B'; /*前二十个数据为A组,剩下的为B组*/t=abs(t); /*t的标准化*/cards;3 9 15 20 20 26 30 41 46 64 64 135 226 365 450 -596 -680 -900 -900 10 -70-70 120 225 366 -390 -475 -518 -647 -801 -1001 -1045 -1045; proc lifetest method=pl nelson plots=(s,ls,lls);/*利用lifetest过程进行生存分析并作生存函数图,pl为Kaplan-Meier,nelson为Nelson-Aalen*/ time t*censor(1); /*制定时间变量和删失变量,指出删失变量时删失变量的取值*/ strata group;/*指定分组变量*/run;运行结果:以下是Kaplan-Meier法和Nelson-Aalen法对A组生存资料进行统计描述的结LIFETEST 过程层1: group = A生存函数和累积危险率t 乘积极限Nelson-Aalen 失效数剩余数生存失效生存标准误差累积危险累积危险标准误差0.00 1.0000 0 0 0 . 0 19 3.00 0.9474 0.0526 0.0512 0.0526 0.0526 1 18 9.00 0.8947 0.1053 0.0704 0.1082 0.0765 2 17 15.00 0.8421 0.1579 0.0837 0.1670 0.0965 3 16 20.00 . . . . . 4 15 20.00 0.7368 0.2632 0.1010 0.2920 0.1309 5 14 26.00 0.6842 0.3158 0.1066 0.3634 0.1491 6 13 30.00 0.6316 0.3684 0.1107 0.4404 0.1678 7 12 41.00 0.5789 0.4211 0.1133 0.5237 0.1873 8 11 46.00 0.5263 0.4737 0.1145 0.6146 0.2082 9 10 64.00 . . . . . 10 9 64.00 0.4211 0.5789 0.1133 0.8146 0.2517 11 8 135.00 0.3684 0.6316 0.1107 0.9396 0.2810 12 7 226.00 0.3158 0.6842 0.1066 1.0825 0.3153 13 6 365.00 0.2632 0.7368 0.1010 1.2491 0.3566 14 5 450.00 0.2105 0.7895 0.0935 1.4491 0.4089 15 4 596.00 * . . . . . 15 3 680.00 * . . . . . 15 2 900.00 * . . . . . 15 1生存函数和累积危险率t 乘积极限Nelson-Aalen 失效数剩余数生存失效生存标准误差累积危险累积危险标准误差900.00 * 0.2105 0.7895 . . . 15 0第一列至第八列分别是生存时间、累积生存率、死亡概率、累计生存率标准误、累积危险率、累积危险标准误差、已观测到的失效时间的例数、尚未观测到的失效或截尾例数。

相关主题