当前位置:文档之家› 生存分析

生存分析

a
关于截尾或删失
9
删失的模式图
患者进入期间
a
随访开始
失访 失访 研究截止时仍存活
事件
研究截止时点
3.生存时间资料的整理: 10
对于随访资料,需记录的原始数据包括开始观 察的时点(起始事件发生的时间)、终止观察的 时点、研究对象的结局、考虑的影响因素。生 存时间为反映时间长短的指标,属数值变量:
生存时间( t )= 终止观察的时点–开始观察的
生存分析survival学研究中,为了了解某种疾病的预后、评价治疗 方法的优劣或观察预防保健措施的效果等,常需对 研究对象进行追踪观察,以获得必要的数据,这类 资料都属于随访资料。随访资料是指对一批研究对 象进行追踪观察所获得的有关其结局以及出现这种 结局所经历的时间等方面的资料。由于随访资料的 分析最初起源于对寿命资料的统计分析,故称为生 存分析,或称为生存时间分析。
表示。
生存率随时间 t 变化而变化,即生存率是相对于时间 t 的
函数,称为生存函数(survival function),记为 S t 。
生存函数在某时点的函数值就是生存率。
a
生存函数或生存率计算如下:
①若前 t 个时段没有删失: 14
S (t )
P(T
t)
t时段结束时仍存活的人 研究期初观察总人数
③ 估计生存率和生存时间长短,进行预后评价。
a
5
一、基本概念
(一)生存时间(survival time): 1.定义:广义的生存时间是指从某个起始事件开
始到某个终点事件的发生(出现反应)所经历的时 间。也称失效时间(failure time)。 2.特点: (1)分布类型不易确定。一般不服从正态分布,
1
M
3
03/02/83 12/31/86 失访
0
M
4
08/04/83 04/10/86 死亡
0
F
表 16-2 4 例鼻咽癌患者术后生存时间及相关资料整理表
病例号
1 2 3 4
生存时间(天)
t 1800 360 1400+ 990
结局
1 1 0 1
治疗方法
X1 1 1 0 0
性别
X2 F M M F
……
表示。
a
截尾值(Censored value)出现的原因
8
截尾的原因主要有3种: ①失访:生存但中途失访:包括拒绝访问、失去联
系等。 ②退出:中途退出试验、改变治疗方案、死于其它
与研究无关的原因:如肺癌患者死于心机梗塞、 自杀或因车祸死亡,终止随访时间为死亡时间。 ③终止:指观察期结束时仍未出现结局。
有时近似服从指数分布、Weibull分布、 Gompertz分布等,多数情况下往往不 服从任
何规则的分布类型。
a
6
(2)生存时间的影响因素多而7 复杂且不易控制。 (3)根据研究对象的结局,生存时间数据可分两种类型:
①完全数据(complete data):观察对象在观察期内出 现反应(终点事件),这时记录到的时间信息是完整的,这 种生存时间数据称为完全数据。 ②截尾数据(截尾值、删失数据,censored data):尚 未观察到研究对象出现反应(终点事件)时,即由于某种原 因停止了随访,这时记录到的时间信息是不完整的,这 种生存时间数据称为不完全数据或截尾值。常用符号“+”
时点;
结局变量( )反映终点事件是否发生,为二分 类的变量。通常用( t , )完整地表示一个观察
对象的随访结果。
a
表 16-1 4 例鼻咽癌患者术后随访记录
11
病例号 开始日期 终止日期 结局 治疗方法 性别 …
1
11/29/80
11/04/85 死亡
1
F
2
06/13/82 06/08/83 死亡
a
12
(二)死亡概率、死亡率:
死亡概率(mortality probability):是指某单位时段期初的观察对
象在该单位时段内死亡的可能性大小。
某单位时段内死亡数 q 该时段期初观察人数
(16.1)
若该时段内有删失,则分母用校正人口数:
校正人口数 期初观察人数 1 删失数 (16.2) 2
死亡率(mortality rate):指单位时间内研究对象的死亡频率或强
a
2
传统方法在分析随访资料时的困难
时间和生存结局都成为了要关心的因素
•除了生存结局作为判定标准以外,只要能让病人存活 时间延长,这种药物也应当是被认为有效的。即时间延 长也认为有效
•如果将两者均作为应变量拟和多元模型,因为时间分 布不明(一般不呈正态分布,在不同情况下的分布规律 也不同),拟和多元模型极为困难
存活的个体到该时段结束时仍13 存活的可能性大小,用 p
表示,公式如下:
活满某时段的人数 p 该时段期初观察人数 1- q
(16.5)
若该时段内有删失,则分母用校正人口数。
生存率(survival rate):指研究对象经历 t 个时段后仍存
活的概率,即生存时间大于等于 t 的概率,用 PT t
度,即平均每千人(或万人、百人等)中的死亡人数。
某单位时段内死亡数 m 该时段平均人口数
1000 ‰
(16.3)
平均人口数= 1 (该时段期初人口数+期末人口数) (16.4) 2
a
(三)生存概率、生存率、生存函数、生存率曲线: 生存概率(survival probability):表示某单位时段开始时
a
3
传统方法在分析随访资料时的困难
存在大量失访的资料
•失去联系(病人搬走,电话号码改变) •无法观察到结局(死于其他原因) •研究截止
显然,将失访数据无论是算作死亡还是存活似乎 都不大合理
a
4
第一节 概述
生存分析的方法已被广泛应用到医学研究领域,如现场 追踪研究、临床疗效试验、疾病预后分析等,生存时间的涵 义也随之扩展到更广义的范围,又称为时间-效应分析 (time-effect analysis)。其研究内容主要包括 3 个方面: ① 对生存状况进行统计描述(生存概率、生存率、中位生 存期等); ② 寻找影响生存时间的“危险因素”和“保护因素”;

(16.6)
如: n年生存率
活满n年的人数 研究期初观察人数
100 % 。
②若观察期内有删失:假定观察对象在各个单位时段
内是否生存的事件是相互独立的,其生存概率分别为
p1, p2 , p3 , , pt , 则根据概率乘法原理得
S(t) p1 p2 p3......pt p j
相关主题