当前位置:
文档之家› 第17章 生存分析 医学统计学
第17章 生存分析 医学统计学
随访资料的生存分析 Survival Analysis
一、生存分析的意义
生存分析不仅仅是字面上的“生存分析”,它 代表了一种基本的分析思想。 ▪原义:
生存分析原先是用来分析特定人群的生命过程 或死亡过程的统计方法。该人群出生后,按照一定 的年龄组死亡率先后死去,直到全部死亡为止,用 统计学方法推算出该人群在不同年龄组的“生存概 率”、“预期寿命”等指标。
N of Re m ai ni n g
Cas es
1
1
1
.909
.087
1
10
2
2
1
.818
.116
2
9
3
3
1
.727
.134
3
8
4
5
1
.636
.145
4
7
5
6
1
.545
.150
5
6
6
9
0
.
.
5
5
7
11
1
.436
.155
6
4
8
13
1
.327
.150
7
3
9
16
1
.218
.134
8
210 261 Nhomakorabea.109
月数 0~ 1~ 2~ 3~ 4~ 5~ 6~ 7~ 8~9
失访数 2 1
3
2
0
1
0
1
0
死亡数 17 26 27 15 2
2
0
0
1
10
4、生存率(survival rate)
实际应当是生存概率,指某个观察对象活过t时 刻的概率,常用P(X>t)表示。如P(X>10)表示某对 象活过10天(或10月、10年)的概率。
7
2、截尾值(censored value) :删失值。 有的观察对象终止随访不是由于失败事件发生,
而是由于中途失访、死于其它原因、随访截止。由 于不知道这些观察对象发生失败事件的时间,他们 的资料不能提供完全的信息,这些对象的观察值称 为截尾值,常用符号“+”表示。如140+天。
8
3、生存时间(survival time) 即随访观察持续的实足时间,按失败事件发生或
Breslow检验。
19
3、生存过程的影响因素分析 比较不同亚人群的生存状况,进行两组或多组生
存率比较,以了解哪些因素会影响目标人群的生存过 程,这是生存分析方法最重要的研究内容,在临床医 学中应用非常广泛。
例如分析影响乳腺癌病人手术后预后的因素,可 以是病人的年龄、病程、术前健康状况、有无淋巴结 转移、术后有无感染、辅助治疗措施、营养等。
5.88 2
19 .6 82
Es ti m ate 11 .0 00
S td. Er ror
4.64 2
95 % C on fi den ce In terva l
Lower Bou n d Upper Bou nd
1.90 1
20 .0 99
a. Es ti m ati on i s l i m ite d to the la rge st survi val ti me i f i t i s cen sored.
6
4
13
1
.3273
.1497
7
3
16
1
.2182
.1337
8
2
26
1
.1091
.1021
9
1
37
0
9
0
Number of Cases: 11
Censored: 2
( 18.18%) Events: 9
Survival Time Standard Error 95% Confidence Interval
失访前最后一次的随访时间记录。按天、周、月、 年等时间单位记录,常用符号t表示。
一般情况下较细的时间单位准确性较高,应尽量 以个体为单位采用较细的时间单位来记录。但在许 多大型的随访中,不可能做到按个体记录,常见的 是按固定时间段(如一月一次等)记录有多少人失 访及多少人发生失败事件,此为分组生存资料。
平均存活时间: 13
4
(
6,
20 )
(Limited to
37 )
中位存活时间: 11
5
(
2,
20 )
25
S urvival Tabl e
Ti m e
Cumulative Proportion
Surviving at the Time
N of
C u mu la ti ve
Status Es timate Std. Error Events
点,计算某个时点的生存率、生存率曲线的变动趋势 等。
例如根据白血病化疗后的缓解年数资料,可以估 计不同年数的缓解率P(X>t),如P(X>3)、P(X>5)等, 也可以获得这些病人的缓解率曲线。 常用方法:乘积极限法和寿命表法。
18
2、比较生存过程 两组或多组生存曲线比较。 常用方法:对数秩检验、Gehan比分检验、
6
1、“死亡”事件或称失败事件(failure event) : 表示观察到随访对象出现了我们所规定的结局,是 反映处理因素失败或失效的特征。如乳腺癌病人手 术后复发、肾移植病人肾功能衰竭、白血病患者化 疗后的复发等。 失败事件的认定是生存分析的基石,必须绝对准确。 注意:失效事件应当由研究目的而定,并非一定是 死亡,而死亡也并非一定是失败事件。
2
▪原理及方法在其他领域的应用
利用生存分析的原理和方法,把“出生”、“死亡” 的涵义稍加变通,在医学研究中可以有广泛的应用。
3
应用举例: ▪ 观察某“手术或化疗”对恶性肿瘤病人的疗效,可将
“手术或化疗”代替“出生”,用生存分析来分析接 受该处理患者的生存时间以及活过某时点的概率。 ▪ 以第一次心肌梗死代替“出生”,以第二次心肌梗死 代替“死亡”,用生存分析可以预计在多少年或月内 发生第二次心肌梗死的概率。
34
35
36
Survival Function
1.2
1.0
.8
.6
.4
.2
0.0
0
2
4
6
生存时间
Cases weighted by 人数
生存率曲线
与未分组资料的生存率 曲线的不同之处是:
生存率的各点在各 组段的上限处,用折线 连接各点。
8
10
37
总体生存率可信区间的估计
用正态近似原理估计某时点总体生存率的可信区
l,2,3,5,6,9+,11,13,16,26,37+ 试估计各时点生存率及其标准误。
21
(1)死亡数(dx):与生存时间对应的发生死 亡时间的人数。
(2)期初病例数(nx):恰好在X时刻以前的病 例数。
(3)条件死亡概率(qx):恰好在X月前的观察 对象在X月时点死亡的概率。
(4)条件生存概率:恰好在X月前的观察对象活 过X月时点的概率。
Cox比例风险回归模型。
20
三、生存资料的统计描述和生存 率的区间估计
(一)未分组资料的生存分析(小样本,原始数据形式)
用乘积极限法(product-limited estimates);又称 Kaplan-Meier法,是一种非参数方法,主要适用于 观察例数不多时。
例:某种治疗方案治疗Ⅲ期肺癌患者11例,随访时间(月)记 录如下:
27
2、生存率曲线
未分组资料的生存率曲线也称Kaplan—Meier曲线, 它是以时间t为横轴,生存率P(X>t)为纵轴,水平横 线的长短代表一个t时点到下一个t时点的距离,从而 表示时间与生存率关系的曲线。
28
Survival Function
1.2
1.0
.8
.6
.4
.2
0.0 0
Survival Function
.102
9
1
11 37
0
.
.
9
0
26
Me an s an d Medi an s fo r Su rvi va l Ti me
Me ana
Me di an
Es ti m ate 12 .7 82
S td. Er ror
3.52 1
95 % C on fi den ce In terva l
Lower Bou n d Upper Bou nd
13
记录影响生存的有关因素
如病人年龄、病程、健康状况、经济、文化、 职业等因素,以便分析这些因素对生存率的影响。
14
随访资料数据的特点: (1)应变量有两个,即生存时间(天数)和结局(死亡与否)。 (2)生存时间存在观察不完全的数据。
15
(四)生存分析的主要内容和基本方法
1、描述生存过程 研究人群生存状态的规律,如生存时间的分布特
31
(二)分组资料的生存分析
▪应用:
1、当随访资料的例数较多(如n>50)时,可先将原始资料分组 再进行分析。 2、很多随访研究设计的随访时间是一年或一个月一次,随访 结果只有该年或该月期间的若干观察人数、发生失败事件人数 和截尾人数,没有各个病例的确切观察时间,所获得的资料只
能视为分组资料。
32
qx
dx nx
pˆ x
1
qx
1
dx nx
23
(5)生存率 P(X>t):即观察对象活过某时点 的概率。
某时点的生存率为≤t时刻的各时点条件生 存率的乘积。
p(x t) pˆ x 如:p(x 3) pˆ 1 pˆ 2 pˆ 3 0.7273