生存分析(第17章)
2
A T2
T
16 23.8092
23.809
20 12.1912
12.191
7.56
组数 1 2 1 1, 0.005 P 0.01
结论:按=0.05水准拒绝H0 ,接受H1 ,可 以认为两种手术方式后病人的生存率有差别。
第四节 Cox比例风险回归模型
(Cox’s proportional hazard regression model)
1 1 23 1 0 1.605 20 2 0 1.395 43 3 2 2 22 0 0 0.550 18 1 0 0.450 40 1
26 59 1 1 0 1.000 0 0 0 0.000 1 1 合计 - - 16 7 23.809 - 20 0 12.191 - 36
生存时间
t时刻的观察单位数 总观察例数
生存概率针对单位时间;生存率针对某个 较长时间段,它是生存概率的累积结果。 如5年生存率是每一年不同生存概率乘积。
S(5, X) p1 p2 p5
7.风险函数 (hazard function,h(t,X))
生存时间已达到 t 的一群观测对象在 t 时 刻的瞬时死亡率。
二、大样本资料
1.生存率的计算 寿命表法(life table method)
表 17-3 2418 例男性心绞痛病人生存率及标准误的计算
生存时 间区间 (年)
ti-1
死亡 人数
di
截尾 人数
ci
起初 观察 人数
Li
校正观 察人数
Ni
死亡概率
qi
生存概率 生存率
pi
S(ti,X)
(1) (2) (3) (4) (5) (6)=(2)/(4) (7)=1-(6) (8)=∏(7)
甲(n=23):1,3,5,5,5,6,6,6,7,8, 10,10,14+,17,19 + ,20 + ,22 + ,26 + ,31 + ,34,34 + ,44,59。 乙(n=20):1,1,2,3,3,4,4,4,6,6, 8,9,9,10,11 ,12 ,13 ,14 ,15 ,17,18。
两种手术治疗方式术后病人生存曲线比较 3.生存曲线
1.0
%
.8
生 存 .6 率 ( ) .4
.2
0.0 0
10
20
30
40
50
生存时间(月)
组别
乙种手术 乙-censored 甲种手术 甲-censored 60
4.中位生存时间 有50%的个体其存活期大于该时刻。 图解法:简单直观,结果粗略。 线性内插法(利用线性比例关系): t=8, S(8,X)=0.565; t=10, S(10,X)=0.478 (8–10):(8 – t)=(0.565 – 0.478):(0.565 – 0.50) t=9.494(月)
乘积极限法 (product-limited method) 由Kaplan-Meier于1958年提出,又称为 Kaplan-Meier法 利用概率乘法原理计算生存率
例 有人研究了甲种手术方法治疗肾上腺肿瘤 病人23例的生存情况,定义从手术后到病人 死亡的时间为生存时间,得到生存时间(月) 如下(+为截尾数据),试计算其生存率与 标准误。
第十七章 生存分析 survival analysis
随访观测评价临床疗效存在三个问题:
两种治疗方法的治愈率相同,但平均治愈 天数不同。
甲、乙两种药物治疗某病治愈率均为90%, 甲药治疗的患者平均12天出院,乙药治疗的 患者平均7天出院。
一部分研究对象可观测到死亡,得到准确 生存时间(完全数据);一部分研究对象中
(二)随访方式
×
○
×
○
0 始点
○ ○
× ×
×
死亡
○
失访 治疗措施改变 死于其他疾病
○
t 时间 终点
×
○
×
○
0 始点
○ ○
× ×
○
×
死亡
○
失访 治疗措施改变 死于其他疾病
t 终点
时间
×
○
0 始点
×
○
t 终点
○
○
×
死亡
×
○
失访
×
治疗措施改变
死于其他疾病
○
时间
三、生存分析研究的主要内容
1.描述生存过程 生存时间分布特点、估计生存率及平 均生存时间、绘制生存曲线。
终点事件
死亡
重新吸烟 复发 下一次发作 发病 治愈
2.截尾值(censored value,+)
随访中由于某种原因未能观测到病人的明确 结局,提示真实生存时间长于观测到的时间。
原因: 失访; 死于其他疾病; 病人生存期超过研究的终止期;动物试验到 达终止期未出现规定终止事件; 治疗措施改变。
又称删失值或终检值 ,本章讨论右删失情况。
t
死亡人 数 d
起初观 察人数
n
死亡概 率
q=d/n
生存概 率
p=1-q
生存率 S(t,X) =∏p
标准误 SE
(1) (2) (3) (4) (5) (6) (7)
1
1
1
23
0.043 0.957 0.957 0.0425
2
3
1
22
0.045 0.955 0.914 0.0588
3
5
3
21
0.143 0.857 0.783 0.0860
生存时间分布通常不服从正态分布。
生存分析是将事件发生的结果与随访时间两 个因素结合起来、可以对完全或不完全数据 进行分析的方法。
第一节 生存分析中的基本概念
一、名词解释
1.生存时间(survival time, t )
起始事件
发病
戒烟开始 白血病治疗缓解 冠心病前一次发作 接触危险因素 开始服药
14 ~ 15 ~
6 33 59 42.5 0 20 20 10.0
0.1412 0.0000
0.8588 1.0000
0.1405 0.0137
0.1405 0.0137
( 点1ti);时在间区区间间内死ti亡1,;ti 在 :区继间续内生截存尾到。区间终
(2)死亡人数di: (3)截尾人数ci: (4)起初观察人数Li: (5)校正观察人数Ni: Ni=Li-ci/2
3.死亡率(mortality rate,m )
单位时间内死亡频率或强度。
年死亡率
m
同年内死亡人数 某年平均人数
年平均人数=(年初人数+年终人数)/2
4.死亡概率(mortality probability, q )
死于某阶段内的可能性大小。
年死亡概率q
同年内死亡人数 某年年初人数
有删失值时: 年初人数=原年初人数(删失例数)/2
SE S(t,X) d n(n d)
d为 t时刻各种非截尾值所对应的死亡人数
SEt5 0.783
1 1 3 0.0860 23 22 22 21 2118
总体率1-的可信区间
S(t,X) u / 2SE
如样本生存率为S(5, X) 0.783时, 其 总 体 生 存 率 的95%可 信 区 间 为 : 0.783 1.96 0.0860 (0.6144,0.9516)
1,3,5,5,5,6,6,6,7,8,10,10, 14+,17,19 + ,20 + ,22 + ,26 + ,31 + , 34,34 + ,44,59。
相同数据只列一次;完全数据与截尾值相同时,截尾值在后。
表 17-1 甲种手术方式治疗 23 例肾上腺肿瘤病人的生存率计算
序号 i
时间 (月)
14
31+
0
5
0.000 1.000 0.430 0.1041
15
34
1
4
0.250 0.750 0.323 0.1216
16
34+
0
3
0.000 1.000 0.323 0.1216
17
44
1
2
0.500 0.500 0.161 0.1293
18
59
1
1
1.000 0.000 0.000
—
2.生存率标准误的计算
途失访、或死于其它疾病、或观测结束时仍
存活,得不到准确生存时间(不完全数据)。
10 年间 346 例大肠癌患者手术后的生存时间记录
患者 编号
性 年龄 别 (岁)
确诊到手 术间隔时 间(月)
手术开 始时间
终止随 访时间
结局
生存 时间 (月)
1 男 32 10 94.01.23 94.12.24 死亡
生存率 标准误
SE
(9)
0 ~ 456 0 2418 2418.0 0.1886 0.8114 0.8114 0.0080
1 ~ 226 39 1962 1942.5 0.1163 0.8837 0.7170 0.0092
2 ~ 152 22 1697 1686.0 0.0902 0.9098 0.6524 0.0097
(生存过程的影响因素分析)
1972年由英国统计学家 D. R. Cox 提出,解决 以下问题:
在生存时间的分布种类繁多且难以确定、存
在截尾数据的情况下,研究协变量X与生存函
数S(t, X)之间的关系。
Cox 模型不直接考察生存函数 S(t, X)与协 变量的关系,而是用风险函数 h(t, X)作为 应变量。