当前位置:文档之家› 生存分析

生存分析


19.2.1 寿命表法(life table method)
例21-1 收集374名某恶性肿瘤患者的随访资料,取时间区 间均为1年,整理结果见下午表,试估计各年生存率。
解析:
该生存资料为大样本,生存时间粗略且含有删失数据。
方法原理:
寿命表法
1. 计算期初有效例数,注意删失数据
期初有效例数=期初病例数-期内删失数/2
表19-2 30例膀胱肿瘤患者生存资料的原始记录表
编 号
1 2 3
年龄 肿瘤 肿瘤大 是否 (岁) 分级 小/cm 复发
62 64 52 I I II ≤3.0 ≤3.0 ≤3.0 0 0 1
手术日期
02/10/1996 03/05/1996 04/09/1996
终止观 察日期
12/30/2000 12/03/1999
期间死亡人数:k 初人口数:n 末人口数:n-k
⑴ 死亡概率(probability of death):表示某单位时
段开始存活的个体,在该时段内死亡的可能性;
如年死亡概率。
某年内死亡人数 死亡概率(q) 某年年初人口数
注意:如果年内有删失,则分母用校正人口数: 校正人口数 = 年初人口数—删失例数/2
19 生存分析
常用的回归分析:
回归分析
1个因变量Y Y是数值 变量
两个因变量 (结局分类变量+时间)

生存分析
Cox回归
Y是分类 型变量
① 一元回归
1个自变量X
② 多重回归
2个以上自变量X
③ Logistic 回归
Logistic regression
Simple regression
Multiple regression
若资料中有删失数据,则须分段计算生存概率,再应用
概率乘法定理将分时段的生存概率相乘得到生存率:
ˆ (t ) P(T t ) p p ...... p S ˆ (t ) p S k k 1 2 k k 1 k
区分:生存率——生存概率
生存概率是针对单位时间而言的;
生存率是针对某个较长时段的,是生存概率的累计结果。
中位生存期
生存分析—Kaplan-Meier
【电脑实现】 —SPSS
1.数据录入
【 Group 】 1: <3.0cm;2: 3.0cm 【 dtime 】 生存时间(月) 【 Status 】0:删失数据
1:完全数据(结局事件)
2. SPSS过程
3. 结果及结果输出:
group <3.0cm 1 2 3 4 5 6 7 8 9 10 11 12 13 14 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Ti me 14.00 0 19.00 0 26.00 0 28.00 0 29.00 0 32.00 0 36.00 0 40.00 0 42.00 0 44.00 0 45.00 0 53.00 0 54.00 0 59.00 0 6.000 7.000 9.000 10.00 0 11.00 0 12.00 0 13.00 0 20.00 0 23.00 0 25.00 0 27.00 0 30.00 0 34.00 0 37.00 0 43.00 0 50.00 0 St atus 完全 完全 完全 完全 完全 完全 完全 完全 完全 删失 完全 删失 完全 删失 完全 完全 完全 完全 完全 完全 完全 完全 完全 完全 完全 完全 完全 完全 完全 完全
随访研究:
生存时间
终点事件:死于膀胱肿瘤
死亡 失访
死于冠心病
删 失
死亡
到截止时间事件尚未发生
死亡 死亡
研究截止时点 2000/12/30
时间
2. 生存数据类型:
完全数据:在规定的观察期内,对某些观察对象观察 到了终点事件发生,从起点到终点事件所经历的时间, 称为生存时间的完全数据(complete data)。用符号 “ t ”表示。
错误1:只考虑确切数据,丢弃截尾数据(损失信息); 错误2:将截尾数据当作确切数据处理(低估了生存时间的 平均水平)。
在处理正偏态分布数据时两种错误的做法:
错误1:采用平均生存时间而不是采用中位生存时
间来表示生存时间的平均水平。
错误2:采用常规 t 检验或方差分析进行组间比较。
(应采用log-rank检验比较几组生存时间 )
19.1 生存分析的概述
生存分析中的基本概念:
1. 生存时间(survival time) —— 从规定的观察起点到某一特定终点事 件出现的时间长短。
三要素:
观察起点
生存时间
终点事件
随机对照临床试验研究:观察起点通常是随机化
分组的时间。
观察性研究:观察起点可以是发病时间、第一次 确诊时间或接受正规治疗的时间;终点事件可以 是某种疾病发生、某种处理的反应、疾病的复发 或死亡等。
线性回归
曲线回归
生存分析(survival analysis) —— 将终点事件和出现终点时间所经历的时间结
合起来分析的一类统计分析。
主要特点:考虑到了每个研究对象出现某一结局
所经历的时间长短。
例:某医院泌尿外科医师对可能影响膀胱肿瘤术生生 存的因素进行了调查,选择1996-2000年间手术治疗的 膀胱肿瘤患者30例,随访截止日期2000年12月30日:
2. 计算死亡概率、生存概率
死亡概率=期内死亡数/期初有效例数 生存概率=1-死亡概率
3. 计算生存率。 4. 作生存曲线。




寿命表法
寿命表法曲线为折线。 该法只估计时段右端点的生存率,省略了时段内的生存率估计。
中位生存期
恶性肿瘤患者确诊后5 年内生存率下降较快,5 年后下 降较平缓,说明确诊5年内该恶性肿瘤患者的死亡威胁较大。
2. 3年生存率
S(3)=P(T≥3)=(50–30)/50= 0.4 = p1 × p2 × p3
故生存率又称为累积生存概率(cumulative probability of survival ),它是随着时间的变化而变化 着的,是关于时间的函数,称为生存函数(survival function)。
结局
存活 失访
生存时 间/月
59 54 44
08/12/2000 死于膀胱瘤
4
5
60
59
I
II
≤3.0
>3.0
0
0
06/06/1996
07/20/1996
10/27/2000 死于冠心病
06/21/1998 死于膀胱瘤Biblioteka 53236

59
I
>3.0
1
08/19/1996
09/10/1999 死于膀胱瘤
37
观察性研究:
观察起点
⑴ 疾病确诊
生存时间
终点事件
死亡 痊愈
死亡 复发 痊愈
⑵ 治疗开始 ⑶ 症状缓解
⑷ 接触毒物 ⑸ 接触危险因素
疾病恶化
出现毒性反映 发病
随机对象的临床试验研究:
试验组 合格的 研究对象 对照组 伴随因素 干扰因素
出现结果
尚未出现结果 失访、脱落
随访研究(follow-up study)示意图
生存资料特点:
生存时间分布不正态—非负且右偏; 可能含有删失数据(censor)。
同时考虑结局和生存时间两个因变量;
生存分析特点:
可处理生存时间分布不正态的问题; 可处理删失数据。
生 存 分 析
19.1 概 述 。
19.2 生存率的估计

19.3 生存曲线的比较 。 19.4 Cox比例风险回归模型
失访; 死于其它原因; 由于严重药物反应而终止观察或改变治疗措施。
生存分析的特点:
同时考虑生存结局和生存时间
生存资料
可能含有删失数据(censor); 生存时间分布不正态—非负且右偏。
特点:
生存分析
可处理删失数据; 可处理生存时间分布不正态的问题。
处理删失/截尾数据时两种错误的做法:
期间死亡人数:k 初人口数:n 末人口数:n-k
⑵ 生存概率(probability of survival) :单位时段开始 时存活的个体,到该时段结束时仍然存活的可能性。
某年活满一年人数 生存概率(p) 1 q 某年年初人口数
注意:若年内有删失,分母用校正人口数。
⑶ 生存率(survival rate) :0 时刻存活的个体经历 tk 时个单位时间段后仍存活的可能性。
是反映离散程度大小的指标。
⑸ 风险函数(hazard function) : t 时刻存活的个体在t 时刻的瞬时死亡率。
h(t ) lim
t 0
Pt T t t T t t
h(t)近似地等于t 时刻存活的个体在此后一个单位时
段内的死亡概率。
生存分析的基本步骤: 估计生存率(生存函数) 估计生存曲线 生存时间分布的组间比较
生存分析—寿命表法
【电脑实现】 —SPSS
1.数据录入:频数形式
【Time 】 生存时间(年) 【 Status 】0:删失数据 1:完全数据(死亡) 【 Freq 】频数
2. 加权
3. SPSS过程
4. 结果及结果输出:
期初 有效 例数 期内 死亡 数 生存 率标 准误 风 险 率 风险 率标 准误
Logistic分析的缺陷:
只考虑终点事件的出现与否。
但在研究中,还需要考察对象到达终点时所经历 时间的长短,也就是说研究者对医学事件发生、发展 所经历的时间感兴趣。 如恶性肿瘤、慢性病等各个观察对象随访各时间 点的发生情况,以评价临床疗效和控制的好坏。
相关主题