当前位置:文档之家› 医学统计学之生存分析

医学统计学之生存分析

表示。
7
资料仅供参考,不当之处,请联系改正。
截尾值(Censored value)出现的原因
截尾的原因主要有3种: ①失访:生存但中途失访:包括拒绝访问、失去联
系等。 ②退出:中途退出试验、改变治疗方案、死于其它
与研究无关的原因:如肺癌患者死于心机梗塞、 自杀或因车祸死亡,终止随访时间为死亡时间。 ③终止:指观察期结束时仍未出现结局。
生存率(survival rate):指研究对象经历 t 个时段后仍存
活的概率,即生存时间大于等于 t 的概率,用 PT t
表示。
生存率随时间 t 变化而变化,即生存率是相对于时间 t 的
函数,称为生存函数(survival function),记为 S t 。
生存函数在某时点的函数值就是生存率。
8
资料仅供参考,不当之处,请联系改正。
关于截尾或删失
删失的模式图
患者进入期间
随访开始
失访 失访 研究截止时仍存活
事件
研究截止时点
9
资料仅供参考,不当之处,请联系改正。
3.生存时间资料的整理:
对于随访资料,需记录的原始数据包括开始观 察的时点(起始事件发生的时间)、终止观察的 时点、研究对象的结局、考虑的影响因素。生 存时间为反映时间长短的指标,属数值变量:
其研究内容主要包括 3 个方面:① 对生存状况 进行统计描述(生存概率、生存率、中位生存期等); ② 寻找影响生存时间的“危险因素”和“保护因素”; ③ 估计生存率和生存时间长短,进行预后评价。
5
资料仅供参考,不当之处,请联系改正。
一、基本概念
(一)生存时间(survival time): 1.定义:广义的生存时间是指从某个起始事件开
11/29/80
11/04/85 死亡
1
F
2
06/13/82
06/08/83 死亡
1
M
3
03/02/83
12/31/86 失访
0
M
4
08/04/83
04/10/86 死亡
0
F
表 16-2 4 例鼻咽癌患者术后生存时间及相关资料整理表
病例号
1 2 3 4
生存时间(天)
t 1800 360 1400+ 990
生存时间( t )变量( )反映终点事件是否发生,为二分 类的变量。通常用( t , )完整地表示一个观察
对象的随访结果。
10
资料仅供参考,不当之处,请联系改正。
表 16-1 4 例鼻咽癌患者术后随访记录
病例号 开始日期
终止日期 结局 治疗方法 性别 …
1
结局
1 1 0 1
治疗方法
X1 1 1 0 0
性别
X2 F M M F
……
11
资料仅供参考,不当之处,请联系改正。
(二)死亡概率、死亡率:
死亡概率(mortality probability):是指某单位时段期初的观察对
象在该单位时段内死亡的可能性大小。
某单位时段内死亡数 q 该时段期初观察人数
(16.1)
若该时段内有删失,则分母用校正人口数:
校正人口数 期初观察人数 1 删失数 (16.2) 2
死亡率(mortality rate):指单位时间内研究对象的死亡频率或强
度,即平均每千人(或万人、百人等)中的死亡人数。
某单位时段内死亡数 m 该时段平均人口数
1000 ‰
(16.3)
平均人口数= 1 (该时段期初人口数+期末人口数) (16.4)
资料仅供参考,不当之处,请联系改正。
生存分析survival analysis
1
资料仅供参考,不当之处,请联系改正。
何为生存分析
医学研究中,为了了解某种疾病的预后、评价治疗 方法的优劣或观察预防保健措施的效果等,常需对 研究对象进行追踪观察,以获得必要的数据,这类 资料都属于随访资料。随访资料是指对一批研究对 象进行追踪观察所获得的有关其结局以及出现这种 结局所经历的时间等方面的资料。由于随访资料的 分析最初起源于对寿命资料的统计分析,故称为生 存分析,或称为生存时间分析。
3
资料仅供参考,不当之处,请联系改正。
传统方法在分析随访资料时的困难
存在大量失访的资料
•失去联系(病人搬走,电话号码改变) •无法观察到结局(死于其他原因) •研究截止 显然,将失访数据无论是算作死亡还是存活似乎 都不大合理
4
资料仅供参考,不当之处,请联系改正。
第一节 概述
生存分析的方法已被广泛应用到医学研究领域, 如现场追踪研究、临床疗效试验、疾病预后分析等, 生存时间的涵义也随之扩展到更广义的范围,又称 为时间-效应分析(time-effect analysis)。
始到某个终点事件的发生(出现反应)所经历的 时间。也称失效时间(failure time)。 2.特点: (1)分布类型不易确定。一般不服从正态分布,
有时近似服从指数分布、Weibull分布、 Gompertz分布等,多数情况下往往不服从任 何规则的分布类型。
6
资料仅供参考,不当之处,请联系改正。
(2)生存时间的影响因素多而复杂且不易控制。 (3)根据研究对象的结局,生存时间数据可分两种类型:
①完全数据(complete data):观察对象在观察期内出 现反应(终点事件),这时记录到的时间信息是完整的,这 种生存时间数据称为完全数据。 ②截尾数据(截尾值、删失数据,censored data):尚 未观察到研究对象出现反应(终点事件)时,即由于某种原 因停止了随访,这时记录到的时间信息是不完整的,这 种生存时间数据称为不完全数据或截尾值。常用符号“+”
2
资料仅供参考,不当之处,请联系改正。
传统方法在分析随访资料时的困难
时间和生存结局都成为了要关心的因素
•除了生存结局作为判定标准以外,只要能让病人存活 时间延长,这种药物也应当是被认为有效的。即时间 延长也认为有效 •如果将两者均作为应变量拟和多元模型,因为时间分 布不明(一般不呈正态分布,在不同情况下的分布规 律也不同),拟和多元模型极为困难
2
12
资料仅供参考,不当之处,请联系改正。
(三)生存概率、生存率、生存函数、生存率曲线:
生存概率(survival probability):表示某单位时段开始时
存活的个体到该时段结束时仍存活的可能性大小,用 p
表示,公式如下:
活满某时段的人数 p 该时段期初观察人数 1- q
(16.5)
若该时段内有删失,则分母用校正人口数。
相关主题