当前位置:文档之家› 23生存分析

23生存分析

1.00
0.75
group 1
生 存 率
0.50
试验组
0.25
对照组
group 2
0.00 0 10 20 30

40
Log-rank
test
方法
, 计算时,先将两组每一生存时间 t( j ) 的资料列 成一个 2×2 表的形式 死亡 生存 合计 治疗组(i=1) d1j n1j-d1j n1j 安慰剂组(i=2) d2j n2j-d2j n2j 合计 Dj Sj Nj
i
乘积极限法(K-M法)估计生存率
适用于原始数据的资料 例:研究人员对20名某肿瘤术后病人进行跟踪随 访三年,记录他们的生存时间。试估计生存率绘 制生存曲线,资料如下
3, 5+,5,8,9,9,9+,9+,11,15,15+, 16,20,20+,25,28,28+,28+,28+,32
乘积极限法(K-M法)估计生存率
3 1
2
1992.03.04 4
5
2001.12.31
生存分析的基本概念---终点事件/起始事件
终点事件outcome event:失效事件 failure event, 指研究者所关心的特定事件,如死亡、复发、出牙;
起始事件:标志研究对象生存过程开始的特征事件 称为起始事件,与终点事件相对应,如确诊、手术、 开始采取措施,开始观察
生存资料
患者 编号 1 2 3 4 5 性别 男 女 女 男 女 年龄 32 48 26 55 58 从确诊到手 术的时间(月) 10 12 6 3 8 手术时间 1994.01.23 1998.02.14 1992.03.04 1999.08.20 2001.03.10 终止随访时间 1994.12.24 1999.01.01 1995.04.12 2001.09.21 2001.12.31 结局 死亡 失访 死亡 死于其他 存活 生存 时间 11 10+ 37 25+ 9+
生存分析的基本概念---死亡概率/生存概率
死亡概率q:在某时间区间内的被观察对象在 该时间区间内(无失访)死亡的概率估计
q 在该时间区间死亡人数 某时间区间初期尚存活人数
生存概率p:在某时间区间内(无失访)的被观察 对象在该时间区间内生存的概率估计
活过该时间区间人数 p 某时间区间初期尚存活人数
针对这类生存资料的分析方法:生存分析
生存பைடு நூலகம்析
生存分析
研究既有事件的发生时间又有事件结局资料的统计学方法
强调所研究问题的结果变量是某一事件发生的时间
基本目的
描述生存过程 比较不同人群的生存过程 分析生存时间的相关因素
生存资料的特点
生存资料的特点
随访资料 时间和结局(失效、删失) 有不完全数据 通常不服从正态分布
生存分析 survival analysis
内容
1
生存资料
2
生存分析的基本概念
3
STATA实现
生存资料
一些医学事件所经历的时间:从开始观察到事件 发生的时间,不是短期内可以明确判断的
乳腺癌病人术后生存时间 幼儿乳牙萌出的时间 白血病病人化疗后缓解持续的时间 两种方法治疗某慢性病产生疗效的时间
生存率曲线的比较
Log-rank检验:时序检验,属于非参数方法, 比较整个生存时间的分布
大样本卡方检验 2条或多条生存曲线比较
H0:总体生存率曲线相同 H1:总体生存率曲线不同
生存率曲线的比较
例 10.3:现有两组白血病病人的随访研究资料,其缓 解时间(周)记录如下,现欲比较治疗组与安慰剂组 的病人生存曲线是否一样?
t时刻仍存活的观察例数 总观察例数
有删失:需分段计算各时间段的生存概率pi ,然后利用 概率乘法将pi相乘得到t时刻的生存率
S (t ) S (tp ) pp p 1 2 ... p pt
1 2 t
第i个时段开始的人数为 ni ,在第i个时段内死亡人数 di p 1 ni 1 ni di ci 为 d i,删失人数为 ci,则 , i n
Stata软件实现
二、用Stata软件绘制生存曲线
1.定义生存分析的时间变量是time,结果变量是 status stset time status 2. 绘制Kaplan-Meier法估计的生存曲线 sts graph
Stata软件实现
三、用Stata软件进行Log Rank检验
1.确定生存分析的时间变量是week,结局变量是 outcome Stset week outcome 2.对两条曲线进行Log Rank检验 sts test group,logrank 即:Sts test 分组变量,logrank
总体生存率的区间估计
K-M法计算的样本生存率是总体生存率的点估计
区间估计:
exp( exp(ln( ln( S (ti )) u / 2
SE是标准误
SE[ S (ti )] )) S (ti ) ln(S (ti ))
生存曲线及中位生存期
生存曲线 survival curve:以随访时间为横坐标, 生存率为纵坐标绘制的曲线 中位生存期median survival time:半数生存时间/ 平均生存时间,恰好由50%个体存活s(t)=0.5的时间
• 资料
治疗组(第1组): 6,6,6,7,10,13,16,22,23,6+,9+, 10+,11+,17+,19+,20+,25+,32+,32+,34+,35+
安慰剂组(第2组):1,1,2,2,3,4,4,5,5,8,8,8,8, 11,11,12,12,15,17,22,23
两组生存曲线的统计描述
计算理论死亡数 e1i
n1 j D j Nj
计算Log-rank检验统计量
( d e ) 1i 1i 2 i n1 j n2 j D j S j
2
N
j
2 j
( N j 1)
H0为真时,Log-rank统计量2服从自由度为1的卡 方分布
Log-rank 检验的实例计算
寿命表法计算生存率
例:10.2
序 号 (1) 1 2 3 4 5 6 7 8 9 术后 生存 天数 t (2) 05010020040070010001300>1600 期初观 察例数 n (3) 68 49 38 32 23 15 8 5 1 期内死 亡人数 d (4) 16 11 4 5 2 4 11 1 0 期内终 检人数 c (5) 3 0 2 4 6 3 2 3 1 校正 人数 nc=n-c/2 (6) 66.5 49 37 30 20 13.5 7 3.5 --死亡 概率 q=d/nc (7) 0.2406 0.2245 0.1081 0.1667 0.1000 0.2963 0.1429 0.2857 生存 概率 p=1-q (8) 0.7594 0.7755 0.8919 0.8333 0.9000 0.7037 0.5871 0.7143 生存 率 S(t+1) (9) 0.7594 0.5889 0.5253 0.4377 0.3939 0.2772 0.2376 0.1697
生存分析的基本概念---生存率
生存函数 (累计生存概率):个体生存时间大 于t的概率。任一时刻t对应的生存函数就是该 时点的生存率。
S(0)=1; 2年生存率:个体生存时间超过2年的概率S(2)
生存曲线:所有时点的生存率构成生存曲线
生存分析的基本概念---生存率
生存率计算
无删失: S (t )
生存时间一般为非正态,故用中位生存期 可采用内插法计算: t0.5=20.4(月) 如果生存期最长的死亡对象的生存率高于50%,则无法估计中位生 存期。
生存寿命表法计算生存率
适用于大样本资料 数据按时间区间分组
利用删失资料信息,按删失资料对进行校正
区间中的删失个体折算半个人时
序号 i (1) 1 2 3 4 5 6 7 8 9 10 11 时间 t 时刻期 t 时刻 t 时刻 (月) 初例数 死亡数 终检数 ti ni di ci (2) (3) (4) (5) 0 3 20 1 1 5 19 1 0 8 17 1 2 9 16 2 0 11 12 1 1 15 11 1 0 16 9 1 1 20 8 1 0 25 6 1 3 28 5 1 0 32 1 1 死亡 生存 概率 概率 q=d/n pi=(ni-di)/ni (6) (7) 0.0500 0.9500 0.0526 0.9474 0.0588 0.9412 0.1250 0.8750 0.0833 0.9167 0.0909 0.9091 0.1111 0.8889 0.1250 0.8750 0.1667 0.8333 0.2000 0.8000 1.000 0.0000 生存率 S(ti) (8) 0.9500 0.9000 0.8471 0.7412 0.6795 0.6177 0.5491 0.4804 0.4004 0.3203 0.0000
• 本例的检验统计量计算为
(10.26) 16.79 6.2685
2
2
• 查卡方界值表,P<0.001,基于两组生存曲线的位 置,可以认为试验组的生存率高于对照组,差异 有统计学意义。
Stata软件实现
一、用Stata软件计算生存率及95%可信区间
1.定义生存分析的时间变量是time,结果变量是 status stset time status 2.显示Kaplan-Meier方法的计算生存率结果 sts list
相关主题