生存数据分析
生存期不同于一般指标的二个特点:
1.有截尾数据(censored data) 随访中未能知道病人的确切生存时间,只知 道病人的生存时间大于某时间。 (1)病人失访或因其他原因而死亡---失访 (2)到了研究的终止期病人尚未死亡---终访 截尾数据可记为t+,如: 4+ = 生存时间大于4年。
虽然截尾数据提供的信息是不完全的,但不 能删去,因为这不仅损失了资料,而且会造成偏 性。
积限法的计算步骤为: 1.将n个生存数据ti,按小到大排列,当截尾数据与完全数据 (非截尾值)相同时,截尾数据排列在后,并写出每个生存数据的 状态Si(即死或活),见表22.1的1,2列 2.写出各个完全数据(即死亡状态)的期初人数ni和死亡人 数di,见表22.1的3,4列。 3.计算条件生存率的估计值,见表中第5列,^S(ti/ti1)=(ni-di)/ni 4.计算累积生存率,即时间ti的生存率估计值(见表中第6 列) ^S(ti)=^S(ti-1)^S(ti/ti-1) 5.计算S(ti)的标准误(见表中第9列) i SE(^Sti)=^S(ti)√{∑dj/[nj(nj-dj)]} j=1 表中已列出了积限法的全部结果,各个时间点的生存率和标 准误分别在6,9两列,例如二年生存率(即24个月)为 0.4040± 0.1657
风险函数的不同情况:
常数, 如:死于飞机失事。
下降, 如:急性损伤。
上升, 如:持续接触危险因素。
澡盆样,如:人的一生。
生存分析目的: (1)估计生存函数。 (2Байду номын сангаас比较各组的生存函数。
(3)研究影响生存期长短的因素。
第三节 生存率的估计方法
• 生存率S(t)的估计方法有参数法和非参数 法。常用非参数法,非参数法主要有二个,即, 乘积极限法与寿命表法,前者主要用于观察例 数较少而未分组的生存资料,后者适用于观察 例数较多而分组的资料,不同的分组寿命表法 的计算结果亦会不同,当分组资料中每一个分 组区间中最多只有 1个观察值时,寿命表法的 计算结果与乘积极限法完全相同。
───────────────────────────────────────────────────── 时间(年) 期初例数 死亡例数 失访例数 截尾例数 有效例数 条件生存率 累积生存率 di ∑di/ni(ni-di)累积生存 ti n'i di ui wi ni ^S(ti/ti-1) ^S(ti) ni(ni-di) 率标准误 ⑴ ⑵ ⑶ ⑷ ⑸ ⑹ ⑺ ⑻ ⑼ ⑽ ⑾=⑻√⑽ ───────────────────────────────────────────────────── 0126 47 4 15 116.5 0.5966 0.5966 5.805×10-3 5.805×10-3 0.0455 160 5 6 11 51.5 0.9029 0.5386 2.088×10-3 7.893×10-3 0.0479 238 2 0 15 30.5 0.9344 0.5033 2.301×10-3 0.0102 0.0508 321 2 2 7 16.5 0.8788 0.4423 8.359×10-3 0.0186 0.0602 410 0 0 6 7.0 1.0000 0.4423 0 0.0186 0.0602 54 0 0 4 2.0 1.0000 0.4423 0 0.0186 0.0602 ─────────────────────────────────────────────────────
参数法可求出一个方程表示生存函数S(t)和时间t的 关系,画出的生存曲线是光滑的下降曲线。 非参数法只能得到某几个时间点上的生存函数, 再用直线联起来,画出的生存曲线是呈梯型的。
t(ê Ä ) 0 1 2 3 4 5 6 7
s(t) 1 0.67 0.45 0.3 0.2 0.14 0.09 0.06
•
例22.1 用某中药加化疗(中药组)和化疗(对照组)两 种疗法治疗白血病后, 随访记录各患者的生存时间,不带 "+"号者表示已死亡,即完全数据,带"+" 号者表示尚存活, 即截尾数据,试作生存分析。时间单位为月。 • 中药组 10,2+,12+,13,18,6+,19+,26,9+,8+,6+,43+,9,4,31,24
• 对照组 2+,13,7+,11+,6,1,11,3,17,7
资料中药组积限法计算生存率
───────────────────────────────────── 时间 状态 期初人数 死亡人数 条件生存率 累积生 di ∑di/ni(ni-di)累积生存 ti si ni di (ni-di)/ni 存率^S(ti)ni(ni-di) 率标准误 ① ② ③ ④ ⑤ ⑥ ⑦ ⑧ ⑨=⑥√⑧ ───────────────────────────────────── 2 活 4 死 15 1 0.9333 0.9333 0.004762 0.004762 0.0644 6 活 6 活 8 活 9 死 11 1 0.9090 0.8485 0.009091 0.013853 0.0999 9 活 10 死 9 1 0.8889 0.7542 0.013889 0.027742 0.1256 12 活 13 死 7 1 0.8571 0.6465 0.023810 0.051551 0.1468 18 死 6 1 0.8333 0.5387 0.033333 0.084885 0.1570 19 活 24 死 4 1 0.7500 0.4040 0.083333 0.168218 0.1657 26 死 3 1 0.6667 0.2694 0.166667 0.334885 0.1559 31 死 2 1 0.5000 0.1347 0.500000 0.834885 0.1231 43 活 ─────────────────────────────────────
第二节 描述生存时间分布规律的函数
• 一. 生存率(Survival Rate) • 又称为生存概率或生存函数,它表示一个 病人的生存时间长于时间t的概率,用S(t) 表 示: s(t)=P(Tt) • 如5年生存率: s(5)=P(T5) • 以时间t为横坐标,S(t)为纵坐标所作的曲 线称为生存率曲线, 它是一条下降的曲线,下 降的坡度越陡,表示生存率越低或生存时间越 短,其斜率表示死亡速率。
寿命表法估计生存率步骤如下: 1.将观察例数按时间段(年)0-,1-,2-,划分,分别计数期初例数,死亡,失访, 截 尾例数列入表22.2的1-5列。事实上,从第二个时间段开始,期初人数ni 系由下式算 得: n'i=n'i-1-di-ui-wi 例如第二行,即时间段1-,有 n'2=126-47-4-15=60 2.计算各时间段期初实际观察例数,(亦称有效例数)ni ni=n'i-ui/2-wi/2 上式表明该时间段期初例数中的失访,及截尾例数只计其半时,即得有效例数。 如第一行,n1=126-4/2-15/2=116.5 3.分别用(22.5)(22.6)(22.7)式计算条件生存率^S(ti/ti-1),累积生存率s(ti) 及其标准误。 计算结果已列于表22.2中,第7,8,11列,表中9,10二列系用于第11列的计算。 例如时间段0--中 ^S(ti/ti-1)=(116.5-47)/116.5=0.5966 ^S(ti)=1×0.5966=0.5966 SE(S(ti))=0.5966×√5.805×10-3=0.0455 故一年生存率的估计为0.5966±0.0455 同样二年生存率的估计为0.5386±0.0479 由于寿命表法与积限法的累积生存率及其标准误的计算公式完全相同 ,所以,当 分组资料中每一个分组区间中最多只有1个观察值时,寿命表法就是积限法。
一. 乘积极限法(Product-Limit Method)
• 简称为积限法或PL法,它是由统计学家Kaplan和Meier 于1958年首先提出的, 因此又称为Kaplan-Meier法, 是利用条件概率及概率的乘法原理计算生存率及其标 准误的。 • 设S(t)表示t年的生存率,s(ti/ti-1)表示活过ti1年又活过 ti年的条件概率,例如s(1),s(2)分别表示 一年,二年的生存率,而s(2/1)表示活过一年者,再活一 年的条件概率,据概率的乘法定律有: • S(2)=S(1)S(2/1),一般地有 • S(ti)=S(ti-1)S(ti/ti-1)
• §1.3 风险函数(Hazard Function) • 用h(t)表示,其定义为: • h(t)=lim(在时间t生存的病人死于区间 (t,△t)的概率/△t) • 由于计算 h(t) 时 , 用到了生存到时间 t, 这 一条件 , 故上式极限式中分子部分是一个条件 概率。可将 h(t) 称为生存到时间 t 的病人在时 间 t 的瞬时死亡率或条件死亡速率或年龄别死 亡速率。当用t作横坐标,h(t)为纵坐标所绘的 曲线,如递增,则表示条件死亡速率随时间而增 加 , 如平行于横轴 , 则表示没有随时间而加速 (或减少)死亡的情况。
二. 寿命表法(Life Table Method)
• 适用于随访的病例数较多, 将资料按生存 期进行分组,在分组的基础上计算生存率 ,本 法也能用于不分组的资料,此时计算结果与积 限法相同。
某医院1946年1月1日到1951年12月31日收治的126例胃癌 病例,生存情况如表22.2,试用寿命表法估计生存率。 表22.2 126例胃癌患者寿命表法估计生存率
第十八章 生存分析和COX回归
上海第二医科大学
生物统计教研室
第一节
•
基本概念
在医学,生物学研究中,常用到生存 分析 (Survival Analysis)方法。例如 对于肿瘤等疾病的疗效及预后的考核,通 常不用治愈率,有效率等表示,而用将 来复发或死亡的时间长短表示,也即生存 期来表示。 • 所谓生存期(survival time)是指 从某个标准时刻(如发病,确诊,开始治疗 或进行手术的时间)算起至死亡或复发为 止的时间。