五、其它30分(3~5道题目,每题6~10分)随访资料的生存分析:【06真题】九、某医生从 2002年 1月 1日起对某医院收治的 6名急性心肌梗塞病人进行跟踪观察,2002年 3月 25日结束观察,共 12周。
记录的资料如下:(5分)1、上述资料随访时间单位以(日)、(月)、(年)哪个较合适?为什么?2、判断上述随访时间哪些属截尾值?写出观察对象编号。
【05真题、04真题、03真题】四、16例某癌症病人在不同时期经随机化分配到A、B两治疗组,并继续进行随访至1974年5月 31日结束。
资料如下表:(8分)16例某种癌症病人随访资料病人号治疗组分组日期终止日期是否该病死亡截尾值1 A 68.05.12 68.05.30 Y2 B 70.10.18 71.04.16 Y3 B 69.02.12 70.11.06 Y4 A 72.01.30 74.05.31 仍存活5 A 73.11.11 74.01.02 Y6 B 68.03.12 73.03.30 车祸死亡7 A 69.01.06 69.01.04 Y8 A 69.02.08 70.02.08 迁出9 B 71.05.02 71.11.13 Y10 B 68.03.08 68.05.23 Y11 B 73.12.12 74.02.20 Y12 A 74.05.01 74.05.09 Y13 B 72.07.02 72.07.15 Y14 B 68.12.18 74.04.31 失访15 A 69.01.01 74.05.31 仍存活16 B 73.09.02 73.09.20 Y1.上述资料随访时间单位以(日)、(月)、(年)哪个较合适?为什么?2.判断上述随访时间哪些属截尾值,写出观察对象编号。
3.要比较A、B疗法对该种癌症病人的疗效,宜选用何种统计检验方法?4.A、B治疗组随访资料生存时间的特征量(代表值)一般用何指标表示?【答案】jszb0、本资料中,第7号观察对象数据,终止日期竟然早于分组日期,是典型的错误数据,应该排除。
1、本资料并未按时间分组,实际上是A、B两个治疗组的未分组资料。
一般情况下较细的时间单位准确性较高,当随访时间可以作较细的量化时,则应考虑用较细的时间单位。
但研究目的不同,时间单位不同,使用恰当的时间单位。
本资料的目的是比较A、B疗法对该种癌症病人的疗效,癌症病人的生存时间测度单位如果以(日)太小,因此,本资料随访时间单位以月较合适?2、产生截尾数据的原因:包括中途失访、研究结束时仍然存活、死于与研究疾病无关的原因。
因此,编号4、6、8、14、15观察对象属截尾值。
3、两样本生存曲线比较,宜选用对数秩检验(log-rank test)。
4、A、B治疗组随访资料生存时间的特征量(代表值)一般用中位生存时间median survival time表示。
【知识点解析】Jszba.生存分析是将事件的结果和出现这一结果所经历的时间,结合起来分析的一种统计分析方法,所以它的应变量有两个,即生存时间和结局。
b.随访资料做生存分析的条件为有一定的死亡数。
一、随访资料的生存分析(Survival analysis)(一)定义是将事件的结局和出现这一结局所经历的时间结合起来分析的统计分析方法。
临床科研中,评价某种药物的疗效或者某种疾病的愈后,不仅可以对某各时点治愈率(或生存率)进行评价,还可以考察生存时间。
利用生存分析的原理和方法,把“出生”、“死”的涵义稍加变通,在医学研究中可以有广泛的应用。
【意义】1、分析放置的心脏起搏器有效持续时间。
2、研究抛弃性隐形眼镜使用寿命。
3、比较某因素暴露组与非暴露组人群某种疾病发生或死亡的威胁性。
一般而言,能够明确划分起止点的现象均可以用生存分析的原理和方法来进行研究。
(二)特点能同时分析有结局的完全数据和没有结局的截尾数据,充分利用信息。
完全数据(complete data):是确切的生存时间。
若以死亡为结局事件,则完全数据是指从研究起点至死亡所经历的时间。
截尾数据(censored data):由于某种原因,在研究结束时未能观察到病人的明确结局,所以不知道该病人的确切生存时间。
是从起点至研究结束所经历的时间。
产生截尾数据的原因:1. 中途失访2.在研究结束时仍然存活3.死于与研究疾病无关的原因生存分析常有两个效应变量:结局,生存时间1)“死亡”:即处理失败,终止随访时间为“死亡”时间。
2)中途失访:如失去联系、中途退出等,终止随访时间为最后一次访问时间为准。
3)死于其它与研究疾病无关的原因,终止随访时间为死亡时间。
4)随访截止:随访研究结束时观察对象仍存活,终止随访时间为研究结束时间。
【基本术语】1、“死亡”事件或称失败事件(failure event)2、截尾值(censored value)3、生存时间(survival time)4、生存率(survival rate)1、“死亡”事件或称失败事件(failure event)反映处理因素失败或失效的特征。
如乳腺癌病人手术后复发、肾移植病人肾功能衰竭、白血病患者化疗后的复发等。
2、截尾值(censored value)有的观察对象终止随访不是由于失败事件发生,而是由于中途失访、死于其它原因、随访截止。
由于不知道这些观察对象发生失败事件的时间,他们的资料不能提供完全的信息,这些对象的观察值称为截尾值,常用符号“+”表示。
3、生存时间(survival time)即随访观察持续的实足时间,按天、周、月、年等时间单位记录,常用符号t表示。
一般情况下较细的时间单位准确性较高,当随访时间可以作较细的量化时,则应考虑用较细的时间单位。
但对非住院病人常难以知道准确的死亡或失访时间。
生存分析中最基本的问题就是计算生存时间,它有三个要素:时间的起点、终点、时间的测度单位(时、日、月、年)3、生存时间(survival time)如某病人1990年2月1日进入随访,1992年4月间发生失败事件,他的生存时间为t=26月;又如某白血病患者化疗3月后失去联系,他的随访结果为一截尾值,生存时间记为t=3月;安放心脏起搏器患者术后2年因意外事故死亡,他的随访结果也为一截尾值,生存时间记为t=2+年。
4、生存率(survival rate)指某个观察对象活过t 时刻的概率,常用P(X>t)表示。
如P(X>10)表示某对象活过10天(或10月、10年)的概率。
根据不同随访资料的失败事件,生存率可以是缓解率、有效率等。
1.死亡概率:q【对于未分组资料】某时刻的死亡概率=某时刻的死亡人数/ 该时刻以前的期初观察人数未分组资料生存率的估计主要是用乘积极限法(product-limit estimates);又称Kaplan-Meier 法,主要适用于观察例数不多时,是一种非参数方法。
【对于 分组资料】某年死亡概率=某年内死亡数/ 某年年初观察人数若有截尾,则分母用校正的年初观察人数(年初观察人数-1/2截尾人数)2.生存概率: p =1-q3.生存率:S(ti)S(ti)=ti 时刻仍存活的例数/ 观察总例数如果含有截尾数据,分母需要校正。
生存率为累积生存概率,是各时段上的生存概率乘积。
S(ti) =p1*p2* ... *pi4.生存率的标准误5.生存曲线以时间t 为横轴,生存率S(ti)为纵轴,表达了生存率随时间的变化趋势。
常为阶梯形。
(四)生存分析研究的内容1.描述生存过程。
估计生存率及平均生存时间,绘制生存曲线。
未分组资料,采用Kaplan -Meier 法(简称K -M 法)。
分组资料,采用寿命表法(Life table )。
2.比较组间生存曲线是否有差别。
对于未分组资料,采用对数秩检验(log -rank test )。
3.影响生存时间的因素分析。
COX 模型。
【总体生存率可信区间的估计】用正态近似原理估计某时点总体生存率的可信区间。
00p n n s u p α±如本例3个月时生存率的95%可信区间为:3620.00457.096.12724.0 1828.00457.096.12724.0 :=⨯+=⨯-上限:下限(一)K-M 法描述生存过程:(二)比较组间生存曲线是否有差别:【五、两样本生存率曲线的比较】1、两时点生存率的比较对于大样本资料,根据正态近似原理,可用u检验。
①该法是正态近似法,当样本的生存率很小或很大,如小于0.05,或大于0.99,或各组死亡人数、生存人数少于5时,该方法误差较大;②由于该法只检验某时点两样本生存率的差别有无统计学意义,而不能对整个生存期作出评价。
2、两样本生存曲线比较——对数秩检验(log-rank test)其基本思想是如果无效假设成立,即两总体生存曲线无差别时,则两种处理在各个时期的实际死亡数与理论死亡数不会相差太大,否则应认为无效假设不可能成立,两条生存率曲线差异有统计学意义。
⏹Log-rank检验:时序检验,属于非参数方法,比较整个生存时间的分布◆大样本卡方检验◆2条或多条生存曲线比较对数秩检验(log-rank test)公式:1)(22-=-∑=组数νTT A x 当有 T <5 时,用校正公式。
H 0:单放疗组与放化疗组的生存率曲线分布相同H 1:单放疗组与放化疗组的生存率曲线分布不同α = 0.05计算检验统计量:X 2 = 4.65, 得 P=0.03按α = 0.05水准,拒绝H 0 ,接受H 1 ,故认为单放疗组与放化疗组的生存率曲线分布不同。
【生存率比较注意事项】当比较不同治疗方案的治疗效果时,仅比较某个时点的生存率,有时可能出现不正确的结论。
事实上,每一种防治措施的效果都是一条时间效应曲线,所以评价该措施的效果应对这条时间效应曲线进行全面评价,而不是仅对某个时点的生存率进行评价。
1.生存分析:生存分析(survival analysis )是将事件的结果和出现这一结果所经历的时间,结合起来分析的一种统计分析方法,它不仅可以从事件结局的好坏,如疾病的治愈(成功)和死亡(失败),而且可以从事件的持续时间,如某病经治疗后存活的时间长短进行分析比较,因而能够更全面、更精确地反映该治疗的效果。
2.生存时间:生存时间(survival time )指观察到的存活时间。
3.完全数据:完全数据(complete data )指从起点至死亡所经历的时间,即死者的存活时间。
4.截尾数据:由于失访、改变防治方案、研究时间结束时事件尚未发生等情况,使得部分病人不能随访到底,称之为截尾。
从起点至截尾所经历的时间,称为截尾数据(censored data )。
5.死亡率:某年内死亡例数与年中观察例数之比称为死亡率(mortality rate )。
6.死亡概率:死亡概率(mortality probability )是指某年内死亡例数与年初观察例数之比,若年内有截尾,分母用校正人口数。