第十二章生存时间资料的
非参数分析方法目录第一节生存时间资料的特点第二节小样本生存率的kaplan-Meier估计第三节大样本生存率的寿命表法估计第四节生存曲线比较的假设检验第一节生存时间资料的特点一、数据结构二、统计描述指标三、资料要求一、数据结构
在临床医学中, 对病人疗效考查:治疗结局?生存时间?生存时间的三个要点一、起始事件二、终点事件三、生存时间医学例子:起始事件随访时间终点事件
疾病确诊死亡随访(follow-up)资料的记录生存资料一般通过随访收集,记录的项目:(起始与终止)随访事件生存时间(开始观察日期与终止观察日期)(年、月、天、小时、分、秒等)分组变量(处理方法)和其它协变量(性别、年龄、职业、文化程度等)生存时间资料的特点 2个效应变量(1)生存时间(天数),(2)结局(死亡与否、是否阳性等) 截尾数据:如表12-1中的1号和 3号病人未观察到底,不知他们究竟能活多长时间。
产生结尾原因: (1)迁移 (2)死于其他原因 (3)因其他客观原因中途退出(4)预定终止结果迟迟不发生分布类型复杂:生存时间分布常呈正偏态分布 2个效应变量(1)生存时间(天数),(2)结局(死亡与否、
是否阳性等) 错误1:忽略生存时间,采用Logistic回归分析死亡
率错误2:忽略结局,采用t检验、线性回归分析生存时间 What is Censoring?(截尾问题)得不到确切的生存时间,但它们提
供的生存时间长于观察期的时间,这种数据为不完全数据。
或截尾数
据、删失数据或终检值。
(如有确切的生存时间,则这种数
据称为完全数据。
)两种错误的做法:错误1:丢弃截尾数据,只
考虑确切数据。
(损失了信息)错误2:将截尾数据当作确切数据处
理。
(低估了生存时间的平均水平)。
两种错误的做法:错
误1:采用平均生存时间而不是采用中位生存时间来表示生存时间的
平均水平。
错误2:采用常规t检验或方差分析进行组间比较。
(应
采用log-rank检验比较几组生存时间)二、生存分析的统计描述
指标 [例1] 手术治疗60例肺癌病人,术后每年死亡10例,无删失。
试求基本生存分析指标。
N=60 注意:死亡率与死亡概率
的分子相同,但分母不同;生存概率与生存率的分子
相同,但分母不同 1 . 死亡率、死亡概率、生存概率 (1) 死亡率(mortality rate,death rate) 表示某单位时间内
的死亡强度。
年平均人口数=(年初人口数+年末
人口数) (2) 死亡概率 ( mortality probability ) 指死于
某时段内的可能性大小。
=
d/n0 年内有删失,分母用校正人口数:校正人口数= 年初
人口数―删失例数 / 2 =n0-c/2 (3) 生存概率 ( survival probability ) 指某单位时
段开始时存活的个体到该时段结束时仍存活的可能性的大小。
= (n0-d)/n0 分子为年末尚存人数,若年内有删失,分
母用校正人口数。
生存率 (survival rate) ( 累积生存概率
cumulative probability of survival ) 指病人经历t个单位
时间后仍存活的概率。
生存概率指单个时段的概率,生存
率指从0~t多个时段的积累概率。
公式1 用于完全数据
=(n0-d)/N 公式2用于删失数据以及完全数据
S ( t ) = P (T ≥tk ) = p1 p2 …pk 例如手术治疗50例肺癌病人,术后1,2,3年的死亡
数分别为10,10,10例,无截尾数据。
试求各年的生存
概率和3年生存率。
解:各年生存概率 p1 = ( 50。