当前位置:文档之家› 生存分析-cox 回归与sas应用总结

生存分析-cox 回归与sas应用总结


生存资料的分析方法
描述 -生存时间 生存率 风险率 • 非参数法 -KM法 、寿命表 (LIFETEST) • 参数法- 指数模型、Weibull模型、Gompertz模型 ( LIFEREG) • 半参数法- COX回归 (PHREG)

Cox 回归分析是生存分析的一种半参数分析方法。 优点: 多因素分析方法 不考虑生存时间分布 利用截尾数据
Variable DF 变量名 自由度 GROUP 1 RENAL 1
对自变量的检验结果用Waldχ2检验,P值分别为0.0587,0.0003。 COX回归方程:h(t,x)=h0(t)*e0.989726group+4.112210renal 相对危险度分别为2.690,61.082,说明B组死亡的危险为A组的2.690倍,而伴肾功能
DISCRETE :用离散Logistic模型替代比例风险模型,多用于m:n的Logistic回归
EFRON : 使用 Efron的近似似然
EXACT 计算在比例危险假定下所有失效事件发生在具有相同值的删失时间或较大 值时间之前的精确条件概率。
PHREG过程的语法格式如下: PROC PRREG [过程选项]; MODEL <生存时间变量*截尾指示变量(数值)>=<自变量名> /[模型选项];
多元线性回归
数据类型 Y数值变量
logistic回归
Y分类变量
Cox回归
Y二分类变量+时间 h(t,x)=h0(t)exp(1x1 + 2x2 +•••+ mxm ) 最大似然法 似然比检验 Wald检验 score检验 RR
X数值变量、分类变量、等级变量 模型结构 Y=1x1 + 2x2 +•••+ mxm 变量筛选 前进法;后退法;逐步法 参数估计 最小二乘法 参数检验 F-test t-test 参数解释 回归系数b 最大似然法 似然比检验 Wald检验 score检验 优势比OR
STRATA <分层变量名列>;
FREQ <变量名列>; BY <分组变量名列>; RUN;
2.【模型选项】 ENTRYTIME=变量名,规定一个替代左截断时间的变量名。 SELECTION=自变量筛选方法 FORWARD/F: 按规定的P值SLE从无到有依次选择变量进入模型 BACKWARD/B: 按规定的P值SLS从含有全部变量的模型开始,依次剔除变量 STEPWISE/S:按SLE的标准依次选入变量,同时对模型中现有的变量按SLS的标准 剔除不显著的变量 SCORE 采用最优子集选择法
PHREG过程的语法格式如下: PROC PRREG [过程选项];
MODEL <生存时间变量*截尾指示变量(数值)>=<自变量名> /[模型选项];
STRATA <分层变量名列>; FREQ <变量名列>; BY <分组变量名列>; RUN;
3.【STRATA语句】 比例风险的假定可能不会对所有的层都成立,此时需要作分层分析。STRATA语句 要求按照分层变量名列的水平数拟合一个多层的Cox模型。与BY语句不同,后者是 要求按分组变量名列分别估计模型及参数。 当省略所有的选项,并且只有一个分类自变量(分组变量)时,模型的检验相当于 生存曲线的比较 (log-rank 检验)。
COX回归用于研究各种因素(称为协变量,或伴随变量等)对于生存期长短 的关系,进行多因素分析。
h0(t)为基础风险函数,它是全部协变量X1,X2,••••,Xm都为0或标准状 态下的风险函数,一般是未知的。
COX回归的应用:
(1)因素分析 分析哪些因素(协变量)对生存期的长短有显著作用。 对各偏回归系数作显著性检验,如显著,则说明在排除其它因素的影 响后,该 因素与生存期的长短有显著关系。
PHREG过程的语法格式如下: PROC PRREG [过程选项]; MODEL <生存时间变量*截尾指示变量(数值)>=<自变量名> /[模型选项];
STRATA <分层变量名列>;
FREQ <变量名列>; BY <分组变量名列>; RUN;
2.【模型选项】 TIES=估计生存率方法
BRESLOW : 使用Breslow的近似似然估计,为默认的选项
PHREG过程的语法格式如下: PROC PRREG [过程选项]; MODEL <生存时间变量*截尾指示变量(数值)>=<自变量名> /[模型选项]; STRATA <分层变量名列>; FREQ <变量名列>;
BY <分组变量名列>;
RUN; 1.【过程选项】 NOPRINT 不打印输出 NOSUMMARY 不打印输出事件和截尾数值 SIMPLE 输出MODEL 语句中每一个说明变量的简单的描述统计量。
例: 随访25例分别以A、B治疗方法治疗的某癌症病人,资料如下,+号表示为截 尾值。1:有肾功能损害,0:无肾功能损害。
proc phreg data=aa;
model days*censor(1)=group renal ;
run;
The PHREG Procedure Data Set: aa Dependent Variable: DAYS Censoring Variable: CENSOR Censoring Value(s): 1 Ties Handling: BRESLOW 数据集名称 应变量名 截尾指示变量 截尾值 BRESLOW 法处理相等的数据

害的死亡的危险为无肾功能损害61.082倍。
---------------------------------------------------------指标 回归系数 -0.7169 -1.0077 0.3585 0.1603 0.7019 0.2703 P值 0.0469 0.0068 0.0007 0.0003 0.0385 0.0001 相对危险度 0.488 0.365 1.431 1.174 2.018 1.310 ---------------------------------------------------------肿瘤部位中段 肿瘤部位下段 深度 TNM分期 未分化癌 淋巴结转移数 COX回归方程为:
样本含量 至少变量数的10倍 至少变量数的20倍 非截尾例数至少变 量数的10倍
应用
因素分析 预测预报 Y
因素分析 因素分析 预测、判别P(Y=1) 生存预测 S(t)

Cox 回归分析是生存分析的一种半参数分析方法。
h(t,x)=h0(t)exp(1x1 + 2x2 +••••••+ mxm ) X1,X2,••••,Xm是协变量 1 ,2,••••••,m是回归系数,由样本估计而得。 I >0表示该协变量是危险因素,越大使生存时间越短 I <0表示该协变量是保护因素,越大使生存时间越长
Testing Global Null Hypothesis: BETA=0 模型检验,无效假设为β =0 Covariates Covariates Model Chi-Square Without With 106.176 83.260 22.916 with 2 DF (p=0.0001)似然比检验 . . 29.715 with 2 DF (p=0.0001)比分检验 . . 13.863 with 2 DF (p=0.0010) Wald检验 Analysis of Maximum Likelihood Estimates 参数的最大似然估计 Standard Wald Pr> Risk Estimate Error Chi-Square Chi-Square Ratio 参数估计 标准误 参数的Waldχ 2检验 P值 相对危险度 0.989726 0.52355 3.57363 0.0587 2.690 4.112210 1.13854 13.04529 0.0003 61.082
Gamma分布,……
2 含有截尾数据(censored data) 截尾数据提供的信息是不完全的 是否出现、何时出现结局不知道
生存资料的分析 估计: Kaplan- Meier法,寿命表法 比较: log-rank检验 影响因素分析:Cox比例风险回归模型(Cox回归模型),是生 存分析中最重要的模型之一。 预测: Cox回归模型预测生存率。
Summary of the Number of Event and Censored Values Total 截尾数 Percent Censored 20.00 截尾的百分数
Criterion
-2 LOG L Score Wald
(2)求各因素在排除其它因素的影响后,对于死亡的相对危险度(或比 数比) 如某因素Xi的偏回归系数为bi, 则该因素Xi对于死亡的比数比为exp(bi)
当Xi为二值变量时,如转移(1=转移,0=不转移)
exp(bi)为转移相对于不转移对于死亡的相对危险度(或比数比)
COX回归的应用:
(3)比较各因素对于生存期长短的相对重要性 比较各标准化偏回归系数bi’ 绝对值的大小,绝对值大的对生存期长 短的作用也大。 (4) 考察因素之间的交互作用 如考察XL和XK之间的交互作用是否显著,再增加一各指标:XLK= XL*XK ,如其偏回归系数bLK显著,则XL和XK之间的交互作用显著。

生存分析(Survival analysis)是指根据试验或调查得到 的数据对生物或人的生存时间进行分析和推断,研究生存 时间和结局与众多影响因素间关系及其程度大小的方法, 也称生存率分析或存活率分析。
生存资料特点 : 1 生存时间的分布一般为非正态分布 指数分布,对数正态分布 ,Weibull分布,
相关主题