最新cox模型
Cox比例风险模型
m
数学模型:
jXj
h(t)h0(t)ej1
lnhho((tt))jm 1jXj
其中,h0(t) 称为基础风险函数
Cox比例风险模型
二、基本思想
用模型去描述实际资料时,须使 得理论结果与实际结果尽可能的一致。
资料整理格式
i
x1
x2 ... t δ
1 x11 x12 ... t1 δ1
(2) 生存率的标准误: 采用Greenwood‘s 法估计生存率的标准误,其公式为:
S E (S(tk))S(tk)
k qj j1pjnj来自(3) 生存曲线(survival curve):是指将各个时 点的生存率连接在一起的曲线图。曲线形状分两种 类型: ①阶梯型:小样本资料用直接法估计的生存曲线; ②折线型:大样本资料用频数表法估计的生存曲线。
若RR<1,则抑制 “死亡”的发生,延长生存时间,“保护因素” 占主导地位;
若RR=1,则处于X*水平下的风险与X▲水平相等,处于平衡状态。
Cox比例风险模型
(2)对单因素进行评价:
对因素xj而言,当它由xj▲变化到xj*时,
ln RjR ˆj(x * j x j)
RReˆj(x*jx j ) j
筛选影响因素的统计量是:
似然比统计量 G=2(lnL k+1-lnL k)
它服从自由度为1的卡方分布。
生存率的估计:目的是对群体定量地进行预后评价。由于生存率与基础
生存率相关,故只要估计出基础生存率,再结合各因素的偏回归系数就可
以估计出生存率, 即
S t, X S0 (t) exp(X )
cox模型
生存时间 1. 完全数据(complete data)
在追踪观察中,当观察到了某观察对象的明确结局时, 该观察对象所提供的关于生存时间的信息是完整的,这种生 存时间数据称为完全数据。
2. 截尾数据(censored data)
在实际追踪观察中,由于某种原因无法知道观察对象的 确切生存时间,这种生存时间数据称为截尾数据。
RR j eˆj x* x 1
若RRj >1,则xj 促进“死亡”的发生,缩短生
存时间,为“不利因素”;
若RRj <1,则xj 抑制“死亡”的发生,延长生 存时间,为“保护因素”。
若RRj =1,则xj 为非影响因素。
Cox比例风险模型
六.筛选影响因素
常用方法有(1)前进法; (2)后退法; (3)逐步法:有进有出, 双向筛选。
Cox比例风险模型
消除xj量纲的影响
2.标准化偏回归系数j1的意义
xij
xij x sj
j
(1)取 “+”,则随xj 的增大h(t)也增大,即促进“死亡”
的发生,缩短生存时间,为“不利因素”;
取 “-”,则随xj 的增大h(t)降低,即抑制 “死亡” 的发生,延长生存时间,为“保护因素”。
(2)大小 :∣ j1 ∣越大,则xj 对“死亡”风险的影响
也就越大。
Cox比例风险模型
3.RR值的计算和意义
影响因素由X▲ 变化到X* 时,有
m
ˆjx*j
RR
h(t)* h(t)
h0(t)ej1
m
ˆjxj
h0(t)ej1
m
lnRR ˆj(x* j x j ) j1
(1)对多指标的共同效应进行评价:
m
ˆj(x*jx j ) RRej1
若RR>1,则促进“死亡”的 发生,缩短生存时间,“不利因素” 占主导地位;
常用的 Breslow 法:
Sˆ0ti exp H0(ti )
公式中 H 0 ti 为在 ti 时刻的基础累计风险函数,其估计公式为
Hˆ 0 (ti )
tk ti
dk
exp( X s )
sR(tI )
d k 为在 ti 时刻的死亡人数。
2 x21 x22 ... t2 δ2
…...
n xn1 xn2 ... tn δn
Cox比例风险模型
三、基本原理
类似Logistic回归分析构造一个所 谓的偏似然函数L=…
使得L或lnL最大的j即为所求。
Cox比例风险模型
四、基本方法
最大偏似然函数法
五、参数解释
1. 偏回归系数j 的意义
与指标的计量单位有关,从而无实际 的解释意义。
的是定群寿命表法(cohort life table)。
➢生存曲线的比较
利用死亡数和死亡率函数推断k个总体生存曲线是否不同 ? 比较方法:
①Log rank检验 .其基本思想是实际死亡数与期望死亡
数进行比较 (H0:总体生存率曲线相同):
2 (AT)2 T
H0成立时,服从自由度为(k -1)的2分布! ②Breslow检验 .可看作是对Log rank检验 的一种加权.
四分位数间距:记为Q,表示中间半数病人生存 期的分布范围,它反映生存期的离散程度,其定义为:
Q=T25-T75
式中,T25和T75分别是25百分位数和75百分位数.
➢生存率的估计
小样本生存率的估计:Kaplan-Meier法 ,又
称乘积极限法(Product-limit method) .
大样本生存率的估计:寿命表法. 寿命表有现时和定群之分,估计生存率用
➢半数生存期及其四分位数间距
半数生存期 (median survival time):又称中数生存期, 记为T50,其定义为:
T50 =生存率为0.5时所对应的时间
T50t12k(, tk 分 tk1)组,资不料分频组折 数资线 表料图 法 阶 直) ( 梯 接图 法) (
它表示有并且只有50%的个体可活这么长 时间,它反映生存期的平均水平。