当前位置:
文档之家› 生存分析统计学(课堂PPT)
生存分析统计学(课堂PPT)
… ………
X3 …. XP
a13 … a1p a23 … a2p a33 … a3p ………
n
Yn an1 an2
an3 … anp
其中:Y取值是二值或多项分类
.
5
表2. 肺癌与危险因素的调查分析
例号 是否患病
1
0
2
0
3
1
…
…
30
1
性别 吸烟 年龄 地区
1
0 30 0
0
1 46 100 35 1….2
▪ 目的:作出以多个自变量(影响因素)估计
应变量(结果变量)的logistic回归方程
▪ 资料:1. 应变量为反映某现象发生与不发
生的二值变量;2. 自变量(影响因素)可能
是二值数据或等级资料或计量资料。分类变
量要数量化
▪ 用途:研究某种疾病或现象发生和多个危险
因素(或保护因子)的数量关系
.
3
因素
变量名
赋值说明
咽炎 吸烟量(支/日) 声嘶史 摄食新鲜蔬菜 摄食水果 癌症家族史 是否患喉癌
X1
无=1, 偶尔=2, 经常=3
X2
0=1, 14=2, 59=3, 1020=4, 20=5
X3
无=1, 偶尔=2, 经常=3
X4
少=1, 经常=2, 每天=3
X5
很少=1, 少量=2, 经常=3
X6
.
9
3.筛选变量的常用方法
• 向前法(forward selection) • 后退法(backward selection) • 逐步回归法(stepwise selection)
.
10
4.Logistic回归的结果解释
Variables in the Equation
B
Satep X3
. 143
Xi每增加一个单位时,所得到的优势比的自然对数 。也就是其它自变量固定不变的情况下,自变量Xi 每增加一个单位时,影响因变量Y=0发生的倍数
设第i个因素的回归系数为bi
• 当bi>0时,对应的优势比ORi=exp(bi)>1,说明该因
素是危险因素;
• 当bi<0时,对应的优势比ORi=exp(bi)<1,说明该因
1. Logistic回归模型的数据结构
• 设资料中有一个因变量Y、p个自变量X1, X2,…,Xp,对每个实验对象共有n次观测结 果,可将原始资料列成表1形式。
.
4
表1. Logistic回归模型的数据结构
实验对象 Y X1 X2
1
Y1 a11 a12
2
Y2 a21 a22
3
Y3 a31 a32
.003 .001
a.Variable(s) entered on step 1: X3. b.Variable(s) entered on step 2: X2.
.
11
4.Logistic回归的结果解释
• 设第i个因素的回归系数为bi,表示当有多个自变
量存在时,其它自变量固定不变的情况下,自变量
无=0, 有=1
Y
病例=1, 对照=0
.
13
医学科研中的 统计学方法
生存分析
宋曼殳 公共卫生学院 流行病与卫生统计学系
songms@
.
14
• 对于急性病的疗效评价,一般可以用治愈 率、病死率等指标
• 但对于肿瘤、结核及其他慢性疾病,其预 后不是短期内所能明确判断的,因此上述 指标不太适用。
1 Consta-n6t.043
Sbtep X2 2 X3
3. 021 . 149
Constant -7.403
S. E. . 047 1. 966 1. 375 . 054
2. 522
Wald 9. 388 9. 448 4. 830 7. 720
8. 615
df 1 1 1 1
1
95.0% C.I.for EXP(B Sig. Exp(B) Lower Upper .002 1.154 1.053 1.265 .002 .002 .028 20.505 1.386303.296 .005 1.161 1.045 1.289
复习
• Logistic回归模型是一种概率模型,适合 于病例—对照研究、随访研究和横断面研 究,且结果发生的变量取值必须是二分的 或多项分类的。
• 可用影响结果变量发生的因素为自变量与 因变量建立回归方程。
.
1
复习
• 1. Logistic回归分析的数据结构 • 2. Logistic回归分析的模型 • 3. 筛选变量的常用方法 • 4. Logistic回归分析的结果解释
P1 eexx p 0 p 0( (1 X 1X 1 1 pX pX p)p)
ln P /1 ([P ) ]01 X 1 p X p
.
8
2.Logistic回归的模型
定义:
Lo (P )g lin P t/1 [( P )]
为Logistic变换,即:
Lo (P ) g0 it1 X 1 p X p
01 2
020
… … … ………
22 2
000
注:X1蛋白质摄入量,取值:0,1,2,3
X2不良饮食习惯,取值:0,1,2,3
X3 精 神 状 况,取值:0,1,2
.
7
2、 Logistic回归模型
令: Y=1 发病(阳性、死亡、治愈等) Y=0 未发病(阴性、生存、未治愈等)
将发病(Y=1)的概率记为P,它与自变量x1, x2,…,xp之间的Logistic回归模型为:
.
15
• 临床试验研究通常观察各个对象在各个时 点上事件的发生情况(结局),以评价临床 疗效。
• 在比较不同疗法的疗效时,不仅要考虑是 否有效,还要考虑从试验开始到产生疗效 的时间。
.
16
• 例: 假定用甲、乙两种药物治疗某病,其治 愈率均为80%,能否说两种疗效一致?
• 还应考虑时间效应问题,如果甲药平均3天治 愈80%,而乙药平均7天治愈80%,则可以认 为甲药比乙药的疗效好。
………
0
0 26 1
是否患病:‘1’代表否, ‘0’代表是
性 别:‘1’代表男, ‘0’代表女
吸 烟:‘1’代表吸烟,‘0’代表不吸烟
地 区:‘1’代表农村,‘0’代表城市
.
6
对子号
1 2 3 … 10
表3. 配对资料(1:1)
病例
对照
X1 X2 X3 13 0
X1 X2 X3 101
03 1
130
素是保护因素
.
12
例 4、 某北方城市研究喉癌发病的危险因素, 用 1:2 配对的病例对照研究方法进行了调查。现选取了 6 个可能的危险因素并节录 25 对数据,各因素的赋值说明见 表 9,资料表(略),试作条件 logistic 逐步回归分析。
(入 0 .1, 0 出 0 .1)5
表 9. 喉癌的危险因素与赋值说明