当前位置:
文档之家› 统计学logistic回归分析课件
统计学logistic回归分析课件
或
1 p (y 1 /x 1 ,x 2 x k) 1 e (0 1 x k ....kx k)
统计学logistic回归分析
10
2.模型中参数的意义
ln1PP=0 1X1
Β0(常数项):暴露因素Xi=0时,个体发病 概率与不发病概率之比的自然对数比值。
ln1PP (y(y1/0x/x 0)0)=0
事件发生率很小,OR≈RR。
统计学logistic回归分析
14
二、 Logistic回归模型
• Logistic回归的分类
二分类 多分类
条件Logistic回归 非条件Logistic回归
统计学logistic回数单位转换
logit P=
ln
1
P
P
统计学logistic回归分析
ORe
ORP1/(1P1) od1ds P0/(1P0) od0ds
统计学logistic回归分析
12
Y 发病=1 不发病=0
危险因素
x= 1 x= 0
30(a) 10( b)
70(c) 90(d)
a+c
b+d
危险因素
Y
x= 1 x= 0
发病=1 不发病=0
p1 1-p1
p0 1-p0
a
p1 a c 有暴露因素人群中发病的比例
发生
Y=1
不发生 Y=0
例:暴露因素
冠心病结果
高血压史(x1):有 或无
有 或无
高血脂史(x2): 有 或 无
吸烟(x3): 有或无
统计学logistic回归分析
2
研究问题可否用多元线性回归方法?
1.多y ˆ元 线性a回 归b 1 方x1 法 要b 求2x Y2的取b 值m 为xm 计量的连续
性随机变量。 2.多元线性回归方程要求Y与X间关系为线性关系。 3.多元线性回归结果 不能回答“发生与否”
Logistic回归模型
e(b0b1x1b2x2bkxk) P1e(b0b1x1b2x2bkxk)
统计学logistic回归分析
18
三、参数估计
• 最大似然估计法 (Maximum likehood estimate)
似然函数:L=∏Pi 对数似然函数: lnL=∑(ln P)=ln P1+ln P2+…+ln Pn 非线性迭代方法——
方程如下:
线性 关系
ylo i(tg p )01x1 Y~(-∞至+∞)
截距(常数)
回归系数
统计学logistic回归分析
9
在有多个危险因素(Xi)时
• 多个变量的logistic回归模型方程的线性表达:
log li n 1 t P P ( = p0 )1 X 12 X 2 m X m
第十六章 logistic回归分析
logistic回归为概率型非线性回归 模型,是研究分类观察结果(y)与 一些影响因素(x)之间关系的一种 多变量分析方法
统计学logistic回归分析
1
问题提出:
医学研究中常研究某因素存在条件下某结果是否 发生?以及之间的关系如何?
因素(X)
疾病结果(Y)
x1,x2,x3…XK
16
流行病学概念:
设P表示暴露因素X时个体发病的概率, 则发病的概率P与未发病的概率1-P 之 比为优势(odds), logit P就是odds的 对数值。
统计学logistic回归分析
17
• Logistic回归模型 Logistic回归的logit模型
l o g it P = b 0 b 1 x 1 b 2 x 2 b k x k
e0x p1P(y1/x1)1e0x
P (y0/x1)11 ee 0 0 xx1p1
e0
p0P(y1/x0)1e0
e0
P(y0/x0)11e 统计学logistic回归分析
0
1p0
8
logistic回归模型方程的线性表达
对logistic回归模型的概率(p)做logit变换,
logit(p) ln( p ) 1 p
统计学logistic回归分析
13
多元回归模型的的 概i 念
logit(p)ln 1 P P = 01X 1m X m
件 i的反对映数了优在势其比他。变量固定后,X=1与x=0相比发生Y事
回归系数β与OR i X与Y的关联
•
β=0,OR=1,
无关
β>0,OR>1 , 有关,危险因素
β<0,OR<1, 有关,保护因子
logistic回归方法补充多元Yˆ线性回归的不足
统计学logistic回归分析
3
Logistic回归方法
该法研究是 当 y 取某值(如y=1)发生的概率(p)与某暴露
因素(x)的关系。
p (y 1 /x ) f(x ),即 p f(x )
P(概率)的取值波动0~1范围。 基本原理:用一组观察数据拟合Logistic模型,揭示 若干个x与一个因变量取值的关系,反映y 对x的依存关 系。
统计学logistic回归分析
4
一、基本概念
1.变量的取值 logistic回归要求应变量(Y)取值为分类变量
(两分类或多个分类)
1 Y0
出现阳性(结 发果 病、有效、死亡等) 出现阴性(结 未果 发病、无效) 、存活等
自变量(Xi)称为危险因素或暴露因素,可为连续 变量、等级变量、分类变量。 可有m个自变量X1, X2,… Xm
统计学logistic回归分析
11
与Xi=i 0的相含比义,:发某生危某险结因果素(,如暴发露病水)平优变势化比时的,对即数X值i=。1
ln
OR
ln
P1 P0
/(1 /(1
P1) P0 )
log itP1 log itP0
P1(y=1/x=1)的概率 P0(y=1/x=0)的概率
(0 1x1) (0 x0 ) 1x1
统计学logistic回归分析
5
2.两值因变量的logistic回归模型方程
• 一个自变量与Y关系的回归模型
如:y:发生=1,未发生=0 x 有=1无=0,
记为p(y=1/x)表示某暴露因素状态下,结果y=1 的概率(P)模型。
或
P(y1/x)1ee00xx
1
p(y1/x)1exp (0 [x)]
模型描述了应统变计学量logistipc回与归分x析 的关系
6
p(y1)1exp1 ([0x)]P概1率 z01x
0.5
Β为正值,x越 大,结果y=1发 生的可能性(p) 越大。
-3 -2 -1 0 1
Z值 23
图16-1 Logistic统回计学lo归gistic回函归分数析 的几何图形
7
几个logistic回归模型方程