当前位置:文档之家› 09 非条件Logistic 回归分析

09 非条件Logistic 回归分析

Model Fitting Information and Testing Global Null Hypothesis BETA=0 Intercept Intercept Criterion AIC SC -2LOGL Score Only 109.669 112.026 107.669 . and Covariates 101.900 108.970 95.900 . Chi-Square for Covariates . . 11.769 with 2 DF(p=0.0028) 11.241 with 2 DF(p=0.0036)
È Ê ± ý ± È Odds Ratio . 6.000
2 . 8 9 0 4
1 .7 9 1 8
两个协变量的Logistic回归模型
例2:研究性别、疾病 有效(effect=1) 无效(effect=0) 合计 不严重(degree=0) 21 6 27 女(sex=0) 严重(degree=1) 9 9 18 不严重(degree=0) 8 10 18 男(sex=1) 严重(degree=1) 4 11 15 性别
e 1 (1 e 1 ) e 1 2 (1 e 1 2 )
Odds of (effect=1)
e
e 2
1
0 1
e 1
e 1 2
多分类无序自变量的Logistic回归模型
n分类无序自变量在logistic回归模型中需转变
输出
模型检验: H0:1=2=0 vs H1:1,2不全为0 似然比的卡方=(无协变量的-2LOGL值)-(有两个协变量
的-2LOGL值)=107.669-95.9=11.769,自由度df=2(模型 中的协变量个数),相应的P值=0.0028,因此可以认为两个 协变量的回归系数至少有一个不为0。即:认为模型有意义
两个比值的比
p P 1 . 277 OR e 0 . 279 1 p1 P
各子组的模型预测的有效概率和基于有效水平的 Odds(P/1-P)
SEX 0
DEGREE Pr(effect=1) 0 1
e (1 e ) e 2 (1 e 2 )
当反应变量为离散型变量时,如研究不同治疗
方法对某病治疗的效果,反应变量疗效Y的值 为1(治愈)和0(未愈),要研究的是某种事 件(如治愈)发生的可能与自变量(治疗方法) 的关系,反应变量为事件发生的概率P (Y=1)。
对概率进行转换,可建立线性回归模型
P ln x x ... x X 1 1 2 2 n n 1 P
拟合回归方程
L o g i t ( P ) s e x d e g r e e 1 2

程序9-2:
data a1; input sex degree effect count @@; cards; 0 0 1 21 0 0 0 6 0 1 1 9 0 1 0 9 1 0 1 8 1 0 0 10 1 1 1 4 1 1 0 11 ; proc logistic descending; freq count; model effect=sex degree/scale=none aggregate; /*模型的拟合优度 检验*/ run;
两分类反应变量的logistic回归
例1:不同治疗方法对某病疗效的影响研究
Ö Î « ´ Â Ð Ï º Á × Æ é ± ð ³ × Í é (treat=1) ¨× · é (treat=2) Æ ¼ Ó Ð Ð §(effect=1) 16(25%) 40(66.67%) 56 Î Ð Þ §(effect=0) 48(75%) 20(33.33%) 68 º ¼ Ï Æ 64 60 124
H0:=0的似然比检验: 似然比的卡方值=(无协变量的-2LOGL值)-(有两个协变量的- 2LOGL值)=170.737-148.361=22.376,自由度df为1,p值= 0.0001,因此可以认为模型有意义。
输出
² Ê Î ý × î ´ ó Ë Æ È » ¹ À ¼ Æ µ Ä Í ³ ¼ Æ · Ö Î ö Analysis of Maximum Likelihood Estimates Ø é » ¹ Ï µ Ê ý ê × ± ¼ Î ó Wald¿ ¨· ½ PÖ µ ê » ± ¯ µ Ï Ê ý À ¼ ¹ Æ Parameter Standard Wald Pr> Standardized Variable DF Estimate Error Chi-Square Chi-Square Estimate INTERCPT 1 -2.8904 0.6390 20.4594 0.0001 . TREAT 1 1.7918 0.3979 20.2762 0.0001 0.495670
t r e a t e 可用logistic回归模型 P ( e f f e c t 1 |t r e a t ) t r e a t 1 e 拟合,即
l o g i tp () t r e a t
程序9-1
data a; input treat effect count@@; cards; 1 1 16 1 0 48 2 1 40 2 0 20 ; proc logistic order=data; /*规定按数据集建立时反应变量水平出现 的先后次序进行运算,按照p=Pr(effect=1|x)来拟合模型*/ freq count; model effect=treat; run;
p1=p2 ,则可得两个比数相等Odds1=Odds2 ;
因此我们可以把两个患病率大小的比较转化为两个
Odds大小的比较。并引入比数比(Odds Ratio,OR)
p 2 2 O d d s2 1 p e 2 O R e p O d d s e 1 1 1 p 1
两分类反应变量(proc logistic) 多分类有序反应变量(proc logistic) 多分类无序反应变量( proc catmod)
原理
Y x x ... x X 多元线性回归模型: 1 1 2 2 n n 是参数向量,X是自变量向量。 其中是截距, 表示n个自变量x与反应变量Y间的关系,Y为任 意实数 ,属于连续变量
输出
Deviance and Pearson Goodness-of-Fit Statistics Pr > Criterion DF Value Value/DF Chi-Square Deviance 1 0.2141 0.2141 0.6436 Pearson 1 0.2155 0.2155 0.6425 两种拟合优度检验的结果均显示:P值=0.64>>0.05,因此可以认 为当前模型与拟合最好的模型比较,差别无统计意义。因此没有 必要对模型作进一步改进

MODEL语句的选项
参数估计和预测

alpha= 设置可信区间的置信度 cl 要求估计要求估计所有参数的可信区间 plrl 对自变量估计比数比的可信区间 ctable 和pprob= 以pprob=指定的概率值为分 割点,输出根据最后模型预测的Y的分类表 (ctable的作用),ctable选项仅对两分类变量 起作用。
输出
Analysis of Maximum Likelihood Estimates Parameter Standard Wald Variable DF Estimate Error Chi-Square INTERCPT 1 1.1568 0.4036 8.2167 SEX 1 -1.2770 0.4980 6.5750 DEGREE 1 -1.0545 0.4980 4.4844 Pr > Standardized Chi-Square Estimate 0.0042 . 0.0103 -0.350072 0.0342 -0.289086 Odds Ratio . 0.279 0.348
非条件Logistic 回归分析
2019/2/6
前言
Logistic回归模型是适用于反应变量(因变量为
分类变量的回归分析 按设计类型:

条件Logistic回归:配对设计(proc phreg) 非条件Logistic回归:未配对(proc logistic)
按变量类型:

基本语句
Proc logistic [options]; Model 反应变量=自变量[/options];
/*建立
模型*/ [freq 变量名;] run;
/*指定频数变量*/
MODEL语句的选项
关于模型拟和优度

Aggregate 和scale=n|p|d 计算偏差和pearson卡方拟和优度统计量 n 对离差参数不进行校正 p 规定离差参数的估计为pearson卡方统计量 除以自由度 d 规定离差参数的估计为偏差除以自由度
成(n-1)个哑变量进行分析 例3:研究性别和不同疗法对某病治愈与否影 响。数据如下
治疗方法(treat) 有效(response=1) 无效 response=0 合计 A 78 28 106 男(sex=1) B 101 11 112 C 68 46 114 A 40 5 54 女(sex=0) B 54 5 59 C 34 6 40 性别
男性治愈与未愈的比值为 女性治愈与未愈的比值为
P 1 P
x x 1 . 277 1 x 1 1 2 2 2 2 e e
x x 1 . 277 0 x 1 1 2 2 2 2 e e
P 1 P
由于治疗方式是3水平,而且是无序的,必须引入两个
相关主题