当前位置：文档之家› 09 非条件Logistic 回归分析

09 非条件Logistic 回归分析

Model Fitting Information and Testing Global Null Hypothesis BETA=0 Intercept Intercept Criterion AIC SC -2LOGL Score Only 109.669 112.026 107.669 . and Covariates 101.900 108.970 95.900 . Chi-Square for Covariates . . 11.769 with 2 DF(p=0.0028) 11.241 with 2 DF(p=0.0036)
È Ê ± ý ± È Odds Ratio . 6.000
2 . 8 9 0 4
1 .7 9 1 8
两个协变量的Logistic回归模型
例2：研究性别、疾病有效(effect=1) 无效(effect=0) 合计不严重(degree=0) 21 6 27 女(sex=0) 严重(degree=1) 9 9 18 不严重(degree=0) 8 10 18 男(sex=1) 严重(degree=1) 4 11 15 性别
e 1 (1 e 1 ) e 1 2 (1 e 1 2 )
Odds of (effect=1)
e
e 2
1
0 1
e 1
e 1 2
多分类无序自变量的Logistic回归模型
n分类无序自变量在logistic回归模型中需转变
输出
模型检验： H0:1=2=0 vs H1：1，2不全为0 似然比的卡方＝(无协变量的－2LOGL值)－(有两个协变量
的－2LOGL值)＝107.669-95.9=11.769，自由度df=2(模型中的协变量个数)，相应的P值=0.0028，因此可以认为两个协变量的回归系数至少有一个不为0。即：认为模型有意义
两个比值的比
p P 1 . 277 OR e 0 . 279 1 p1 P
各子组的模型预测的有效概率和基于有效水平的 Odds（P/1-P）
SEX 0
DEGREE Pr(effect=1) 0 1
e (1 e ) e 2 (1 e 2 )
当反应变量为离散型变量时，如研究不同治疗
方法对某病治疗的效果，反应变量疗效Y的值为1（治愈）和0（未愈），要研究的是某种事件（如治愈）发生的可能与自变量（治疗方法）的关系，反应变量为事件发生的概率P （Y=1）。
对概率进行转换，可建立线性回归模型
P ln x x ... x X 1 1 2 2 n n 1 P
拟合回归方程
L o g i t ( P ) s e x d e g r e e 1 2

程序9-2：
data a1; input sex degree effect count @@; cards; 0 0 1 21 0 0 0 6 0 1 1 9 0 1 0 9 1 0 1 8 1 0 0 10 1 1 1 4 1 1 0 11 ; proc logistic descending; freq count; model effect=sex degree/scale=none aggregate; /*模型的拟合优度检验*/ run;
两分类反应变量的logistic回归
例1：不同治疗方法对某病疗效的影响研究
Ö Î « ´ Â Ð Ï º Á × Æ é ± ð ³ × Í é (treat=1) ¨× · é (treat=2) Æ ¼ Ó Ð Ð §(effect=1) 16(25%) 40(66.67%) 56 Î Ð Þ §(effect=0) 48(75%) 20(33.33%) 68 º ¼ Ï Æ 64 60 124
H0：＝0的似然比检验：似然比的卡方值=(无协变量的－2LOGL值)－(有两个协变量的－ 2LOGL值)＝170.737－148.361=22.376，自由度df为1，p值＝ 0.0001,因此可以认为模型有意义。
输出
² Ê Î ý × î ´ ó Ë Æ È » ¹ À ¼ Æ µ Ä Í ³ ¼ Æ · Ö Î ö Analysis of Maximum Likelihood Estimates Ø é » ¹ Ï µ Ê ý ê × ± ¼ Î ó Wald¿ ¨· ½ PÖ µ ê » ± ¯ µ Ï Ê ý À ¼ ¹ Æ Parameter Standard Wald Pr> Standardized Variable DF Estimate Error Chi-Square Chi-Square Estimate INTERCPT 1 -2.8904 0.6390 20.4594 0.0001 . TREAT 1 1.7918 0.3979 20.2762 0.0001 0.495670
t r e a t e 可用logistic回归模型 P ( e f f e c t 1 |t r e a t ) t r e a t 1 e 拟合，即
l o g i tp () t r e a t
程序9-1
data a; input treat effect count@@; cards; 1 1 16 1 0 48 2 1 40 2 0 20 ; proc logistic order=data; /*规定按数据集建立时反应变量水平出现的先后次序进行运算，按照p=Pr（effect=1|x）来拟合模型*/ freq count; model effect=treat; run;
p1=p2 ，则可得两个比数相等Odds1=Odds2 ；
因此我们可以把两个患病率大小的比较转化为两个
Odds大小的比较。并引入比数比(Odds Ratio,OR)
p 2 2 O d d s2 1 p e 2 O R e p O d d s e 1 1 1 p 1
两分类反应变量(proc logistic) 多分类有序反应变量(proc logistic) 多分类无序反应变量（ proc catmod）
原理
Y x x ... x X 多元线性回归模型： 1 1 2 2 n n 是参数向量，X是自变量向量。其中是截距，表示n个自变量x与反应变量Y间的关系，Y为任意实数，属于连续变量
输出
Deviance and Pearson Goodness-of-Fit Statistics Pr > Criterion DF Value Value/DF Chi-Square Deviance 1 0.2141 0.2141 0.6436 Pearson 1 0.2155 0.2155 0.6425 两种拟合优度检验的结果均显示：P值=0.64>>0.05，因此可以认为当前模型与拟合最好的模型比较，差别无统计意义。因此没有必要对模型作进一步改进

MODEL语句的选项
参数估计和预测

alpha= 设置可信区间的置信度 cl 要求估计要求估计所有参数的可信区间 plrl 对自变量估计比数比的可信区间 ctable 和pprob= 以pprob=指定的概率值为分割点，输出根据最后模型预测的Y的分类表（ctable的作用），ctable选项仅对两分类变量起作用。
输出
Analysis of Maximum Likelihood Estimates Parameter Standard Wald Variable DF Estimate Error Chi-Square INTERCPT 1 1.1568 0.4036 8.2167 SEX 1 -1.2770 0.4980 6.5750 DEGREE 1 -1.0545 0.4980 4.4844 Pr > Standardized Chi-Square Estimate 0.0042 . 0.0103 -0.350072 0.0342 -0.289086 Odds Ratio . 0.279 0.348
非条件Logistic 回归分析
2019/2/6
前言
Logistic回归模型是适用于反应变量(因变量为
分类变量的回归分析按设计类型：

条件Logistic回归：配对设计（proc phreg）非条件Logistic回归：未配对(proc logistic)
按变量类型：

基本语句
Proc logistic [options]; Model 反应变量=自变量[/options]；
/*建立
模型*/ [freq 变量名；] run；
/*指定频数变量*/
MODEL语句的选项
关于模型拟和优度

Aggregate 和scale=n|p|d 计算偏差和pearson卡方拟和优度统计量 n 对离差参数不进行校正 p 规定离差参数的估计为pearson卡方统计量除以自由度 d 规定离差参数的估计为偏差除以自由度
成（n-1）个哑变量进行分析例3：研究性别和不同疗法对某病治愈与否影响。数据如下
治疗方法(treat) 有效(response=1) 无效 response=0 合计 A 78 28 106 男(sex=1) B 101 11 112 C 68 46 114 A 40 5 54 女(sex=0) B 54 5 59 C 34 6 40 性别
男性治愈与未愈的比值为女性治愈与未愈的比值为
P 1 P
x x 1 . 277 1 x 1 1 2 2 2 2 e e
x x 1 . 277 0 x 1 1 2 2 2 2 e e
P 1 P
由于治疗方式是3水平，而且是无序的，必须引入两个

e商务文档

09 非条件Logistic 回归分析

相关文档推荐：