当前位置:文档之家› SPSS专题2回归分析线性回归Logistic回归对数线性模型

SPSS专题2回归分析线性回归Logistic回归对数线性模型

预测。 • 这里所说的预测,是用已知的自变量的值通过模型
对未知的因变量值进行估计;它并不一定涉及时间 先后的概念。
3
例1 有50个从初中升到高中的学生.为了比较初三的成绩是否和高中的成绩 相关,得到了他们在初三和高一的各科平均成绩(数据:highschool.sav)
50名同学初三和高一成绩的散点图
70.00
j3
80.00
90.00
100.00
Corre la ti ons
j3
j3
Pearson Correlati on
1
s1 .7 95 **
Si g. (2-tai l ed)
. 0 00
N
50
50
s1
Pearson Correlati on
.7 95 **
1
Si g. (2-tai l ed)
回归分析
线性回归 Logistic回归 对数线性模型
吴喜之
回归分析
• 顾客对商品和服务的反映对于商家是至关重要的,但是仅仅 有满意顾客的比例是不够的,商家希望了解什么是影响顾客 观点的因素以及这些因素是如何起作用的。
• 一般来说,统计可以根据目前所拥有的信息(数据)建立 人们所关心的变量和其他有关变量的关系(称为模型)。
. 0 00
N
50
50
**. Correl ati on i s si gnifi cant at the 0.01 l evel (2-tai l ed).
Corre la ti ons
Kendal l's tau_b j 3
Correl ati on Coeffi ci ent
j3 1 . 00 0
80
90
100
9
J3
40
检验问题等
• 对于系数1=0的检验 • 对于拟合的F检验 • R2 (决定系数) =SSR/SST,可能会由 于独立变量增加而增加(有按自由度修 正的决定系数:adjusted R2), • 简单回归时R等于相关系数
10
回到例1:R2等
M odel Summary
M odel 1
Si g. (2-tai l ed)
N
s1
Correl ati on Coeffi ci ent
. 50 .5 95 **
Si g. (2-tai l ed)
. 0 00
N
50
Spearman's rho j 3
Correl ati on Coeffi ci ent Si g. (2-tai l ed)
Standardi zed Coeffi ci ents
Be ta
. 7 95
t 4 . 90 1 9 . 08 9
Si g. . 0 00
.000 11
多个自变量的回归
y 0 1x1 2 x2 L k xk
如何解释拟合直线?
什么是逐步回归方法?
例子:RISKFAC.sav
• 不算序号和(192个)国家有21个变量 • 包括地区(Region)、(在城镇和乡村)使用干净水的
Resi dual
2 50 2 . 79 4
T otal
6 81 0 . 00 0
a. Predi ctors: (Constant), j3
b. Dependent Vari abl e: s1
df 1
48 49
M ean Square 4 30 7 . 20 6 5 2. 1 4 2
F 8 2. 6 0 6
• 假如用Y表示感兴趣的变量,用X表示其他可能有关的变 量(可能是若干变量组成的向量)。则所需要的是建立一 个函数关系Y=f(X)。这里Y称为因变量或响应变量,而X 称为自变量或解释变量或协变量。
• 建立这种关系的过程就叫做回归。
2
回归分析 • 一旦建立了回归模型 • 可以对各种变量的关系有了进一步的定量理解 • 还可以利用该模型(函数)通过自变量对因变量做
Si g. .0 00 a
Coeffi c ie ntsa
Unstandardi zed Coeffi ci ents
M odel
1
(Con st a nt )
B
Std. Error
2 6. 4 4 4
5 . 39 6
j3
. 6 51
. 0 72
a. Dependent Vari abl e: s1
%、生活污水处理的%、饮酒量 (litre/yearperson)、(每万人中)内科医生数目、护 士和助产士数、卫生工作者数、病床数、护士助产 士和内科医生之比、卫生开支占总开支的%、占政 府开支的%、人均卫生开支$、成人识字率、人均 收入$、每千个出生中5岁前死亡人数、人口增长率 %、(男女的)预期寿命(年)、每10万生育的母亲死 亡数
100
90
80
70
60
50
从这张图可以看出什么呢? 40
40
50
60
70
80
90
100
110
4
初三成绩
高一成绩
还有定性变量 • 该数据中,除了初三和高一的成绩之外,还有
一个定性变量 • 它是学生在高一时的家庭收入状况;它有三个
水平:低、中、高,分别在数据中用1、2、3 表示。
5
还有定性变量
下面是对三种收入对高一成绩和高一与初三成绩差的盒 形图
高一成绩与初三成绩之差 高一成绩
110
100
90
80
70
60
50
39 25
40
30
N=
11
27
12
1
2
3
家庭收入
30
20
10
0
-10
-20
-30
N=
11
27
12
1
2
3
家庭收入
6
s1
例1:相关系数
100.00
90.00
80.00
70.00
60.00
50.00
40.00 40.00
50.00
60.00
R
R Square
.7 95 a
. 6 32
a. Predi ctors: (Constant), j3
Adj usted R Square
. 6 25
Std. Error of the Esti mate
7 . 22 0 91
ANOVAb
M odel
1
Regressi on

Sum of Sq ua re s 4 30 7 . 20 6
1 . 00 0 .
N
50
s1
Correl ati on Coeffi ci ent
.7 58 **
Si g. (2-tai l ed) N
. 0 00 50
**. Correl ati on i s si gnifi cant at the 0.01 l evel (2-tai l ed).
s1 .5 95 ** . 0 00 50
1 . 00 0 .
50 .7 58 ** . 0 00
50 1 . 00 0
. 50
7
定量变量的线性回归分析
• 对例1中的两个变量的数据进行线性回归,就是要找到一条直线 来最好地代表散点图中的那些点。
y 0 1x
100
90
80
70
S1
60
50
y 26.44 0.65x
40
50
60
70
相关主题