spss线性回归分析
以p=2为例。在建立空调机销售量的预测模型时,用y来表示空调机的销售 量,用x1表示空调机的价格,用x2表示消费者可用于支配的收入。则可 以建立二元线性回归模型: y 0 1 x1 2 x2 E y 0 1 x1 2 x2
假如x2保持不变,为一常数时,则有 Ey =1 x1
ˆ
x
第二节 一元线性回归
一元线性回归是描述两个变量之间统计 关系的最简单的回归模型。
例1 假定一保险公司希望确定居民住宅火灾造成的损失数额与该 住户到最近的消防站的距离之间的相关关系,以便准确地确定出 保险金额,表1列出了15起火灾事故的损失及火灾发生地与最近 的消防站的距离。
距消防站距离 火灾损失 距消防站距离 火灾损失 3.4 26.2 2.6 19.6 1.8 17.8 4.3 31.3 4.6 31.3 2.1 24.0 2.3 23.1 1.1 17.3 3.1 27.5 6.1 43.2 5.5 36.0 4.8 36.4 0.7 14.1 3.8 26.1 3.0 22.3
i
y
y
2 n i 1
i
yi
2
其中 yi y 称为总平方和,简记SST
i 1
2
y
n i 1 n
i
y 称为回归平方和,简记SSR
2
2
yi yi 成为残差平方和,简记SSE
i 1
因而平方和分解式可以简写为SST SSR SSE
1)绘制散点图
50
线 性 相 关
40
30
20
10 0 1 2 3 4 5 6 7
线 性 回 归 模 型
距离
损失
2)相关系数
Correlations 距离 距离 Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N 1 . 15 .961** .000 15 损失 .961** .000 15 1 . 15
如何建立这个公式? 1.绘制散点图
2.建立线性函数:y= α +βx
2.建立实际问题回归模型的过程
一、根据研究的目的,设置指标变量 二、搜集整理统计数据 三、确定理论回归模型的数学形式 四、模型参数的估计 五、模型的检验与修改 六、回归模型的运用
具体(社会经济)问题 建立 实际 问题 回归 模型 过程 设置指标变量 搜集整理数据 构造理论模型 估计模型参数
i
x yi y
i
x
i 1
x
4.919
2
1 1 x xi , y yi n i 1 n i 1 ˆ 回归方程:y 10 .278 4.919 x
n
应用Spss软件进行回归参数的估计
1、执行Analyze →Regression →Linear命令,打开对话 框
此构造F检验统计量:
SSR / k MSR F SSE /(n k 1) MSE
在零假设 H : = 0 成立的情况下, 0 1 2 r F 统计量服从F分布,第一个自由度为1,第二个自由 度为n – 2 ,即 F ~ F(1,n – 2)。
决策的规则是:对于给定的显著水平 α ,若F <= F(1, n – 2)就接受原假设,若F >F(1,n – 2) 就拒绝原假设。
损失
**. Correlation is significant at the 0.01 level (2-tailed).
2.一元线性回归模型的数学形式
y 0 1 x
参数的估计
0 y 1 x 1
x
n i 1 n n
i
x
i
y
i
y
设随机变量y与一般变量x1,x 2, ,x p的线性回归模型为: y 0 1 x1 2 x2 + p xp 其中, 0,1, 2, , p是p+1个未知参数,
0 称为回归常数, 1, 2, , p 称为回归系数。
二、多元线性回归方程的解释
回归参数可以应用普通最小二乘估计。 具体计算可以通过spss软件进行。
a Coefficients
Model 1
Unstandardized Coefficients B Std. Error (Constant) 35316.885 2329.457 空 调价 格 6.696 1.562 家 庭收 入 .097 .102
回归平方和SSR=841.766,残差平方和SSE=69.751 总平方和SST= 841.766+ 69.751=911.517
SSR / k MSR F 841 .766 / 5.365 156 .886 SSE /(n k 1) MSE
SIG=0.000<0.05,拒绝原来的假设,H 0:1 表示所有的回归系数不同时为0,也就是说,
H 0:1 2 = r 0
注:检验是否可以用回归方程方法进行模型估计, 也就是回归方程是否有效?
回归方程的显著性检验——F检验
F检验是根据平方和分解式,直接从回归效 果检验回归方程的显著性。
50
ˆ ˆ ˆ y 0 1 x
40
y
i 1
n
i
ˆ y
2
30
Standardized Coefficients Beta .809 .180
t 15.161 4.287 .952
Sig. .000 .003 .369
a. Dependent ble: 空 调 销 售 量
未标准化回归方程为:
y=35316.885+6.696x1+0.097x2
标准化回归方程为:
总平方和反映因变量y的波动程度或称不确定性,在建
立了y对x的线性回归后,总平方和SST就分解成回归平 方和SSR与残差平方和SSE这两个组成部分,其中SSR 是由回归方程确定的,也就是由自变量x的波动引起的, SSE是不能用自变量解释的波动,是由x之外的未加控 制的因素引起的。这样,总平方和SST中,能够由自变 量解释的部分为SSR,不能由自变量解释的部分为SSE。 这样,回归平方和SSR越大,回归效果就越好,可以据
即1可解释为在消费者收入x2保持不变时, 空调机的价格x1每变动一个单位,对空调 机销售量y的平均影响程度。 同理,假如x2保持不变,为一常数时,则有 Ey = 2 x 2
即 2可解释为在空调机价格x1保持不变时, 消费者收入x 2每变动一个单位,对空调 机销售量y的平均影响程度。
三、 回归参数的估计
空 调销 售量
空 调价 格
家 庭收 入
**. Correlation is significant at the 0.01 level (2-tailed).
4.2回归方程的显著性检验
y 0 1 x1 2 x2 r xr
检验因变量与所有自变量之间的线性关系是否 显著,是否可以用线性模型来描述因变量和自 变量之间的关系。也就是检验所有回归系数是 否同时与零无显著差异。应用F检验法加以检 验。
第十章 线性回归分析过程
第一节 回归分析概述
1.回归方程
回归分析是处理变量x与y之间统计关系的一种统计方法和技术。
如果要由x预测y的值,就要利用x与y的观察值,即样本观测值 (x1,y1),(x2,y2),…,(xn,yn)来建立一个公式,当给
定x值后,就代入此公式中算出一个y值,这个值就称为y的预测值。
b ANOVA
Model 1 Regression Residual Total
Sum of Squares 841.766 69.751 911.517
df
Mean Square 1 841.766 13 5.365 14
F 156.886
Sig. .000a
a. Predictors: (Constant), 距 离 b. Dependent Variable: 损 失
(1)从源文件量清
单中选择一个数值 型变量移入 Dependent框中, 选择一个变量作为 自变量移入 Independent 框中 (2)点击OK
0 10 .278 1 4.919
ˆ y 10 .278 4.919 x
多元线性回归模型
一、多元线性回归模型的一般形式
一、根据研究的目的,设置指标变量
试验指标:火灾损失 试验因素:距离消防站的距离 因此建立两个变量: x——距离消防站的距离 y——火灾损失
二、获取相关数据
三、确定理论回归模型的数学形式
1.判断x变量与y变量之间的关系是否为 线性相关关系? 判断方法:1)散点图 2)相关系数法 2.如果是显著线性相关关系,可以选择一 元回归方程做为理论回归模型。
x
i 1
x
2
1 x n
i 1
1 xi , y n
i 1
n
yi
50
40
(xi,yi)
30
y 0 1 x
20
损失
10 0 1 2 3 4 5 6 7
距离
四、模型参数的估计
0 y 1 x 10 .278 1
x
n i 1 n n
y=0.809x1+0.18x2
四、模型的检验与修改
4.1 4.2 4.3 4.4 4.5 相关系数的显著性检验 F检验 t检验 样本决定系数 残差分析
4.1相关系数的显著性检验
由于一元线性回归方程讨论的是变量x与y之间的线性关 系,所以我们可以用变量x与y之间的相关系数来检验 回归方程的显著性。 当 r = 0 时,说明变量之间不存在线性相关关系; 当 0 < r < 1时,说明变量之间存在一定程度的正相关 关系; 当 -1 < r < 0时,说明变量之间存在一定程度的负相 关关系; 当r =1 或 r = -1 时说明变量之间完全正相关或完全负 相关。