当前位置：文档之家› 第七章回归案例

第七章回归案例

y ) 2 /(n p 1)
( y
i
y) 2 ( yi y) 2 ( yi yi ) 2 ）
零阶相关系数: Zero Order 计算所有自变量与因变量间相关系数部分相关系数: 在排除了其他变量对因变量影响后, 当一个自变量进入回归方程后, 复相关系数平方的增加量. 偏向关系数: 在排除了其他变量的影响后, 自变量 x 对因变量的相关程度.

回归分析的菜单选项及说明：

在回归过程中包括：
Liner：线性回归 Curve Estimation：曲线估计 Binary Logistic：二分变量逻辑回归 Multinomial Logistic：多分变量逻辑回归 Ordinal 序回归 Probit：概率单位回归 Nonlinear：非线性回归 Weight Estimation：加权估计 2-Stage Least squares：二段最小平方法 Optimal Scaling 最优编码回归
1. 回归方程:
y b0 b1 x1 ... bn xn
2
( y y) 2. 相关参数:复相关系数 R, R == ( y y)
i i

2 2
调整的判定系数 Adjusted R Square （因 SST=SSA+SSE
R =1—
2
(y
(y
i
i
y) 2 / p
4. 回归方程的建立 Enter 所有变量都进入方程(全模型) Remove 根据设定好的条件, 删除部分变量, 通常根据变量与模型的相关性 Forward 向前选择根据条件从无自变量开始逐个选择适合的变量进入模型 Backward 向后剔除法根据条件从全模型中逐个剔除变量 Stepwise 逐步进入法注：衡量变量在回归模型中作用的大小，一般用偏回归平方和刻画，令S（i1, i2, … , ik）表示方程中有变量(i1, i2, … , ik)时残差平方和,则第 i个变量的偏回归平方和定义为: Pi2= S（i1, i2, …im-1,im+1,… , ik）—S（i1, i2, … , ik） Pi越大表明该变量越重要。）
Hale Waihona Puke 第一节 Linear过程7.1.1 主要功能调用此过程可完成二元或多元的线性回归分析。在多元线性回归分析中，用户还可根据需要，选用不同筛选自变量的方法（如：逐步法、向前法、向后法，等）。一元线性回归方程： y a bx

多元线性回归方程： y b0 b1 x1 ... bn xn

回归的分类：按是否线性分：线性回归模型和非线性回归模型。按自变量个数分：简单的一元回归，多元回归。利用SPSS得到模型关系式，是否具有适用性，要看回归方程的显著性检验（F检验）和回归系数b的显著性检验(T检验)，还要看拟合程度R2 (相关系数的平方,一元回归用R square ，多元回归用Adjusted R Square)
一元线性回归方程的检验回归系数显著性检验： 1．斜率、截距的检验 y a bx 零假设： H0 : a 0; H1 : a 0 t—检验计算检验统计量样本值 t* 计算显著性概率 P{|t|<t*}=sig 并由此作结论: 2. 回归效果的 R 2 判定系数
R2
( y i y) 2
= ( yi y ) 2
方差分析:利用总平方和分解办法测定自变量与随机因素引起的差异的大小比较的检验法 : 原假设 H0: 回归系数为零构造 F 统计量 F=MSA/MSE 计算 F 的样本值 F 计算显著性概率
*
P{F>F*}=sig 并由此作结论:
误差项独立性检验: Durbin-Watson 检验检验值 D D=2 D>2 D<2 0<D<4 残差与自变量独立负相关正相关
3. 多元回归的假设检验: 回归方程的显著性检验: F 检验原假设: 所有回归系数均为零, 备择假设 : 至少有一个不为零检验统计量: F=
(y (y
i

i
yi ) 2 /(n p 1)
y) 2 / p
计算统计量的样本值 F* 计算概率: 作结论: 偏回归系数与常数项的显著性检验: 方差齐性检验: 检验残差的分布是否与自变量取值无关该软件通过绘制残差与自变量的散点图象观察（因为数据量不足，一般对自变量的不同取值只采样一次，不足以作方差分析）残差的正态性检验: 通过残差的直方图以及累积概率 P-P 图来描述(服从正态分布时,图形在一条斜线附近 P{F>F*}=SIG

回归方程的假设
1．数据正态性假设：误差项的分布与自变量无关，服从均值0，方差常数的正态分布； 2．方差齐性假设：对不同的自变量取值条件下，误差分布方差相同； 3．独立性假设：对不同的自变量取值条件下，误差分布期望为0； 4．无自相关性假设：对不同的自变量取值条件下，误差不相关； 5．随机误差与自变量对因变量的影响不相关；
第七章回归分析
第一节第二节第三节第四节第五节 Linear过程线性回归 Curve Estimation过程曲线回归 Logistic过程罗辑斯谛回归 Probit过程概率单位回归 Nonlinear过程非线性回归
回归的主要内容：从一组样本数据出发，确定这些变量间的定量关系式；对这些关系式的可信度进行各种统计检验；从影响某一变量的诸多变量中，判断哪些变量的影响显著，哪些不显著；利用求得的关系式进行预测和控制。
5. 参入分析的观测量的选择: 利用Selection 变量的取值实现分析中 CASE的选择 6. Statistics 选项设置: R squared Chang : 表示当回归方程中引入或剔除一个变量后R2的改变量。 7. 共线性诊断：回归方程中，虽然各自变量对因变量都是有意义的，但是某些自变量可能彼此相关，即存在共线性问题，因此需要对方程中的自变量进行共线性诊断。如果存在常数C0 C1 C2，使C0= C1 X1+C2X2 则称X1，X2具有精确共线性. 如果上式近似成立，则称近似共线性

e商务文档

第七章回归案例

相关文档推荐：