第七章回归案例
y ) 2 /(n p 1)
( y
i
y) 2 ( yi y) 2 ( yi yi ) 2 )
零阶相关系数: Zero Order 计算所有自变量与因变量间相关系数 部分相关系数: 在排除了其他变量对因变量影响后, 当一个自变量进入 回归方程后, 复相关系数平方的增加量. 偏向关系数: 在排除了其他变量的影响后, 自变量 x 对因变量的相关 程度.
回归分析的菜单选项及说明:
在回归过程中包括:
Liner:线性回归 Curve Estimation:曲线估计 Binary Logistic: 二分变量逻辑回归 Multinomial Logistic:多分变量逻辑回归 Ordinal 序回归 Probit:概率单位回归 Nonlinear:非线性回归 Weight Estimation:加权估计 2-Stage Least squares:二段最小平方法 Optimal Scaling 最优编码回归
1. 回归方程:
y b0 b1 x1 ... bn xn
2
( y y) 2. 相关参数:复相关系数 R, R == ( y y)
i i
2 2
调整的判定系数 Adjusted R Square (因 SST=SSA+SSE
R =1—
2
(y
(y
i
i
y) 2 / p
4. 回归方程的建立 Enter 所有变量都进入方程(全模型) Remove 根据设定好的条件, 删除部分变量, 通常根据变量 与模型的相关性 Forward 向前选择 根据条件从无自变量开始逐个选择适 合的变量进入模型 Backward 向后剔除法 根据条件从全模型中逐个剔除变量 Stepwise 逐步进入法 注:衡量变量在回归模型中作用的大小,一般用偏回归平 方和刻画,令S(i1, i2, … , ik)表示方程中有变量(i1, i2, … , ik)时 残差平方和,则第 i个变量的偏回归平方和定义为: Pi2= S(i1, i2, …im-1,im+1,… , ik)—S(i1, i2, … , ik) Pi越大表明该变量越重要。)
Hale Waihona Puke 第一节 Linear过程7.1.1 主要功能 调用此过程可完成二元或多元的线性回归分 析。在多元线性回归分析中,用户还可根据 需要,选用不同筛选自变量的方法(如:逐 步法、向前法、向后法,等)。 一元线性回归方程: y a bx
多元线性回归方程: y b0 b1 x1 ... bn xn
回归的分类: 按是否线性分:线性回归模型和非线性回归 模型。 按自变量个数分:简单的一元回归,多元回 归。 利用SPSS得到模型关系式,是否具有适用性 ,要看回归方程的显著性检验(F检验)和回 归系数b的显著性检验(T检验),还要看拟合 程度R2 (相关系数的平方,一元回归用R square ,多元回归用Adjusted R Square)
一元线性回归方程的检验 回归系数显著性检验: 1.斜率、截距的检验 y a bx 零假设: H0 : a 0; H1 : a 0 t—检验 计算检验统计量样本值 t* 计算显著性概率 P{|t|<t*}=sig 并由此作结论: 2. 回归效果的 R 2 判定系数
R2
( y i y) 2
= ( yi y ) 2
方差分析:利用总平方和分解办法测定自变量与随机 因素引起的差异的大小比较的检验法 : 原假设 H0: 回归系数为零 构造 F 统计量 F=MSA/MSE 计算 F 的样本值 F 计算显著性概率
*
P{F>F*}=sig 并由此作结论:
误差项独立性检验: Durbin-Watson 检验 检验值 D D=2 D>2 D<2 0<D<4 残差与自变量独立 负相关 正相关
3. 多元回归的假设检验: 回归方程的显著性检验: F 检验 原假设: 所有回归系数均为零, 备择假设 : 至少有一个不为零 检验统计量: F=
(y (y
i
i
yi ) 2 /(n p 1)
y) 2 / p
计算统计量的样本值 F* 计算概率: 作结论: 偏回归系数与常数项的显著性检验: 方差齐性检验: 检验残差的分布是否与自变量取值无关 该软件通过绘制残差与自变量的散点图象观察 (因为数据 量不足,一般对自变量的不同取值只采样一次,不足以作方差分析) 残差的正态性检验: 通过残差的直方图以及累积概率 P-P 图来描述(服 从正态分布时,图形在一条斜线附近 P{F>F*}=SIG
回归方程的假设
1.数据正态性假设:误差项的分布与自变量无关,服 从均值0,方差常数的正态分布; 2.方差齐性假设:对不同的自变量取值条件下,误差分 布方差相同; 3.独立性假设:对不同的自变量取值条件下,误差分布 期望为0; 4.无自相关性假设:对不同的自变量取值条件下,误差 不相关; 5.随机误差与自变量对因变量的影响不相关;
第七章 回归分析
第一节 第二节 第三节 第四节 第五节 Linear过程 线性回归 Curve Estimation过程 曲线回归 Logistic过程 罗辑斯谛回归 Probit过程 概率单位回归 Nonlinear过程 非线性回归
回归的主要内容: 从一组样本数据出发,确定这些变量间的定 量关系式; 对这些关系式的可信度进行各种统计检验; 从影响某一变量的诸多变量中,判断哪些变 量的影响显著,哪些不显著; 利用求得的关系式进行预测和控制。
5. 参入分析的观测量的选择: 利用Selection 变量的取 值实现分析中 CASE的选择 6. Statistics 选项设置: R squared Chang : 表示当回归方程中引入或剔除 一个变量后R2的改变量。 7. 共线性诊断:回归方程中,虽然各自变量对因变量 都是有意义的,但是某些自变量可能彼此相关, 即存在共线性问题,因此需要对方程中的自变量 进行共线性诊断。 如果存在常数C0 C1 C2,使C0= C1 X1+C2X2 则称X1,X2具有精确共线性. 如果上式近似成立, 则称近似共线性