第八次作业 第三组1
2.点击“分析”、“回 归”、“线性”,出现如 图界面; 3.由题意选定 自变量和应变 量。
因为是一元线性 回归,所以方法 直接是进入。
4.统计量我们 默认系统: “估计”及 “模型拟合度” 点击“继续” 点击“确定”
检验残差项间 是否存在自我 相关
“ZPRED”为标准
化的预测值; “ZRESID”为删 除后的标准化残 差值。 标准化残差值方 框中有直方图和 正态概率图两个 选项,用来检核 残差值是否呈正 态分布。
回归分析的spsห้องสมุดไป่ตู้过程
目 录
一元线性回归分析
多元线性回归分析
线性回归
线性回归分析(Linear Regression)是研究一个因 变量和一个或多个自变量之间是否存在某种线性关 系的统计学方法。如果参与回归分析的自变量只有 一个,就是一元线性回归分析。如果参与回归分析 的变量有多个,则是多元线性回归。
壹
一元线性回归分析
建立一元线性回归模型的步骤:
I. 根据数据资料作散点图,直观判断两变量之间是 否大致成一种直线关系 II.设直线方程Y=α+βX III.选用平均数法或最小二乘法,或其他方法用实 际数据计算α和β的值。 IV.将α、β的值代入表达式,得到回归方程。
一元线性回归方程的有效性检验: (1)回归方程的显著性检验 F检验 (2)回归方程的拟合优度 判定系数R2 性的线性关系
5.结果分析 由表三可知:F对应的P值等于 0.005,小于0.05,所以,我 们认为回归模型的建立是显著 的,可以用期中成绩预测期末 考试成绩; 由表四可知:t对应的P值等于 0.005,小于0.05,所以我们 认为回归系数0.415是显著的, 可以用期中成绩预测期末考试 成绩;
我们对残差进 行了统计。
表3 输入/移去变量表, 显示了回归方程的方法以及变量被剔 除或引用的信息。从表中可以看出, 模型最先引入变量x3。
表4 模型汇总,该表显示了各模型的 拟合度情况。从表中可以看出,模型 1的复相关系数为0.809,判定系数为 0.655,调整判定系数为0.630,估计 值的标准误差为3.98861.自变量解释 了整个因变量变异程度的63.0%。
例: 某研究所10名学生研习某教授的高级统计课 程,期中与期末考试成绩如下;请问该教授 是否可以利用期中考试成绩来预测期末考试 成绩?
绘图,可以分析数据资料的正态性、线性和 差齐性,还可以检测奇异值。 DEPENDENT 因变量 *ZPRED 标准化预测值,y * ZRESID 标准化残差
1.建库;
表5 方差分析表 ,模型1 Regression的F统计量的观察值为26.572,概率P 值为0.000,在显著性水平为0.05的情形下,可以认为y与x2和x3之间有线性 关系。 表6 线性回归系数列表,根据模型建立的多元线性回归方程为: y=8.217+1.594x2+0.809x3
表7 以排除的变量, 可见模型2方程外的各变量偏回 归系数经重检验,概率P值分别 为0.520和0.784,均大于给定的 显著性水平,故不能引入方程。 表8 共线性判断 。
表9 回归模型的残差统计量,标 准化残差的绝对值大于1.869, 没有超过3。
谢 谢
贰
多元线性回归分析
例: 某研究机构为研究儿童智力状况,调查了16所小学的
平均语言测试得分(y)与家庭经济状况指标(x1)、 教师语言测试得分(x2)与母亲教育水平(x3)的数 据。试进行多元线性回归分析。
表1 描述性统计量表,该表显 示各变量的均值、标准差和例数。 表2 相关性, 该表显示了各变 量间的Pearson相关系数和显著 性检验单侧概率P值。例、x3与y 的相关系数为0.809 ,单侧概率 P为0.000。x1与x2的相关系数为 0.524,x1与x3的相关系数为 0.693,x2与x3的相关系数为 0.382,都小于0.7,x1,x2,x3之 间不存在多重共线。
回归方程是否有效 X与Y之间是否存在显著
方差分析虽然可以告诉我们回归方程是否有效,但不能告诉有效性的大小。 所以我们还需要一个能够判定回归方程有效性大小的系数R2。
残差分析
残差是指由回归方程计算所得的预测值与实际样本之间的差距。如 果回归方程能较好地反映被解释变量的特征和变化规律,则残差中 应该不包含明显的规律性和趋势性。 1、检查残差序列是否独立。Durbin-Watson 检验法。DW统计量的 取值范围在0~4之间。当DW>2,认为两残差之间为正相关;当DW<2, 负相关;当DW近似为2时,才认为两残差之间是相互独立的。 2、残差的正态性检验可以通过P-P图来检验。