当前位置:
文档之家› spss 双变量回归与相关ppt课件
spss 双变量回归与相关ppt课件
Independent Method
Selection Variable
Case Labels WLS Weight
定义回归分析的应变量,只能选一个。在左侧框内单击应变量 名,其前面的小三角符号变成黑色(即被激活),单击选入 定义回归分析的自变量。用法同上 选择自变量的入选方式,默认的是 Enter(即强行进入法)。本 章自变量只有一个,就选择 Enter 法 当只分析某变量符合一定条件的记录时,选入该变量,并用右 侧的 Rule 键建立选择条件。它和我们在分析前利用 Data 菜单中 Select Case 选择记录的功能是一样的 选择一个变量,它的取值将作为每条记录的标签 进行加权最小二乘法的回归分析
Unstandardized
原始残差
Standardized
标准化后的残差,均数为 0,标准差为 1
Studentized Delected
Studentized Delected Prediction Intervals Mean Individual Confidence Interval:
SPSS双变量回归与相关
河北医科大学公共卫生学院 卫生统计学教研组
内容
1
直线回归
2
直线相关与秩相关
3
曲线拟合
2020年6月1日星期一1时20分50秒
(一)直线回归
例1 某地方病研究所调查了8名正常儿童的尿肌酐含量(mmol/24h)如表
1。估计尿肌酐含量(Y)对其年龄(X)的回归方程。
表1 8名正常儿童的年龄(岁)与尿肌酐含量(mmol/24h)
列出 7 个变量名 因变量 标准化残差 调节预测值 学生化剔除残差 标准化预测值 剔除残差 学生化残差 绘制散点图 上一组坐标的变量名 下一组坐标的变量名 输入变量名,作为图形的 X 轴 输入变量名,作为图形的 Y 轴 绘制标准残差图 直方图 正态 P-P 图 绘制出模型中每一个自变量与应变量残差的散点图
2020年6月1日星期一1时20分52秒
2020年6月1日星期一1时20分52秒
操作提示 左侧列表框 DEPENDNT ZRESID ADJPRED SDRESID ZPRED DRESID SRESID Scatter Previous Next X Y Standardized Residual Plots Histogram Normal probability Produces all partial plots
2.统计分析 (1)散点图
2020年6月1日星期一1时20分51秒
2020年6月1日星期一1时20分51秒
2020年6月1日星期一1时20分51秒
2020年6月1日星期一1时20分51秒
(2)直线回归
2020年6月1日星期一1时20分51秒
2020年6月1日星期一1时20分52秒
操作提示 Dependent
Leverage values
Influence Statistics DfBeta(s) Standardized DfBeta(s) DfFit Standardized DfFit Covariance ratio
Save to new file Coefficient statistics Produces all partial plots
2020年6月1日星期一1时20分52秒
2020年6月1日星期一1时20分52秒
操作提示 Predicted Values Unstandardized Standardized Adjusted S.E of mean predictions Residuals
设置预测值选项 应变量原始预测值 标准化后的预测值,预测值的均数为 0,标准差为 1 不考虑当前记录,当前模型对该记录应变量的预测值 预测值的标准差 设置残差选项,用于模型诊断
采用 t 变换产生的残差,即学生化残差 不考虑当前记录,当前模型对该记录应变量的预测值对观察值的 原始残差,即剔除残差,可发现可疑的强影响点 学生化剔除残差 设置预测区间 条件均数的置信区间 个体 y 值的容许区间 设置置信度,默认 95%
2020年6ahalanobis Cook’s
2020年6月1日星期一1时20分52秒
残差的独立性检验
2020年6月1日星期一1时20分52秒
操作提示 Regression Coefficients Estimates
设置回归系数选项
输出回归系数 及其标准误,t 值,P 值,标准化回归系数 ,
Confident Intervals Covariance matrix Model fit
Descriptives Residuals
默认选项 输出回归系数的 95%置信区间 多重回归中输出各个自变量的相关矩阵和方差、协方差矩阵 输出进入、退出模型的变量列表,并给出有关拟合优度的检验: 相关系数 R,决定系数 R2,和调整的 R2,标准误及方差分析表, 默认选项 输出变量的描述统计量,如有效记录数、均数、标准差等。在 多重回归中,还给出一个自变量的相关矩阵 设置残差选项
设置测量数据点离拟合模型的距离指标 马哈拉诺夫距离,所示的是观察值距样本平均值的距离 表示不考虑该记录,模型残差发生的变化。若 Cook’s 距离大于 1, 该记录可能为影响点 杠杆值。测量数据点的影响强度,若值大于 2*P/N(P 为变量数,N 为 样本含量),该记录可能为影响点 设置诊断影响点的统计量选项 Difference in Beta 的缩写,表示不考虑该观察值后回归系数的变化值 标准化的 DfBeta ,当它大于 2/Sqrt(N)时,该点可能是强影响点 Difference in fit value 的缩写,表示不考虑该观察值后预测值的变化值 标准化的 DfFit 值,当它大于 2/Sqrt(N)时,该点可能是强影响点 在多重回归中表示不考虑该观察值后协方差矩阵与含该观察值协方差 矩阵的比率。它的绝对值大于 3*P/N 时,该点可能为强影响点 保存结果到新文件,默认在当前数据集中生成新的变量 可以将新变量存到新的 SPSS 数据文件中 绘制出模型中每一个自变量与应变量残差的散点图
编号 年龄X 尿肌酐含量Y
1
2
3
4
5
6
7
8
13 11 9
6
8 10 12 7
3.54 3.01 3.09 2.48 2.56 3.36 3.18 2.65
2020年6月1日星期一1时20分51秒
1.建立数据文件 取两个变量: X变量(本例为“年龄”)、 Y变量(本例为“尿肌酐含量”)
2020年6月1日星期一1时20分51秒