当前位置:文档之家› spss简单回归与相关

spss简单回归与相关

可编辑ppt 2020/12/6
第七章 简单相关与回归
卫生统计学教研室
1
一、线性相关( linear correlation )
直线相关:又称简单相关(simple correlation),用 于描述两个变量之间的线性相关程度。
经典相关分析要求X与Y都是随机变量,而且服从双 变量正态分布。
相关关系的统计量使人们对变量间的相关关系是否 成立、相关的性质和强弱等有了量化依据。
回归 —— 反映两变量间的依存关系 相关 —— 反映两变量间的相互关系
3.回归系数与原度量单位有关,而相关系数无关
10
相关与回归的区别和联系
联系
1. 同一资料 r 与 b 同号
2. r 与 b 的假设检验等价: tr=tb
3. r 与 b 可互相换算: r b lXX lYY 4. 回归与相关可相互解释
r的正负值表示两变量之间直线相关的方向,即 r>0为正相关, r<0为负相关,r=0为零相关;r与回归系数b的符号相同;
r的绝对值大小表示两变量之间直线相关的密切程度,|r| 越接近于1,说明密切程度越高,|r|越接近于0,说明密切程 度越低。
2020/12/6
可编辑ppt
4
线性相关( linear correlation )
统计预测:给定X值,估计Y;
统计控制(逆估计):要求Y在一定范围内波动,
可通过X的取值来实现。
8
二、线性回归(linear regression)
注意:
可编辑ppt 2020/12/6
• 做直线回归之前,先做散点图,是确定两变量之间是否有关系的最 简单的好方法。
• 回归系数(b)的假设检验 判断直线回归方程是否成立,需要检验总体回归系数β是否为0。
可编辑ppt 2020/12/6
• 定义
用直线方程表达X(自变量,independent variable)
和Y(应变量, dependent variables)之间的数量
关^ 系。 •Y
是Y(实测值)的预测值(predictive value),b是 直
线的斜率,即X每变化一单位,Y相应的变化b个单位。
决定系数
r2
l
2 XY
l
2 XY
l XX SS回 SS总-SS剩
l XX lYY
lYY
SS总
SS总
2020/12/6
可编辑ppt
11
四、相关与回归应用的注意事项
1. 根据分析目的选择变量及统计方法
可编辑ppt 2020/12/6
直线相关用于说明两变量之间直线关系的方向和密切程
度,X与Y 没有主次之分
直线回归则进一步用于定量刻画应变量Y 对自变量X 在数
值上的依存关系,其中应变量的定夺主要依专业要求而定,
可以考虑把易于精确测量的变量作为X,另一个随机变量作Y
例如用身高估计体表面积
两个变量的选择一定要结合专业背景,不能把毫无关联的两
种现象勉强作回归或相关分析
12
可编辑ppt 2020/12/6
Hale Waihona Puke 方法一:t检验 方法二:F检验
t b
Sb
F
MS回归 MS剩余
两种方法等价,
F t
只有当β ≠0,才能认为直线回归方程成立(具有统计学意义)。 9
三、相关与回归的区别和联系
区别
可编辑ppt 2020/12/6
1. 资料: 回归 —— Y为正态随机变量,X为固定的非随机变量
相关 —— X、Y均为随机变量,且服从双变量正态分布 2.意义与应用:
• 等方差 Equal variance
对于任何X值,随机变量Y的标准差 Y|X相等
7
线性回归(linear regression)
可编辑ppt 2020/12/6
• 回归直线的建立主要是基于最小二乘法
(least-squares ,LS),即各实测点与拟合直线之 间纵向距离的平方和最小。
• 线性回归的主要运用:统计预测与统计控制
a为截距,即X为0时Y值的大小。
6
二、线性回归(linear regression)
直线回归的前提假设(LINE)
可编辑ppt 2020/12/6
• 线性 Linearity 反应变量均数 与X间呈线性关系:Y|X= α + X
• 独立 Independence 每一观察值之间彼此独立
• 正态 Normality 对于任何给定的 X:Y均服从正态分布
相关与回归应用的注意事项
2. 进行相关、回归分析前应绘制散点图—第一步
散点图可考察两变量是否有直线趋势 可发现异常点(outlier)
散点图对异常点的识别与处理需要从专业知识和现有数据两方 面来考虑,结果可能是现有回归模型的假设错误需要改变模型形 式,也可能是抽样误差造成的一次偶然结果甚至过失误差。需要 认真核对原始数据并检查其产生过程认定是过失误差,或者通过 重复测定确定是抽样误差造成的偶然结果,才可以谨慎地剔除或13 采用其它估计方法。
计算公式
( X X )(Y Y )
r
( X X )2 (Y Y )2
2020/12/6
X 表示X的平 可编均 辑ppt数,Y表示Y的3平均数。
线性相关( linear correlation )
相关系数的特点:
相关系数r是表示两个随机变量之间直线相关强度和方向的统计 量,是一个无量纲的数值,取值范围-1≤ r ≤ 1;
可编辑ppt 2020/12/6
相关系数的假设检验:
r≠0原因:① 由于抽样误差引起,ρ=0 ② 存在相关关系, ρ≠0
检验方法:① 直接查表法(r界值表),② t 检验;
公式
tr
r 0= Sr
r ,v=n-2 1r2
n2
5
Sr---- 相关系数的标准误
二、线性回归(linear regression)
2020/12/6
可编辑ppt
2
线性相关( linear correlation )
相关系数(correlation coefficient),又称积差相关系数或 Pearson 相关系数(软件中常用此名称)以及spearman 相关系数;
定量描述线性相关程度的一个常用指标,说明相关的密
切程度和方向。
相关与回归应用的注意事项
可编辑ppt 2020/12/6
3. 资料的要求
直线相关分析要求 X与Y 服从双变量正态分布
直线回归要求至少对于每个 X 相应的 Y 要服从正态分 布,X可以是服从正态分布的随机变量也可以是能精确 测量和严格控制的非随机变量
对于双变量正态分布资料,根据研究目的可选择由 X
相关主题