SPSS相关分析ppt课件
• 样本相关系数接近零并不意味着两个变量间一定 无相关性;
• 一个变量的值人为选定时莫作相关分析
• 出现异常值时慎作相关分析
• 相关未必真有内在联系
• 相关分析时,小样本资料经检验只能推断两变量 间有无直线关系,而不能推断其相关的密切程度 。要推断两变量间相关的程度,样本含量必须足 够大。尤应注意,若两变量间相关系数具有统计 学意义,但较小时,下结论要慎重。
• 两事物之间的非一一对应关系,即一个变量的取 值不能由另一个变量唯一确定;
• 当变量 x 取某个值时,变量 y 的取值可能有几 个;
• 各观测点分布在直线或曲线周围 。 • 现象之间客观存在的不严格、不确定的数量依存
关系。变量间关系不能用函数关系精确表达。
相关(统计)关系的例子 商品的消费量(y)与居民收入(x)之间的关系 商品销售额(y)与广告费支出(x)之间的关系 粮食亩产量(y)与施肥量(x1) 、降雨量(x2) 、温度(x3)
函数关系
• 是一一对应的确定关系。 • 设有两个变量 x 和 y ,变量 y 随变量 x 一起变
化,并完全依赖于 x 。当变量 x 取某个数值时, y 依确定的关系取相应的值,则称 y 是 x 的函 数,记为 y = f (x) 。 • 如: –销售额与销售量; –圆面积和圆半径
相关(统计)关系
关程度的强弱. (例如: 投资与收入之间的关系、 商品销售额与广告费支出之间的数量关系) • 基本方法:
绘制散点图、计算相关系数
二、 绘制散点图
(一)散点图
在平面直角坐标系上将两个变量间相对应 的变量值用坐标点的形式描绘出来,用来反映 两变量之间相关关系的图形,又称相关图。 • 用途: • 在进行定量分析之前,可以先利用它对现象之 间相关的方向、形式和密切程度作大致的判断。
(四)Spearman等级相关 • 变量间的秩相关
完全相关
Y (X,Y)
2020/6/11
X
10
Y 100
80
60
40
20
不相关
成绩
0
30
40
50
60
70
80
90
2020/6/11 体重
X
11
180
线性正相关
Y
170
160
身高
150
30
40
50
60
70
80
90
2020/6/11 体重
X 12
100
Y
80
60
40
20
成绩
0
200
300
2020/6/11 支出
➢ 相关系数只度量变量间的线性关系,因此,微弱相 关不一定表明变量间没有关系;
➢ 极端值可能影响相关系数。例如,(1,1),(2,2), (3,3),(4,4),(5,5),(6,1), r=0.33,但总体上表现出: x=y 。
➢ 警惕伪相关(只是数据上计算有相关关系,其实没 有实际意义)。
2020/6/11
|r|>0.8 存在高度相关;
0.5 |r|<0.8 显著相关;
0.3 |r|<0.5 低度相关;
|r|<0.3 关系极弱,认为微相关
完全负相关
无线性相关
完全正相关
-1.0 -0.5 0 +0.5 +1.0
r
负相关程度增加 正相关程度增加
2020/6/11
19
使用相关系数时应注意的问题:
➢ 相关关系不等于因果关系;
• (三)Pearson简单相关系数 – 度量定距变量间的相关关系。例如,收入和储蓄、 身高和体重等。 – x与y的相关系数等同于y与x的相关系数。 – 简单相关系数是无量纲的。 – 度量两变量之间的线性关系。
n
(Xi X )(Yi Y )
r
i1
n
n
(Xi X )2 (Yi Y )2
i1
i1
非线性相关
400
500
600
700
X
13
身高
散
点
图
体重
矩
阵
成绩
2020/6/11
支出
14
三维散点图
180
170
身高
160
90
80
70 60
体重
50
40
20
40
60 80
成绩
100 120
2020/6/11
15
(二)SPSS操作
(1)菜单选项:图形->散点 (2)选择散点图类型:简单(simple)、重叠
之间的关系 收入水平(y)与受教育程度(x)之间的关系 父亲身高(y)与子女身高(x)之间的关系
• 相关关系的常见类型: 线性相关:正线性相关、负线性相关 非线性Βιβλιοθήκη 关: 二次曲线相关、指数曲线相关等
• 相关关系不象函数关系那样直接,但却普遍存在,且 有强有弱.
• 如何测度?
2、相关分析
• 目的: 通过样本数据,研究两变量间线性相关方向和相
第五章 相关分析
主要内容
• 1、 相关分析 • 2、 绘制散点图 • 3 、计算相关系数 • 4、 偏相关分析 • 5、距离分析
一、相关分析
• 1、相关关系和函数关系 • 社会经济现象中,一些现象与另一些现象之间
往往存在着依存关系,当我们用变量来反映这 些现象的的特征时,便表现为变量之间的依存 关系。 • 现象之间的相互关系,可以概括为两种不同的 类型: ➢ 函数关系 ➢ 相关关系(统计关系)
(overlay)、矩阵(matrix)、三维(3-D)散 点图。 (3)选择x轴和y轴的变量 (4)选择分组变量(set markers by):分别以不同颜 色表示 (5)选择标记变量(label case by): 散点图上可带 有标记变量的值(如:省份名称)
三、 相关系数
• (一)概述 • 作用:
–相关系数(r)以数值的方式精确地体现两 个变量间的线性关系程度.
• 分析步骤: 1.计算样本相关系数 r; 2.相关系数检验,即对样本来自的两总体是 否存在显著的线性关系进行推断。
• 如果变量Y与X间是函数关系,则r=1或r=-1;如果 变量Y与X间是统计关系,则-1<r<1, 如果x,y变 化的方向一致,如身高与体重的关系,则称为正 相关,r>0,如果x,y变化的方向相反,如吸烟与 肺功能的关系,则称为负相关,r<0; 而r=0表 示无线性相关,一般地,
20
说明: ✓ 相关系数只是有效地度量两变量间的线性相关
程度,但它并不是度量非线性关系的有效工具. ✓ 数据中存在极端值时,用相关系数度量不好
如:(1,1)(2,2)(3,3),(4,4),(5,5),(6,1) r=0.33 但总体上表现出: x=y ✓ 因此,相关系数应结合散点图分析。
(二)相关系数的种类 • Pearson简单(积差)相关系数 • Spearman等级相关系数 • Kendall 和谐相关系数