当前位置:
文档之家› SPSS数据分析教程-7-相关性
SPSS数据分析教程-7-相关性
Kendall的tau-b(K)
Kendall的tau系数是另一种计算定序变量之间 或者定序和尺度变量之间相关系数的方法。 Spearman的等级相关系数可以方便检验两个定 序变量是否相关,但是很难具体解释两个变量 如何相关及相关程度。Kendall的等级相关系 数可以同时反映两个变量的相关程度。
相关分析的作用
判断变量之间有无联系 确定相关关系的表现形式及相关分析方法 把握相关关系的方向与密切程度 为进一步采取其他统计方法进行分析提供依据 用来进行预测
散点图
相关散点图是观察两个变量之间关系的一种非 常直观的方法。散点图以横轴表示两个变量中 的一个变量,以纵轴表示另一个变量,将两个 变量之间相对应的变量值以坐标点的形式逐一 标在直角坐标系中,通过点的分布形状、分布 模式和疏密程度来形象描述两个变量之间的相 关关系。
计算相关系数的方法很多,由于我们所面对的 各种变量都具有不同的性质和类型,因此应当 根据变量的特点选择适当的分析相关的方法。 对于不同类型的数据,计算相关系数的方法也 不相同 。
线性相关的度量—尺度数据间的相关 性的度量
Pearson相关系数
Xn ½=
(xi ¡ x¹)(yi ¡ y¹)
i= 1
SPSS的“偏相关”过程计算偏相关系数,该系 数在控制一个或多个附加变量效应的同时描述 两个变量之间的线性关系。
打开health_funding.sav数据文件,选择【分 析】→【相关】→【偏相关】
动手练习
分析数据car_sales.sav中变量汽车销量和汽 车耗油量之间的关系。它们是否有线性相关性? 如果没有线性相关性,二者之间有其它关系吗?
集体项目
SPSS数据分析-第7讲
—《SPSS数据分析教程》
主要内容
相关分析的基本概念 如何绘制各种散点图 三种相关系数的偏相关分析的概念、方法和结
果解释 列联表分析
相关分析的基本概念和散 点图
什ቤተ መጻሕፍቲ ባይዱ是相关分析
相关分析是分析客观事物之间关系的定量分析 方法。许多事物或现象之间总是相互联系的, 并且可以通过一定的数量关系反映出来。
设样本量为n,考察两个变量X和Y之间的相关 关系,X和Y的取值记为xi,yi。所有像(xi,yi) 对的个数为n(n-1)/2。和分别表示和的秩次, 如果对于任意k,有我们称(xk,yk)为同序对; 否则,称为逆序对。
总的同序对的个数记为nc,逆序对的个数记为 nd,则Kendall的Tau系数的定义为:
斯皮尔曼等级相关的适用条件为:
两个变量为定序变量。 一个变量为定序变量,另一个变量为尺度数据,且
两总体不是正态分布,样本容量n不一定大于30。
设D是两个变量每对数据的等级差,n是样本量。
则Spearman相关系数为:
½=
1¡
P 6
n i=
1
D
2 i
n(n2 ¡ 1)
每周看电视的时间和IQ之间的关系,我们用 Spearman等级相关分析二者的相关性。
散点图—旧对话框
car_sales.sav记录了对市面上常见汽车的调 查结果,它包括车的长、宽、净重等物理指标, 同时还有车的厂家、型号、新车售价、发动机、 马力、耗油量等。我们想考察车的耗油量是否 和售价有关系,是否车越省油价格越高呢?
用图表构建程序绘制散点图
相关系数
通过计算相关系数来分析变量之间相互关系的 方法。
Sx Sy
相关系数的数值范围是介于–1与 +1之间:
如果|½| ' 0,表明两个变量没有线性相关关系。
如果|½| ' 1 ,则表示两个变量完全直线相关。线性相关的 方向通过相关系数的符号来表示,“+”号表示正相关,“﹣” 表示负相关。
相关系数为0或接近于0不能说明两个变量之间 没有相关性,它只说明没有线性相关性。不能 排除具有其它非线性关系。
偏相关分析
政府医疗基金的投入和发病率之间存在关系吗? 尽管您可能希望存在一个负相关的关系,但是 它们之间的相关系数表明二者存在显著的正相 关关系,即随着医疗基金的增长,发病率也表 现为增长。不过,对保健提供商的拜访率的控 制,实际上消除了所观察到的正相关。保健基 金和发病率显示为正相关的原因仅仅是,当基 金增长时,更多的人可以获得保健服务,从而 导致医生和医院所报告的病例更多。
比如,教育需求量与居民收入水平之间,科研 投入与科研产出之间,投资额和国民收入等等, 都有着一定的依存关系。
相关关系的种类
相关关系的种类:是否线性
线性相关
正相关 负相关
曲线相关
相关关系的种类:据变量的度量类型
定类变量和定类变量之间的相关 定序变量和定序变量之间的相关 尺度变量和尺度变量之间的相关
H0:|½| =0
car_sales.sav记录了对市面上常见汽车的调 查结果,它包括车的长、宽、净重等物理指标, 同时还有车的厂家、型号、新车售价、发动机、 马力、耗油量等。我们想考察车的耗油量是否 和新车售价有关系,是否车越省油价格越高呢?
选择【分析】→【相关】→【双变量】
Spearman等级相关系数—定序变量之 间的相关性的度量
Pearson 相关系数是一种线性关联度量。如果 两个变量关系密切,但其关系不是线性的,则 Pearson 相关系数就不是适合度量其相关性的 统计量。
SPSS的双变量相关可以计算两个或者两个以 上变量间的协方差和Pearson相关系数。同时 还可以检验该相关系数是否显著区别于0。
设相关系数为½,则SPSS相关系数检验的原假 设为: