当前位置:文档之家› 数据相关分析

数据相关分析


各变量的描述统计量
Correlations Variables 生 长 量 (cm) 生 长 量 (cm) 1 12 月 平均 月 降雨 月 平均 日 气 温 (c) 量 (mm) 照 时数 .983** .709** .704* .000 .010 .011 12 12 12 月 平均 湿度 .374 .232 12
Correlation Significance (2-tailed) df Correlation Significance (2-tailed) df
; T2 u i (u i 1) / 2
其中
1 sgn(z ) 0 1
T1 t i (t i 1) / 2
T0 n(n - 2)/2

ti(或ui)是x(或y)的第i 组结点x(或y)值的数目, n为观测量数。
返回
有关公式:关于相关系数统计意义的检验
有关公式:
Pearson积矩相关
rxy
( x x )( y y )
i 1 i i
n
( xi x ) 2 ( yi y ) 2
i 1 i 1
n
n
Spearman相关系数
θ
( R R )( S S ) ( R R ) (S S )
i i 2 i i
Kendall’s tau-b与Spearman相关系数
返回
§2
偏 相 关 分 析
返回
简单相关分析计算两个变量间的相关系数,分析两个 变量间线性关系的程度,往往因为第三个变量的作用, 使相关系数不能真正反映两个变量间的线性程度。例 如:在研究商品的需求量和价格、消费者收入之间的 关系时会发现,需求量和价格之间的相关关系实际还 包含了消费者收入对商品需求量的影响,同时,收入 对价格也产生了影响,并通过价格变动传递到对商品 需求量的影响中。 偏相关分析的任务就是在研究两个变量之间的线性相 关关系时控制可能对其产生影响的变量。
返回
零假设:总体中两个变量间的偏相关系数为0 Pearson偏相关系数假设检验的t统计量:
t n k 2 r 1 r 2
其中,r是相应的偏相关系数,n是观测量数,k是控制变量 的数目,n-k-2是自由度。当t>t0.05(n-k-2)时,p<0.05拒绝原假 设
偏相关分析的主对话框 analyze correlate partial
当一个或几个相互联系的变量取一定数值时,与之 相对应的另一变量的值虽然不确定,但它仍按某种 规律在一定的范围内变化。 变量间的这种相互关 系,称为具有不确定性的相关关系。
它反映现象之间客观存在的、不严格、不确定的相
互依存关系。这种关系不能通过个别现象体现其关
系的规律性,必须在大量现象中才能体现出来。
零假设:总体中两个变量间的相关系数为0 Pearson和Spearman 相关系数假设检验t值计算公式:
t
n 2 r 1 r2
式中r是相关系数,n是样本观测量数,n-2是自由度。 当t>t0.05(n-2)时,p<0.05拒绝原假设;
返回
两变量间相关分析实例data08-01
C o rr e l a t io n s 城乡居民储 国民收入 蓄存款余额 (亿元) 城乡居民储蓄存款余额 Pearson Correlation 1.000 .976** Sig. (2-tailed) . .000 N 27 27 国民收入(亿元) Pearson Correlation .976** 1.000 Sig. (2-tailed) .000 . N 27 27 **. Correlation is significant at the 0.01 level (2-tailed).
二元变量相关分析主对话框
返回
options输出选择项对话框
返回
1. Pearson简单相关系数 用来度量正态分布的定距变量间的线性相关关系。 2. Spearman相关系数 是非参测度,即根据数据的秩而不是根据实际值计 算的,即,先对原始变量的数据排秩,根据各秩使 用Spearman相关系数公式进行计算。适用于有序数 据或不满足正态分布假设的定距变量。 3. Kendall’s tua-b等级相关系数 也是非参测度,即对两个有序变量或两个秩变量间 的关系程度的测度。
生长量与各变量间Pearson相关分析结果
返回
偏相关分析输出2:
Correlations Control Variables 月 平均 湿度 & 月 降雨 量 (mm) & 月 平 均 气 温 (c) Variables 生 长 量 (cm) 生 长 量 (cm) 1.000 . 0 .632 .068 7 月 平均 日照 时 数 .632 .068 7 1.000 . 0 Correlation Significance (2-tailed) df Correlation Significance (2-tailed) df
三、相关分析的基本方法之一——绘制 散点图 Graphs——> scatterplot
在SPSS中提供了四种散点图,分别是:简单散点
图(Simple)、重叠散点图(Overlay)、矩阵散点图
(Matrix)和三维散点图(3-D)
Data08-01、08-03
四、相关分析的基本方法之二——计算相关系数 analyze correlate bivariate
非参相关矩阵
返回
秩相关实例 data08-02
为某次全国武术女子前10名运动员长拳和长兵器两项得分数据,要求分析这两项 得分是否存在线性关系。
C o rr e l a ti o n s 长拳得分 长兵器得分 Kendall's tau_b 长拳得分 Correlation Coefficient 1.000 .543* Sig. (1-tailed) . .027 N 10 10 长兵器得分 Correlation Coefficient .543* 1.000 Sig. (1-tailed) .027 . N 10 10 Spearman's rho 长拳得分 Correlation Coefficient 1.000 .610* Sig. (1-tailed) . .030 N 10 10 长兵器得分 Correlation Coefficient .610* 1.000 Sig. (1-tailed) .030 . N 10 10 *. Correlation is significant at the .05 level (1-tailed).
月 平均 湿 度
Correlation Significance (2-tailed) df Correlation Significance (2-tailed) df
Correlations Control Variables 月 平 均 日 照 时 数 & 月 平 生 长 量 (cm) 均 湿 度 & 月 降 雨 量 (mm) 月 平 均 气 温 (c) 生 长 量 (cm) 1.000 . 0 .977 .000 7 月 平 均 气 温 (c) .977 .000 7 1.000 . 0
月 平均 日照 时 数
Correlations Control Variables 月 平均 日 照时 数 & 月 平 均 气 温 (c) & 月 降 雨 量 (mm) 生 长 量 (cm) 1.000 . 0 .731 .025 7 月 平均 湿 度 .731 .025 7 1.000 . 0
生 长 量 (cm)
数据相关分析
Correlations
§1 相关分析的概念与相关分析过程
返回
一、函数关系与相关关系
反映现象之间存在着严格的依存关系,即当一个 或几个变量取一定的值时,另一个变量有确定值
与之相对应,这种关系为确定性的函数关系。
例如,圆周长L与圆半径r之间存在严格的确定性 关系,因而两者为函数关系,即 L 2r 。
安徽省国民收入与城乡居民存款余额的相关分析 (使用默认参数)
返回
秩相关实例data02-01 salary salbegin with jobcat educ
各雇员的职务等级(jobcat)、受教育程度(Educ)与当 前工资、起始工资间的关系。Educ数值数小于24(options 对话框中定义的),因此标为Ordinal属于有序分类变量。
例如,身高与体重的关系。
二、相关分析与回归分析
是研究现象之间相关关系的两种基本方法。
相关分析是用一个指标来表明现象间相互依存关
系的密切程度。
回归分析是根据相关关系的具体形态,选择一个
合适的数学模型,来近似地表达变量间的平均变
化关系。
相关分析和回归分析有着密切的联系 相关分析需要依靠回归分析来表明现象数量相关的 具体形式。 回归分析则需要依靠相关分析来表明现象数量变化 的相关程度。只有当变量之间存在高度相关时,进 行回归分析寻求其相关的具体形式才有意义。
Pearson Correlation Sig. (2-tailed) N
**. Correlation is significant at the 0.01 level (2-tailed). *. Correlation is significant at the 0.05 level (2-tailed).
2
式中Ri是第i个 分别是Ri和Si的平均值。
返回
有关公式:
Kendall’s tau-b : τ
sgn(x
i j
i
x j ) sgn(y i y j )
(T0 T1 )(T0 T2 )
if z 0 if z 0 if z 0
相关主题