当前位置:
文档之家› 利用SPSS进行相关分析第八章
利用SPSS进行相关分析第八章
多元统计分析
多元统计分析
因p=0.000<a(0.01) 故拒绝原假设,即拒绝零相关
X1猪(毛重)生产价格指数 Y1肉猪出栏头数(万头)
因相关系数为0.906,意味着两者存在较强的相关性。
多元统计分析
四、偏相关分析
4.1 偏相关分析和偏相关系数 (1)简单相关系数研究两变量间线性相关性,若还存在其
舒张压Y3
85 80 90 92 85 80
多元统计分析
年龄 X1
31 34 36 38 41 46 47 48 45
体重 X 2
120 124 128 124 135 143 141 139 140
抽烟量 X 3
18 25 25 23 40 45 48 50 55
胸围 X 4
87.8 84.6 88.0 85.6 86.3 84.8 87.9 81.6 88.0
系数和Kendall 相关系数等。
1.Pearson简单相关系数(适用于两个变量都是数值型的数
据)
R xy
n
(
xi
x)(
y i
y)
i 1
n
2n
2
( xi x)
i 1
i 1
(
y
i
y)
Pearson简单相关系数的检验统计量为:
t r n 2 ~ t(n 2) 1 r2
多元统计分析
Kendall 相关系数
(U V ) 2
n(n 1) U 一致对数目,V 非一致对数目.
在小样本下,Kendall相关系数服从Kendall分布;在 大样本下, Kendall相关系数的检验统计量为Z统计量,定
义为: Z 9n(n 1)
2(2n 5)
多元统计分析
2. Spearman等级相关系数
①Spearman等级相关系数用来度量定序变量间的线性相关关系,
②设计思想与Pearson简单相关系数相同,只是数据为非定距的,
故计算时并不直接采用原始数据 (xi , yi ) ,而是利用数据的秩, 用两变量的秩 (Ui ,Vi ) 代替 (xi , yi ) 代入Pearson简单相关系数
利用SPSS绘制散点图 【图形(Graps)】 【旧对话框)】
【散点/点状(Scatter)】
多元统计分析
简单散点图 ①表示一对变量间统计关系的散 点图,点击定义。 ②将纵轴变量选入【Y 轴】, ③将横轴变量选入【X轴】, ④将分组变量选入【设置标记】: 用该变量分组,并在一张图上用 不同颜色绘制若干个散点图。 ⑤将标记变量选入【标注个案】: 将标记变量的各变量值标记在散 点图相应点的旁边。
个变量的取值来估计另一个变量的取值,这就是回归分析。 绘制散点图和计算相关系数是相关分析最常用的工具,它
们的相互结合能够达到较为理想的分析效果。
多元统计分析
二、绘制散点图
2.1 散点图的特点 散点图:是将数据以点的形式画在直角坐标系上,通过观
察散点图能够直观的发现变量间的相关关系及它们的强弱程度和 方向。
1. 按“文件—>新建—>语法”(File→New→Syntax)的 顺序新建一个语句窗口。在语句窗口中输入下面的语句:
INCLUDE 'SPSS所在路径\Canonical correlation.sps'. CANCORR SET1=x1 x2 x3 x4 / SET2=y1 y2 y3 / .
多元统计分析
多元统计分析
多元统计分析
多元统计分析
五、典型相关分析
例8-1(补充) 现测量15名受试者的身体形态以及健康情况 指标,如8.1表。第一组是身体形态变量,有年龄、体重、胸 围和日抽烟量;第二组是健康状况变量,有脉搏、收缩压和舒 张压。试求测量身体形态以及健康状况这两组变量之间的关系。
④|r|>0.8表示两变量有较强的线性关系; |r|<0.3表示两变 量之间的线性关系较弱
多元统计分析
2.对样本来自的两总体是否存在显著的线性关系进行推断
由于存在随机抽样和样本数量较少等原因,通常样本相关系 数不能直接用来说明样本来自的总体是否具有显著的线性相关性, 而需要通过假设检验的方式对样本来自的总体是否存在显著的线 性相关关系进行统计推断。基本步骤是:
量,定义为 Z r n 1
Z统计量近似服从标准正态分布。
多元统计分析
3.Kendall 相关系数
(1)用非参数检验方法度量定序变量间的线性相关关系 (2)利用变量秩数据计算一致对数目和非一致对数目。
①当两个变量具有较强的正相关关系,则一致对数目较大,非 一致对数目较小, ②当两个变量具有较强的负相关关系,则一致对数目较小,非 一致对数目较大, ③当两个变量相关性较弱,则一致对数目和非一致对数目大致 相等,
完全正相关 y
x
r=0.7~0.8
正相关
y
x
r=0
无相关 y
x
r=-1
完全负相关
x
r=-0.7 ~ -0.8
负相关
x
r=0
无相关
多元统计分析
2.2 散点图应用举例 例8-3为了分析影响生猪养殖的原因,我们选取以下代表生猪生 产的主要指标:Y1肉猪出栏头数(万头)、Y2生猪年底存栏头 数(万头)、Y3猪肉产量(万吨)、Y4出口活猪数量(万头)。 对生猪生产有影响的指标有:X1猪(毛重)生产价格指数 (1977年为100)、X2粮食产量(万吨)、X3粮食零售价格指 数(1977=100)、X4农村居民人均纯收入(元)、X5乡村总人口 数(万人)、X6全国人均猪肉消费量(斤)。
Z统计量近似服从标准正态分布。
多元统计分析
3.3 计算相关系数的应用举例
对于例8-3,为了研究X组变量与Y组变量之间的相关关系, 先采用计算相关系数的方法。由于这两组变量为定距变量,故采 用Pearson相关系数。 【分析(Analyze)】 【相关(correlate)】 【两变量 (bivariate)】
他因素影响,其往往夸大变量间的相关性,不是两变量间线性相 关强弱的真实体现。
例如,研究商品的需求量、价格和消费者收入之间的线性关 系时,需求量和价格的相关关系实际还包含了消费者收入对价格 和商品需求量的影响。此时,单纯利用简单相关系数来评价变量 间的相关性是不准确的,需要在剔除其他相关因素影响的条件下 计算变量间的相关,偏相关的意义就在于此。
i 1
i 1
②如果两变量的正相关性较弱,它们秩的变化 Di2 (Ui Vi )2 的值较大,r趋向于0;
i 1
i 1
③小样本下,在零假设成立时, Spearman等级相关系数服从
Spearman分布;
④在大样本下, Spearman等级相关系数的检验统计量为Z统计
多元统计分析
利用SPSS进行相关分析 (Correlations)
多元统计分析
一、 相关分析概述
1.1 统计关系与函数关系 客观事物之间的关系大致可分为两大类关系:
(1)函数关系:当一个或几个变量取一定的值时,另一个 变量有确定值与之相对应,我们称这种关系为确定性的函数关系。
(2)统计关系:两事物之间的一种非一一对应的关系,即 当一个变量x取一定值时,另一变量y无法依确定的函数取唯一确 定的值。
计算公式
③于是其中的 xi 和 yi 的取值范围被限制在1和n之间,且可被简
化为:
r
1
6 n(n2
Di2 ,其中 n
1)
i1
Di2
n i1
(Ui
Vi )2
多元统计分析
①如果两变量的正相关性较强,它们秩的变化具有同步性,于
n
n
是 Di2 (Ui Vi )2 的值较小,r趋向于1;
脉搏 Y1
68 70 75 72 76 80 82 85 88
收缩压 Y2
135 135 140 145 148 145 148 150 160
舒张压 Y3
75 75 80 86 88 90 92 95 95
多元统计分析
(一)操作步骤 在SPSS中没有提供典型相关分析的专门菜单项,要想利用
SPSS实现典型相关分析,必须在语句窗口中调用SPSS的 Canonical correlation.sps 宏。具体方法如下:
多元统计分析
1.3 正线性相关与负线性相关 线性相关可以分为: (1)正线性相关:两个变量线性的相随变动方向相同。 (2)负线性相关:两个变量线性的相随变动方向相反。
1.4 相关分析与回归分析 如果仅仅研究变量之间的相互关系的密切程度和变化趋势,
并用适当的统计指标描述。这就是相关分析。 如果要把变量间相互关系用函数表达出来,用一个或多
多元统计分析
(3)偏相关分析也称净相关分析,它在控制其他变量线性 影响的条件下分析两变量间的线性关系,所采用的工具是偏相关 系数。
(4)控制变量个数为1时,偏相关系数称一阶偏相关;当控 制两个变量时,偏相关系数称为二阶偏相关;当控制变量的个数 为0时,偏相关系数称为零阶偏相关,也就是简单相关系数。
在实际分析中,散点图经常表现出某些特定的形式。如绝大 多数的数据类似于“橄榄球”的形状,或集中形成一根“棒状”, 而剩余的少数数据点则零散地分布在四周。通常“橄榄球”和 “棒状”代表了数据对的主要结构和特征,可以利用曲线将这种 主要结构的轮廓描绘出来,是数据的主要特征更突出。
多元统计分析
y
y
r=1
多元统计分析
偏相关系数的分析步骤
(1)计算样本的偏相关系数 假设有三个变量y、x1和x2,在分析x1和y之间的净相关
时,需控制x2的线性作用,则x1和y之间的一阶偏相关定义为: