当前位置:文档之家› 第8章 相关分析

第8章 相关分析

第8章 相关分析
相关分析(Correlations)是研究两个变量间。

或一个变量与多个变量间,或多个变量两两
变量间,或两组变量间,或多个变量组与组之间密切程度的一种常用统计学方法。

变量间的密切程度常用相关系数(Correlation Coefficients)或统计量描述。

SAS /Win(v8)系统非编程有如下5种相关量度(Correlation Measure)。

(1)Pearson product-moment correlation ,皮尔逊积矩相关分析。

(2)Spearman coefficients ,斯皮尔曼相关系数s r
(3)Cronbach ’coefficient alpha ,克龙巴哈系数α
(4)Kendall ’s tan –b coefficient ,肯德尔b τ系数。

(5)Hoeffding ’s D statistic ,霍夫丁D 统计量。

同时将输出变量的简单统计量(Simple Statistics),相关系数(Correlation Coefficients),相
应的P 值与图形(P1ots)等。

8-1皮尔逊积矩相关分析
[例8-1] 已知5-6岁儿童体检数据的指标为编号(1x ),性别(2x ),月龄(3x ),体重(4x ,
kg),身高(5x ,cm),坐高(6x ,cm),胸围(7x ,cm),头围(8x ,cm),左眼视力(9x )与右眼视力(10x ),并已建立SAS 数据集SASUSER.child 。

试对体重(4x )与身高(5x )做皮尔逊(Pearson)相关分析。

(1)进入SAS /Win(V8)系统,单击So1utions->Analysis->Analyst ,进入分析家窗口。

(2)单击File->open By SAS Name->Sasuser->Child->OK ,调入SAS 数据集
SASUSER.child
(3)单击statistics->Descriptive->correlations ,得到图8-1所示对话框。

本例相关分析的变
量为4x ,5x 。

拖曳待选变量4x ,5x 到Correlate(相关变量)框。

图8-l Correlations :Child(相关分析)对话框
图8-1的右下方有如下5个备选项。

Options ,选择项。

Plots ,图形。

Save Data ,保存数据。

Titles ,标题。

Variables ,变量。

(1) 单击OK->Options ,得到图8-2所示对话框。

图8-2 Correlations:Options(选择项)对话框
在Correlations: Options对话框中有如下选项区
Correlation types, 相关分析类型。

Pearson, 皮尔逊积矩相关分析
r
Spearman, 斯皮尔曼相关系数
s
Cronbach's alpha, 克龙巴哈系数α。

τ系数
Kendall's tau-b, 肯德尔
b
Hoeffding's D, 霍夫丁D统计量‘
Pearson options, 皮尔逊积矩相关分析。

Covariances, 协方差
CSSCP matrix, 经均数校正的平方和及交叉积矩阵。

SSCP matrix, 平方和及交叉积矩阵。

)
Print, 打印(显示)
P-values, P值
Descriptive statistics, 描述性统计量
Correlation format, 相关分析结果的输出格式
Rectangular table, 长方形表。

Highest to lowest, 从高到低的格式
Exclude missing values, 剔除缺失值
Pairwise, 配对剔除
Listwise, 串列剔除
(5)单击OK按钮,返回图8-1所示对话框。

单击P1ots按钮,得到图8-3所示对话框。

在图8-3中可以进行如下设置。

Types of plots,图形的类型。

Scatter plots,散点图。

Add confidence ellipses,对散点图加置信椭圆。

Confidence ellipses options,置信椭圆。

Probability value:0.95,概率值(用户可任选)。

图8-3 Correlations:P1ots(图形)对话框
(6)单击OK按钮,返回图8-1所示对话框。

单击Save Data按钮,得到图8-4所示对话框。

在Correlations data set (相关分析数据集的保存)选项区可进行如下设置。

Save correlations,保存相关分析结果。

Add correlations,加相关系数。

Add covariance,加协方差。

6
Add sum of squares &products,加平方和与交叉积。

图8-4 Correlations:Save Data(保存数据)对话框
(7)单击OK按钮,返回图8-1所示对话框,单击Titles按钮,得到图8-5所示对话框。

Titles(标题)对话框有如下3个标签(本例未选择)。

Global,全局性的标题
Correlations,相关分析的标题。

Settings,设置标题。

图8-5 Titles(标题)对话框
(8)单击OK按钮,返回图8-1所示对话框。

单击V ariables按钮,得到图8-6所示对话框。

在Correlations:Variables对话框可进行如下设置(本例未选择)。

Weight,权重。

Frequency ,频数。

By Group ,按组分。

Partial ,偏相关分析变量。

图8-6 Correlations :Variables(变量)对话框
(9)单击OK 按钮,返回图8-1所示对话框。

单击OK 按钮,得到如下数值结果。

图形结果 如图8-7所示。

(10)由于在图8-2中选择了长方形相关分析表因此得到图8-8所示结果
结果分析与讨论
(1)本例的皮尔逊相关系数r =0.8261318097,P <0.0001。

相关有显著性意义。

(2)带置信椭圆的散点图(见图8-7,置信度为95%)表明,大部分散点落在椭圆内,或落在边界线上,只有2个散点在椭圆之外。

(3)如果在图8-6的By Group(按组分)选择性别1x (1x =1为男孩,2x =2为女孩),而其余选择同上,可以得到图8-9所示结果。

可见,体重与身高男孩的相关系数1r =0.8643091327大于女孩的相关系数2r =0.798621605。

图8-9 长方形相关分析表(1x =1为男孩,2x =2为女孩)。

相关主题