第10章相关分析 (225)1 双变量相关分析 (225)1.1 双变量相关分析的数据特征 (225)1.2 皮尔逊相关系数 (225)1.3 肯德尔相关系数 (228)1.4 例题3 (230)2 偏相关关系 (232)2.1 偏相关关系 (232)2.2 例题 (232)3 距离相关分析 (234)3.1 特征 (234)3.2 主要参数 (235)3.3 例题 (235)3.4 实例介绍 (237)第10章相关分析相关分析是研究变量之间关系密切程度的一种统计方法,包括双变量相关分析、偏相关分析和距离相关分析。
1 双变量相关分析1.1 双变量相关分析的数据特征当某一个事物存在着多个变量时,而各个变量之间呈数量关系时,可以用双变量相关分析来研究,并做出统计学推断。
双变量相关分析可以输出两两变量之间的相关系数,相关系数的种类有皮尔逊相关系数、肯德尔相关系数、斯皮尔曼等级相关系数等。
1.2 皮尔逊相关系数X和Y有线性函数关系,两变量间的相关系数是+1~-1,相关系数没有单位。
1.2.1 例题133名产妇进行产前检查,测定X1-X6六项指标,试计算X1-X4的皮尔逊相关系数。
1.2.2 SPSS过程Data,analyze,correlate,打开bivariate对话框,选择x1-x4→variables,选择pearson 相关系数,two-tail,flag significant correlations,打开options对话框,means and standard deviations,exclude case pairwirs,continue,ok.two-tail,双尾检验;Flag significant correlations:用星号显示有显著性相关的相关系数;Exclude case pairwirs:剔除有缺失值的配对变量;Cross-product deviations and covarances:显示每一对变量的离均差交叉积与协方差。
22533名产妇6项形态指标(只列出部分数据)X1 X2 X3 X4 X5 X623.00 27.00 17.00 8.50 9.30 1.4024.00 25.00 18.00 8.00 9.30 2.5521.00 23.00 16.50 7.00 8.70 2.6024.00 27.00 18.00 8.00 11.30 2.6023.00 26.00 18.00 6.50 10.70 2.6524.00 27.00 19.00 9.00 11.00 2.7024.00 25.00 17.50 7.00 9.30 2.7023.00 25.00 17.00 6.00 8.30 2.7524.00 26.00 17.00 8.00 8.70 2.8024.00 25.00 18.00 8.00 10.20 2.8022.00 24.00 17.50 7.00 10.70 2.90 1.2.3 SPSS主要对话框1.2.4 运行结果和分析226Descriptive StatisticsMean Std. Deviation NX1 23.6515 1.2021 33X2 25.9394 1.3155 33X3 17.5909 0.9799 33X4 7.8485 0.6433 33CorrelationsX1 X2 X3 X4X1 Pearson 1.000 0.796** 0.684** 0.283Sig. . 0.000 0.000 0.110Sum 46.242 40.303 25.795 7.008Covariance 1.445 1.259 0.806 0.219N 33 33 33 33X2 Pearson 0.796** 1.000 0.617** 0.441*Sig. 0.000 . 0.000 0.010Sum 55.379 25.432 11.947Covariance 1.259 1.731 0.795 0.373N 33 33 33 33X3 Pearson 0.684** 0.617** 1.000 0.171Sig. (2-tailed) 0.000 0.000 . 0.341Sum 25.795 25.432 30.727 3.455Covariance 0.806 0.795 0.960 0.108N 33 33 33 33X4 Pearson 0.283 0.441* 0.171 1.000S ig. (2-tailed) 0.110 .010 0.341 .Sum 7.008 11.947 3.455 13.242Covariance 0.219 0.373 0.108 0.414N 33 33 33 33** Correlation is significant at the 0.01 level (2-tailed).* Correlation is significant at the 0.05 level (2-tailed).上述第一个表是相关分析变量的描述统计量。
第二个表是描述两两变量之间的3个统计量,1,皮尔逊相关系数,2,双尾T检验227结果,3,观测量数。
1.3 肯德尔相关系数1.3.1 特征肯德尔相关系数是一种非参数测度,它是根据数据的秩,而不是根据实际数据计算的。
例如,不能计算宗教信仰与颜色之间的相关系数。
当资料不服从双变量正态分布或总体分布型未知或原始资料是用等级表示时易用肯德尔相关系数进行分析。
1.3.2 例题一些环状化合物的分子量与用药后大白鼠24小时胆汁排泄量。
试问分子量与大白鼠胆汁排泄量有无相关关系。
1.3.3 SPSS过程data大鼠胆汁排泄,Analyze,correlate,bivariate,选择value,excrete→variables,选择pearson,two-tail,flag significant correlations, 再选择Kendall's tau-b,open options 对话框,选择means and standard deviations, cross-product deviations and covarances,缺失值处理采用exclude case pairwirs,continue,ok。
1.3.4 结果和结果分析相关分析变量的描述统计量(Descriptive Statistics)228Mean Std. Deviation N分子量287.60 126.60 10排泄量64.70 34.08 10结果分析,9-3是;9-4,皮尔逊相关系数分析结果;肯德尔等级相关系数,tau-b=0.539,p<0.05。
说明value和excrete有等级相关关系。
皮尔逊相关系数(Correlations)分子量排泄量分子量Pearson 1.000 0.726Sig. . 0.017Sum 144256.40 28201.800Covariance 16028.489 3133.533N 10 10排泄量Pearson 0.726 1.000Sig. 0.017 .Sum of 28201.80 10452.10Covariance 3133.533 1161.344肯德尔等级相关系数(Correlations)分子量排泄量Kendall's tau_b 分子量Correlation 1.000 0.539*Sig. . 0.031N 10 10排泄量Correlation 0.539* 1.000Sig. 0.031 .2291.4 例题31.4.1 数据营养状况评价资料116名儿童的副食品供应与营养状况评价资料,试问副食品供应与营养状况有无相关关系。
副食品供应与营养状况评价资料见下表。
appraisefoodbad normal goodmuch 4 20 6little 7 38 411.4.2 SPSS数据food appraise frequence1.00 1.00 4.001.002.00 20.001.00 3.00 6.002.00 1.00 7.002.00 2.00 38.002.003.00 41.001.4.3 主要对话框data 营养状况评价,data,weight cases,打开加权对话框选择count→frequency,ok。
1.4.4 data 营养状况评价Analyze,correlate,bivariate,food,appraise→variables。
选择Kendall's tau-b/two-tail,230Spearman's rho,选择flag significant correlations。
open options对话框,选择means and standard deviations和cross-product deviations and covarancs,exclude case pairwise,continue ok。
1.4.5 SPSS结果Correlationsfood 评价Kendall's tau_b food Correlation Coefficient 1.000 0.229*Sig. (2-tailed) . 0.011N 116 116评价Correlation Coefficient 0.229* 1.000Sig. (2-tailed) 0.011 .N 116 116Spearman's rho food Correlation Coefficient 1.000 0.237*Sig. (2-tailed) . 0.010N 116 116评价Correlation Coefficient 0.237* 1.000Sig. (2-tailed) 0.010 .N 116 116* Correlation is significant at the0.05 level (2-tailed).结果分析,肯德尔等级相关系数,tau-b=0.229,p<0.05。
说明食品供应与营养状况有相关关系。
2312 偏相关关系2.1 偏相关关系用于计算在控制其他变量情况下,两变量之间的线性关系的偏相关系数,此模块还计算零阶相关系数(即简单相关系数,皮尔逊相关系数)矩阵,以及矩阵所产生的偏相关系数、自由度和显著性。
2.2 例题(1)data partial调查29名儿童身高(X1),体重(X2)和肺活量(Y),试计算简单相关关系,当体重X2被控制时,试计算身高X1和肺活量Y的偏相关系数。