当前位置:文档之家› SAS软件应用之典型相关分析

SAS软件应用之典型相关分析


典型相关
针对第一个问题,“在所有的组合中,寻 找一个组合使得简单相关系数为最大”, 可能是个好想法;另外,寻找一个组合使 得简单相关系数为最小,此简单相关系数 就是典型相关系数,而典型相关系数的平 方称为典型根。
典型相关
对于第二个问题,解决的方法就是对资料 进行标准化。 典型相关分析的第一步是估计组合系数, 使得对应的典型变量和的相关系数达到最 大。这个最大的相关系数是第一典型相关 系数,且称具有最大相关系数的这对典型 变量为第一典型变量。
* 1
其中这些系数都是一些常数,就是组合的 比例,由于是线性组合,所以11 12 1 p 1 且b11 b12 b1q 1 。
典型相关
有两个问题需要解决: 给定不同组合比例 11 ,12 ,,1 p以及 b11 , b12 ,, b1q , 都可以算出不一样的简单相关系数,这使得这个 方法非常的不科学,每个人都可以依照自己的喜 好来决定组合比例,并且在衡量两组变量之间相 关性的问题上,也没有一个统一的标准。 各组内变量之间的尺度不太相同,例如身高的尺 度跟脚掌长度的尺度就不相同,显然前者的变异 数会大于后者,这种情况是不合理的。
11 12 1 1 p
b11 b 12 b1 b1q
典型相关分析的理论架构
设x组的共变异数矩阵为 xx, y组的共变异 数矩阵为 yy ,x与y的共变异数矩阵为 , * x 则 1 的变异数为 * x) 1 xx 1 Var( x1 ) Var(1 * y1 的变异数为
典型相关
典型相关分析方法的基本原理是:所有研 究的两组变量为x组和y组,x 组有p个变 量 ( x1 , x2 ,, x p ), y 组有q个变量( y1 , y2 ,, yq ) , 则分别对这两组变量各做线性组合后,再 计算此两加权和的简单相关系数,然后以 这个简单相关系数当做这两组变数之间相 关性的衡量指标。即
典型相关
典型相关分析的第二步是再次估计组合系数,使 得对应的典型变量相关系数达到第二大,且第二 对典型变量中的第一次变量与第一对典型变量中 的每一个变量不相关。这个最二大的相关系数是 第二典型相关系数,且称具有最二大相关系数的 这对典型变量和为第二典型变量。 如果两个组中变量的个数为p,q,p<q,那么寻 求典型变量的过程可以一直连续进行下去,直到 得到p对典型变量为止。
第20章 典型相关分析
学习目标
了解典型相关分析的数学表达方式,假定 条件; 熟悉典型相关系数的数学含义; 掌握典型变量系数的数学含义; 掌握简单相关,复相关和典型相关的意义; 掌握典型相关分析的SAS过程步: CANCORR过程步。
概述
对于两个变量,是用它们的相关系数来衡量它们 之间的线性相关关系的。当考虑一个变量与一组 变量的线性相关关系时,是用它们的多重相关系 数来衡量。但是,许多医学实际问题中,常常会 碰到两组变量之间的线性相关性研究问题。例如, 教育研究者想了解3个学术能力指标与5个在校成 绩表现之间的相关性;对于这类问题的研究引进 了典型相关系数的概念,从而找到了揭示两组变 量之间线性相关关系的一种统计分析方法——典 型相关分析。
典型相关
设两组变量分别为x组有p个变量(x1 , x2 ,, x p ) , 而y组有q个变量( y1 , y2 ,, yq )T,我们先分别把 x组和y组的变量组合起来(当然是用线性 组合),也就是 * x1 11 x1 12 x2 1 p x p
T
y b11 y1 b12 y2 b1q yq
典型相关
从上述分析的过程可以看出,第一对典型 变量的第一典型相关系数描述了两个组中 变量之间的相关程度,且它提取的有关这 两组变量相关性的信息量最多。第二对典 型变量的第二典型相关系数也描述了两个 组中变量之间的相关程度,但它提取的有 关这两组变量相关性的信息量次多。以此 类推,
典型相关
可以得知,由上述方法得到的一系列典型 变量的典型相关系数所包含的有关原变量 组之间相关程度的信息一个比一个少。如 果少数几对典型变量就能够解释原数据的 主要信息,特别是如果一对典型变量就能 够反映出原数据的主要信息,那么,对两 个变量组之间相关程度的分析就可以转化 为对少数几对或者是一对典型变量的简单 相关分析。这就是典型相关分析的主要目 的。
1 x1 2 x2 p x p
1 y1 2 y2 q yq
典型相关
对于任意一组系数(1 , 2 ,, p ) 和(1 , 2 ,, ห้องสมุดไป่ตู้ ) 都 可以通过上式求出一对典型变量,典型相 关分析中称之为典型变量。进而可以求出 典型变量的简单相关系数,称之为典型相 关系数。 x 组的p个变量组合成一个,y组的q个变量 也组合成一个,然后计算简单相关来衡量 两组之间的相关性。问题是如何组合?
典型相关
典型关系分析是分析两组变量之间相关性的一种 统计分析方法,它包含了简单的Pearson相关分 析(两个组均含一个变量)和复相关分析(一个 组含有一个变量,而另一组含有多个变量)这两 种特殊情况。典型相关分析的基本思想和主成分 分析的基本思想相似,它将一组变量与另一组变 量之间单变量的多重线性相关性研究转化为对少 数几对综合变量之间的简单线性相关性的研究, 并且这少数几对变量所包含的线性相关性的信息 几乎覆盖了原变量组所包含的全部相应信息。
典型相关分析的理论架构
T ( x , x , , x ) 设两组变量分别为x组有p个变量 1 2 p,
T ( y , y , , y ) 而y组有q个变量 1 2 q ,典型相关分析
是找x组的线性组合 x1* 11 x1 12 x2 1p x p 与y * y 组的线性组合 1 b11 y1 b12 y2 b1q yq ,使得简 单相关系数为最大,其中
相关主题