线性回归和相关
(总例数减1) (自变量个数)
误差自由度:n-2
(总的自由度减去回归自由度)
F 回归均方 / 误差均方
F
U /1 Q /( n 2 )
查方差分析用的F界值表,得P值
df1=1, df2=n-2
例6.2 研究正常男性年龄与运动后最大心率 的关系,求直线回归方程。
ˆ 302.2684 3.2496 x y
体重
心脏横径
设有n对x,y的观察值,先在直角坐标系中 作散点图,如果散点的分布呈直线趋势,则可设法 求出直线方程。 通常用最小二乘法,依据:各点与该直线的 纵向距离的平方和为最小
先由(6.3)式求得b,再由(6.4)式求得a,就得出 直线回归程。
b ( x x )( y y ) /[ ( x x ) 2 ]
直线回归相关分析的注意事项:
5. 在资料要求上:
相关分析要求两个变量服从双变量正态分布。
回归分析要求因变量服从正态分布,自变量可 以是精确测量和严格控制的变量。如两个变量服 从双变量正态分布,则可以作两个回归方程,用 X推算Y,或用Y推算X。
r=0.7495
回
60
3.2 3.1 3 2.9 2.8 2.7 2.6 2.5 40 45 50 55
回
r=-0.83597
60
65
r
相关系数的计算: x x y y 2 2 x x y y
xxx
x x y y xy x y n
ˆ a bx y
Y为应变量(dependent variable)
X为自变量(independent variable)
A为截距(intercept) b为回归系数(regression coefficient) 回归系数b表示x每改变一个单位,y平均改变b 个单位。
Y=10x+5
ˆ =4.22+0.20x y
直线回归相关分析的注意事项:
2. 在进行直线回归前应绘制散点图,有直 线趋势时,才适宜作直线回归分析。散 点图还能提示资料有无异常点。 3. 直线回归方程的适用范围一般以自变量 的取值范围为限。
直线回归相关分析的注意事项:
4. 对同一组资料作回归和相关分析, 其相关系数和回归系数的显著性检验结果完 全相同。由于相关系数的显著性检验结果可 直接查表,比较方便;而回归系数的显著性 检验计算复杂,故在实际应用中常用相关系 数的显著性检验结果代替回归系数的显著性 检验。
( x x ) 32.63 ( x x ) 93.01 ( x x )( x x ) 54.95
2 1 1
2 2 2
1
1
2
2
r 0.9975
tr 46.82
P 0.01
df 11
两法的测得值有相关(P<0.01)
第三节 直线回归方程
目的:找出描述x与y依存关系的直线方程。
方差分析法:
X和Y的线性关系引起的变异
Y的总变异
2
误差引起的变异
ˆ )2 Q ( y y
2 2 ˆ ˆ ( y y ) ( y y ) ( y y)
2 ˆ U ( y y)
回归平方和
误差平方和
ˆ )2 Q ( y y
总的自由度:n-1 回归自由度:1
生物统计教研室
第一节 概述
分析两个变量间的关系常用回归及相关分析的统 计方法。 如两个变量间的关系是线性的,可用直线相关与 回归分析;如两个变量间的关系是非线性的需用非线 性(曲线)回归。 回归分析适用于分析变量间的因果关系;用一个 自变量的值来估计另一个应变量的值。 相关分析用于分析两变量间相互联系的密切程度 及相关方向。
tb 5.4078, df 12, P 0.01
U 2404.5954, df1 1 Q 987.4046, df 2 12
F 29.2232, P 0.01
直线回归相关分析的注意事项:
1. 相关分析只是以相关系数来描述两个变量 间线性相关的程度和方向,并不阐明事物间存在 联系的本质,也不是两事物间存在联系的证据。 要阐明两事物间的本质联系,必须凭专业知识从 理论上加以论证。因此,把两个毫无关系的事物 放在一起作相关分析是毫无意义的。同样,作回 归分析也要有实际意义。
t 检验法:
tb b / sb
sb s y. x /
s x. y
2 ˆ ( y y)
df n 2
(x x)
2
2
样本回归系 数的标准误 剩余标准差
ˆ ) /( n 2) (y y
估计误差平方和
2 2 2 2 ˆ ( y y ) ( y y ) [ ( x x )( y y )] / ( x x )
a y bx
y
ˆ a bx y
ˆi yi y
ˆ) ( y y
2
x
2 ˆ 最小 ( y y )
回归系数的显著性检验
从样本资料中算得的回归系数b,也有抽样误 差,因此需作显著性检验,检验其是否是回归系 数为零的总体中抽得的。 H0:β=0 H1:β≠0。
当拒绝H0时,可认为x与y间的直线回归方程 有统计学意义。 显著性检验可有两种方法:t 检验法和方差 分析法。
X和Y的离均差积和
x x
2
x x
2
2
n
X的离均差平方和
相关系数的显著性检验
H0 : 0
sr
H1 : 0
1 r n2
2
样本相关系 数的标准误
tr
r sr
df n 2
查t界值表, 得P值
例6.1 极谱法和碘量法测定水中溶解氧的含 量,两法的测得值是否有相关性?
第二节 相关系数
相关分析的目的在于通过相关系数r来描述和度 量两变量线性联系的程度和方向。 r>0 正相关 图例1
r<0 负相关
r=0 零相关
图例2
图例3
零相关即两变量间无关。
样本相关系数不等于零,并不表示总体相关系 数不等于零,还要作显著性检验。
next
3.7 3.5 3.3 3.1 2.9 2.7 2.5 40 45 50 55