双变量相关与回归
tb
b0 Sb
残 n2
Sb
SY .X lXX
MS SY.X
SS残差 n2
残差
注意:在简单线性回归模型中,由于只有一个自变量,
回归模型的方差分析等价于对回归系数的检验,且
计
t= 。F
另外,对回归系数的假设检验还有一种方法,即对相
学
关系数作假设检验,在第二节讲到!
一、简单线性回归
拟合优度检验与决定系数
医
线性(linear)
独立性(independence)
学
正态性(normality)
统
等方差(equal variance) 简单线性回归分析应用(预测与控制)
计
利用回归方程进行预测预报 X Y 注意:均数的可信区间与个体值容许区间的意义
学
不同。
利用回归方程进行统计控制 Y
X
不论预测或控制,都不能超出给出数据的范围!
R2表示。
R2 SS回归lX2Y lXX
SS总
lYY
因SS回归≤SS总,所以取值在0到1之间。它的大小反
学
映了自变量对回归的贡献,说明在的总变异中用、
回归关系所能解释的比重。决定系数越趋近于1,
回归方程的拟合效果越好,因此,常把它作为评价
回归方程效果,反映拟合优度的指标。
一、简单线性回归
回归分析的前提条件(LINE)
医
实际应用中采用简单线性回归模型来定量描述应 变量与自变量之间的数量关系。
总体线性回归方程记作
学
Y|X X
β为总体回归系数(regression coefficient),即直
统
线的斜率,其统计学意义是X每增加(或减少)一
个单位,Y平均改变β个单位(即Y的均数改变β个
计
单位)。表示Y随X改变的平均变化量,β>0,表明 Y随X的增加而增加;β<0,表明Y随X的增加而减
学
少;β=0,表明Y与X无线性回归关系。 α为回归直线在轴上的截距(intercept),其统计
学意义为X取值为0时,方程所估计值Y的平均水平。
截距的解释一定要符合专业实际 。
一、简单线性回归
医
设a和b是α和β的估计值,则可拟合得到样本 线性回归方程
学
Yˆ abX Yˆ表示x取某定值时相应总体均数Y的点估计
二、简单线性相关
医
简单线性回归分析可以告诉我们应变量Y随自变量X变
化而变化的情况,研究的是变量之间的依存关系;
学
但并未告诉我们二者间关系的密切程度。若要了解 两随机变量间线性关系的程度与方向,就需进行简
统
值,b称为样本回归系数,也是有单位,有 符号的。
计
其回归方程满足三个基本性质:① (YYˆ)2
为最小;② (YYˆ)0;③回归直线必然通过
学
中心点 X,。Y其中(Y Yˆ )称为残差
(residual)。
一、简单线性回归
回归方程的估计:最小二乘法(保证回归方
医
程满足三个基本性质)
保证各实测点至直线的纵向距离( Y Yˆ )
6、如何由身高预测该地15岁男童的体重?
一、简单线性回归
医
散点图 在做回归或者相关分析以前,对数据必
学
须要做散点图!
• 为了确定相关变量之间的关系,首先
统
应该收集一些数据,这些数据应该是
计
成对的。例如,每人的身高和体重。 然后在直角坐标系上描述这些点,这
学
一组点集称为散点图。
医 学 统 计 学
一、简单线性回归
医
回归系数大小和两个变量的单位及大小有关,回
归系数越大,说明Y随X的变化越快,但并不表明
学
影响越大。为描述这种影响的大小以及回归方程拟 合效果的好坏,引入决定系数(coefficient of
统
determination)的概念。决定系数是简单线性回归 与多重线性回归分析中一个重要的统计量,通常用
计
增长,按专业知识,描述两个变量的数量变化关
统
系,宜将体重作为应变量(dependent variable), 身高作为自变量(independent variable)。
计
依存关系
学
简单线性回归(simple linear regression) 一个X 多重线性回归(multiple linear regression) 多个X
一、简单线性回归
医
采用线性回归分析可以解决以下几方面的问题: 1、探讨体重是否随身高的增长而增加?
学
2、体重与身高的关系呈直线还是曲线关系?
3、如何采用回归方程定量地描述两者间的关
统
系?
4、该地15岁男童身高每增加1厘米,体重平均
计
增加多少公斤?
5、所建回归方程是否成立?即两变量间线性
学
依存关系是否存在?
计
后果,乙肝病毒和乙肝之间是因果关系;但是,有 的现象之间因果不清,只是伴随关系,例如丈夫的
学
身高和妻子的身高之间,就不能说有因果关系。
相关与回归就是用于研究和解释两个变量之间相
互关系的。
一、简单线性回归
医
回归分析是研究一个变量(Y)和另外一个或一些 变量(X)间线性依存关系的统计分析方法。
学
如在青少年生长发育研究中体重随着身高的增长而)2 最小 。
统 计
b (XX)Y (Y)lXY
(XX)2
lXX
lX Y (X X )Y ( Y ) X ( Y X n ) (Y ) aYbX
考查回归直线是否正确的方法:
学
1、回归直线必然通过中心点 2,将回归直 线左端延长与Y轴相交,交点纵坐标为截距
由图9-1可见,体重随身高的增加而递增,并呈直线增长趋势。但身高相同者未 必有相同的体重,说明体重除了受身高的影响之外,还可能受到一些未知的, 诸如营养、生活方式、遗传等因素的影响。因此,回归分析所描述的两个变量 间的关系,不全是一一对应的函数关系(确定性关系),而是一种非确定性关 系。
一、简单线性回归
3,要注意,直线只能在实测范围内应用,
不能随意延长!
一、简单线性回归
回归分析的统计推断
医
Y变异的分解
学 统
P(X,Y) Y
Y Y
Y Yˆ
Yˆ Y
计
Y
X
学
( Y Y ) 2 ( Y ˆ Y ) 2 ( Y Y ˆ ) 2
S总 SS回 S 归 S残 S 差
一、简单线性回归
医 学 统
总体回归系数的假设检验——t检验
双变量相关与回归
医学上,许多现象之间也都有相互联系,例如:
身高与体重、体温与脉搏、产前检查与婴儿体重、
乙肝病毒与乙肝等。在这些有关系的现象中,它们
医
之间联系的程度和性质也各不相同。
学
这里,体温和脉搏的关系就比产前检查与婴儿体 重之间的关系密切得多,而体重和身高的关系则介
统
与二者之间。
另外,可以说乙肝病毒感染是前因,得了乙肝是