当前位置:文档之家› 医学统计学 第九章

医学统计学 第九章


9.2 直线回归
9.2.1直线回归的概念 • 直线回归分析的目的:建立一个线性函数,来描 述两个变量的依存关系。 • 回归分析中两变量的地位是不相同的: 通常把一个变量称为自变量,用X表示;另一个 变量称为应变量,用Y表示。
• 散点图的带状分布有线性趋势 • 直线回归分析在于找出两个变量有依存关系 的直线方程,以确定一条能代表这些数据关 系的、最接近各实测点的直线,使各实测点 的我们称之为直线回 归方程
• 相关系数的假设检验亦可按υ=n-2,直接查 r rα(υ)时,P 相关系数r界值表(附表),当 < r rα(υ)时,P≤α 。本例r=0.8529, >α ;当 ≥ 按 υ=n-2=12-2=10, 查 r 界 值 表 , r0.01(10)=0.708,因r> r0.01(10),故P<0.01。
• 如果仅仅研究变量间相互关系的密切程度和 变化趋势,并用适当的统计指标表达,这就 是相关分析。 • 如果要把变量间数量上依存关系用函数形式 表示出来,用一个或多个变量来推测另一变 量的估计值及波动范围,这就是回归分析。
• 回归一词最早由Golton在一项有关父亲与儿子 身高的研究中提出。儿子的高度与父亲的高度 自然是相关的。他发现身材高大的父亲所生儿 子的高度不少要比其父亲矮,而身材矮小的父 亲所生儿子的高度不少要比父亲高;也就是说, 无论是身材高还是矮的父亲所生儿子的身高有 向人群的平均身高回归的趋势,这就是回归的 生物学内涵,后来人们借用回归这个词来描述 通过自变量的数值预测反映变量的平均水平。
9.2.2 回归方程的建立与检验
• 直线回归方程的一般表达式为:
ˆ a bX Y
a是回归直线在Y轴上的截距 ,即X=0时的值;
b为回归系数,即直线的斜率。 b>0,表示直线从左下方走向右上方,即Y 随X的增大而增大; b<0,表示直线从左上方走向右下方,即Y 随X的增大而减少; b=0,表示回归直线与X轴平行,或随X改变 无增减变化。
• 求回归方程的关键是要求a和b的值,根据数 学上的最小二乘法(least square method)原理, 使各实测值Y与回归直线上对应的估计值之差 的平方和为最小,可导出a、b的最小二乘法 估计如下:
( X X )(Y Y ) l b l (X X )
2
XY XX
a y bx
3)相关系数的假设检验 相关系数r是样本相关系数,它是总体相关系 数ρ 的估计值。和其他统计量一样,根据 样本资料计算出来的相关系数也有抽样误 差。在ρ =0的总体中随机抽样,由于抽样 误差的影响,所得r值常不等于零。因此, 在计算得到相关系数后,还不能根据的大 小对X、Y间是否有相关关系作判断,而应 进行r是否来自ρ =0的假设检验。相关系 数的假设检验可用t检验法,其计算统计量 t值的公式为:
r
( X X )(Y Y ) ( X X ) (Y Y )
2
2
l XY l XX lYY
2)计算相关系数 例9-2 现仍用例9-1的资料,试分析大白鼠进食 量与体重增加量之间有无直线相关关系? 1.作散点图,判断是否有线性趋势。从图9-1 可知,两变量有线性趋势,成正相关。 2.列相关系数计算表 3.按公式9-1得相关系数 r
SY X
2 ˆ (Y Y )
n2
t b > t0.001(10) , 查t界值表,t0.001(10)=4.587, P<0.001,按α =0.05水准,拒绝H0,接受H1, 认为在某代乳粉营养价值试验中,大白鼠进 食量与体重增加量之间存在直线回归关系, 即所拟合的样本直线回归方程有意义。
4 . 回归系数的假设检验 (1)回归系数假设检验的意义 所求得的回归方程是否能表达X、Y存在直线关 系,这是回归分析首要考虑的问题 总体回归系数 与样本回归系数b
(2)回归系数的t检验 ,即使X、Y的总体回归系数β 为零(总体并不 存在回归关系),由于存在抽样误差,其样 本回归系数b也不一定为零。因此,当用样本 求得不等于零的回归系数b后,我们还不能立 即认为β ≠0,即X与Y间存在回归关系,必须 考虑回归系数的抽样误差问题,因此需对β 是否为零进行假设,可用按Y服从正态分布的 假定,回归系数的假设可用方差分析或t检验。
第九章 直线相关与回归
• 医学研究中,常常要研究两个或两个以上变 量的关系。如成人的身高与体重、青少年的 身高与年龄、体温与脉搏次数、年龄和血压、 反应物浓度与反应速度、溶液浓度与渗透压 等。相关与回归就是研究这种关系的统计方 法。 • 变量与变量之间的关系,可以分成两种类型: 一种是确定性关系(函数关系),另一种是 非确定性关系。
9.1 直线相关
9.1.1 直线相关的概念 当所研究的两个事物或现象之间,既存在着密 切的数量关系,又不象函数关系那样,能以 一个变量的数值精确地求出另一个变量的数 值,我们称这类变量之间的关系称为相关关 系。 直线相关分析关心的是两个变量间是否有线性 的协同变化的关系、变化的趋势、变化的密 切程度和方向。
9.4.2设计与应用直线相关与回归的注意事项 1 .作相关与回归分析要有实际意义。不要把毫无关 联的两个事物或现象用作相关、回归分析, 2 .对相关分析的作用要正确理解。相关分析只是以 相关系数来描述两个变量间直线关系的密切程度和 方向,并不能阐明两事物或现象间存在联系的本质; 即使存在相关关系,也并不能证明是因果关系 ( 相 关关系中有的是因果关系,有的不是因果关系 ) 。 要证明两事物间的内在联系,必须凭借专业知识从 理论上加以阐明。但是,当事物间的内在联系尚未 被认识时,可根据相关分析的数量关系给理论研究 提供线索。
9.4 直线相关与回归应用时的注意问题 9.4.1直线相关与回归的区别与联系: 一、直线相关与回归的区别与联系 1.区别: (1)在资料要求上,如果X可以精确测量和严格 控制,回归只要求应变量Y作为随机变量且服 从正态分布,此种回归属于Ⅰ型回归;如果X 和Y需要相互推断,则要求X、Y为随机变量且 都要服从双变量正态分布,此资料类型属于 Ⅱ型回归。可以计算两个回归方程:由 X 推 Y 的回归方程;由Y推X的回归方程。
检验假设为: H0:总体回归系数β=0,即大白鼠进食量与体重 增加量间无回归关系。 H1:总体回归系数 β≠0,即大白鼠进食量与体 重增加量间有回归关系。 α=0.05。
检验统计量
tb
b0 Sb
, n 2
式中Sb为样本回归系数的标准误:
SY X Sb l XX
为剩余标准差,亦称标准估计误差 :
• 直线相关的性质可由散点图(scatter diagram)直 观地说明。通常以自变量(independent variable)X为横坐标,应变量(dependent variable)Y为纵坐标,在方格坐标中,每对变 量值(X、Y)的交叉点处,描出一个点,就成 为散点图。从散点图上可以粗略地看出,两 个变量间相关的方向和密切程度以及两变量 间是否呈直线关系。
例9-1 某医师研究某种代乳粉营养价值时,用 大白鼠做实验,得大白鼠进食量与体重增加 量的资料(表9-1)。
表9-1 大白鼠进食量与体重增加量的关系
编 号 进食量(g) 增加量(g) 1 800 185 2 780 158 3 720 130 4 867 180 5 690 134 6 787 167 7 934 186 8 750 133 9 820 165 10 679 145 11 639 120 12 820 150
3.相关和回归都是分析两变量间关系的统计方 法。相关表示相互关系,回归表示从属关系。 与相关分析一样,回归分析前也必须先作散 点图,以判断两变量间的关系是否为线性趋 势,有无离群点等。 4.积差和法相关与等级相关。积差和法相关计 算相关系数 r 适用于正态资料;一般来说,能 用积差和法相关计算的资料不应用等级相关 计算。资料明显呈偏态分布或者原始资料只 能用等级划分或难以判定资料属何种分布的, 才宜按等级相关处理。有关等级相关资料的 处理方法见非参数统计一章。
(4) 用回归解释相关:相关系数 r 的平方称为决 定系数,也称为相关指数。公式为:
l xy l xy / lxx SS回 r lxxl yy l yy SS 总
2
2
2
其值在 0-1 之间。决定系数表示 Y 的变异中可 由 X解释的部分占总变异的比例。因此r2越接 近于1,说明应用相关分析的意义越大,即贡 献越大;相反的意义亦成立。
9.2.3 回归方程的应用 1. 描述两变量间的依存关系 通过回归系数的假设检验,若认为两变量间存在着 直线回归关系,则可用直线回归方程来描述两 变量间的依存关系 2.利用回归方程进行预测 所谓预测就是把预报因子(自变量X)代入回归方程 对预报量(应变量Y)进行估计,其波动范围可按 求y值容许区间的方法计算。 3.利用回归方程进行统计控制 统计控制是利用回 归方程进行逆估计,如果要求应变量Y在一定范 围内波动,可以通过控制自变量X的取值来实现
(1)建立假设,确定检验水准
H0 : 0 H1 : 0
0.05
(2)计算检验统计量
n2 tr r , n 2 2 1 r 12 2 t r 0.8529 5.1667 2 1 0.8529
(3)查表确定p值 P<0.001 (4)做出统计结论 可认为大白鼠进食量与体重增加量之间呈正相 关。
(2)在应用上,相关分析用于说明两变量间的相 互关系,描述两变量X、Y相互之间呈线型关系 的密切程度和方向;回归分析用于说明两变量 间的依存关系,可以用一个变量的数值推算另 一个变量的数值。
2.联系: (1)正负符号:在同一资料中,计算r与b值的符 号应该相同。 (2)假设检验:在同一资料中,r与b值的假设检 验的统计量t值相等,即 tr=tb。 (3)r与b换算关系如下:
190 180 170 160 150
• 图9-1大白鼠进食量与体重增加量的散点图
相关主题