当前位置:
文档之家› 第九章 实验数据的回归与相关分析
第九章 实验数据的回归与相关分析
相关系数检验与方差分析检验的一致性
剩余平方和,偏差平方和
xy
( x x)( y y) ( x x) ( y y )
2
2
L xy Lx 2 Ly 2 L xy
b
Lx
2
|ρ2|越大,则 Q回越大,回归方程的效果越好,反之亦然。两 种检验结果是一致的。 在实际应用中,不需要了解相关系数时,对回归方程进行方差 分析的 F 检验即可。
二常数(a,b), 一般意义下的正规方程组:
(9-5)
(9-7) (9-8)
x= x (
y= y 回归直线通过平均点 ),这对回归直线的作图有帮助。
注意: 只要可能,给出自变量的范围。 除非有充分的理论根据,一般不要外推线性回归方 程。 最小二乘法找出的近似函数,与第七章中的插值函 数不同。 最小二乘法不求曲线恰好通过各实验点(xt,yt) , 只需使求出的曲线能够反映给定数据的一般趋势就 行了。
根据所研究因素(自变量)的多少,回归 分析可分成:
一元回归分析 多元回归分析
在每一类中,又以自变量与因变量之间呈 线性或非线性关系,分为:
线性回归分析 非线性回归分析
二、回归分析所讨论的主要内容
1.建立回归关系式。 2.对所建立的回归关系式进行检验,通过检验对回 归关系式的合理性和实用价值作出判断。 3.利用建立的关系式,制定合理的生产工艺参数和 产品的配方。 4.进行生产中的预报和控制(置信水平)。
时间 x(小时)
试根据上面的试验数据建立 y 和 x 之间的经验公式 y f (x) .
解
y
(1)在坐标纸上画出散点图
27
(2) y f ( x) a bx, 其中 a 和 b 是待定常数.
26 25
24
o
1 2 3 4 5 6 7 8
t
(3)最小二乘法确定a、b
偏差平方和
q yi (a bxi )
ˆ y - y y y bx bx (y y) b( x x) ˆ q y - y [(y y) b( x x)]2
2
L y b L x 2bLxy
2 2 2
b (9 16) (9 17)
L xy Lx
2
q L y [1
偏差
最小的 偏差的平方和 q = 0.108165
q 0.329
它的大小在一定程度上反映了用经验公式来 近似表达原来函数关系的近似程度的好坏.
7 7 8 a xi b yi . i 0 i 0 7 7 7 x a x2 b y x , i ii i i 0 i 0 i 0
y f ( x) 0.3036x 27.125.
由(2)式算出的函数值 f ( xi ) 与实测yi 的有一定的偏差.现列表比较如下:
x 实测
0 27.0 1 26.8 2 26.5 3 26.3 4 26.1 5 25.7 6 25.3 7 24.3
yi
算得
( xi )
27.125 26.821 26.518 26.214 25.911 25.607 25.303 25.000 -0.125 -0.021 -0.018 -0.086 0.189 0.093 -0.003 -0.200
四、回归方程的剩余标准差
剩余方差
剩余标准差
ρ越大,S越小,回归方程的效果越好。预报、控 制中用到S值。
第四节 回归线的置信带与系数的置信区间
一、回归线的置信带
回归直线不是真实直线,真实直线应该出现在哪一个范 围?与置信度1-α有关。
1-α置信水平下,确定一个置信带。
(1-α)置信带的意义是: (1-α)置信水平下,真实的回归直线落在由α确定的两 条弧形曲线所形成的区带内。 此种置信带有两种: 1、某一 x 下yx的均值的置信带 2、围绕某x下一个单独y值的置信带
第九章 实验数据 的回归与相关分析
实验数据处理:
误差分析 表 函数形式 图线 牛顿插值公式 数学模型 图解法
模型系数平均值法 最小二乘法回归
第一节
一、变量间的关系
回归与相关
各种事物之间的普遍联系是客观存在的。从数学上,这些不同 联系的表现形式大致分两类:
第二节
一元线性回归方程的建立
一元回归分析 一元线性回归分析 (xt,yt),(t=1, 2, …n),画散点图, 如果这些数据的坐标点具有接近直线的趋 向,可用结构式
a、b ― 回归系数 称为变量y的理论估计值或回归值
根据实测数据,确定回归系数 a、b
回归原则: 要求拟和值与实测值偏差最小。 先把偏差表示出来,再按偏差最小的条件确定回归系数 a、b。 xt下,估计值(又称回归值)与实测值yt之偏差为: ― 表示偏差。一般假定 的随机变量 是一组相互独立且服从正态分布
要求总的偏差最小,
取所有“偏差”的总和
这种根据偏差的平方和最小作为条件来选择常数 的方法叫做最小二乘法.
一、最小二乘法
例:为了测定刀具的磨损速度,经过一定时间间 隔,测量一次刀具的厚度,得到一组试验数据如下:
0 1 2 3 4 5 6 7 刀具厚度 yi (毫米) 27.0 26.8 26.5 26.3 26.1 25.7 25.3 24.3
7 yi (a bxi )xi 0, i 0 7 y (a bx ) 0. i i i 0
将括号内各项进行整理合并,并把未知数 a 和 b 分离出来,便得正规方程组
7 7 8 a xi b yi . i 0 i 0 7 7 7 x a x2 b y x , i ii i i 0 i 0 i 0
1、某一 x 下yx的均值的置信带
在x的某一给定值下,对y进行重复测量时,可以获得y在给定 x下的平均值,记为 ,以 为准建立不同x值下 真值 的取 值区间。
A1 -置信区间的半宽度(是x,α的函数)。 计算不同x下的A1,两条弧形曲线形成一个区带。 意义:x下yx的均值的真实值落在两条弧形曲线所形成的区带 内,其置信水平1-α。 1-α不同, 置信带宽度不同。 A1的确定 置信水平(1-α) ,自由度n-2 ,n为测试值的成对数目,在t 检验临界表(附录 Ⅲ-1)上,查出t ,n-2的临界值。 2
确定性的函数关系:
函数关系是指变量间完全确定的数量依从关系,一个变量值 完全由一个或一组变量的数值所确定和控制。 y=f(x) S = πR2
相关关系:
相关关系表示变量相关程度的大小。变量间存在一种不完全确 定的数量依从关系。一个变量虽然受另一个或一组变量影响 但并不由这一个或一组变量完全确定。例如农作物的产量与 施肥量的关系。
在y方向测得的实验数据 应满足:
误差服从正态分布 (随机误差的均值为零)
精确度相等,方差
相等。
对于非等精确度的测定,即 不是常数。随x 变化而变化。应对其作适当变换,以保证误差 相等。
第三节
一元线性回归方程的检验方法
任意的一组数据(xt,yt)都可拟和出一条直线来, 但直线不一定有价值! 必须对所建立的回归方程进行定量的效果检验。
计算回归及剩余平方和的简式
将 Q回和 Q剩用各自的自由度去除,得到 (平均)方差。 Q总的自由度 f总=n - 1 , Q回的自由度 f回=自变量的数目, 一元线性回归f回 =1 , Q剩的自由度 f剩 = f总- f回 = n- 2 。
按 Fα(f回,f剩)查 Fα临界值。 具体的检验方法与第六章相同。
相关系数的显著性检验
采用一元线性回归公式
,求回归系数 a、b。
b
L xy Lx
2
得回归方程 再进行相关系数的显著性检验
二、等级相关 离散变量的相关系数及相关系数的显著性检验 三、用方差分析检验回归效果
当自变量 x 取值 x1,x2, … xn时, y对应n个观察值y1, y2, … yn ,y1, y2, … yn与其平均值 y t , 产生变差。 总变差平方和为
二、求回归方程的列表算法
变为容易列表计算的形式,不用求平均值,直接求和
符号表示
三、最小二乘法的应用条件
y在x上的回归, 在y轴偏差的平方和极小化 (xt,yt),自变量 x 值保持不变(设定) y值存在测量变差的情况 (测量引起的数据波动或随机误差) 注意: 变差 是受随机因素的影响产生的。包括: 随机实验误差 分析问题时被遗漏的因素对结果的影响等 不是由变量间的函数关系所引起的
相关关系定量表示:表示相关程度大小的量称为相关系数。
数据序列(xt,yt)t=1,2,3…n, 相关系数ρ
xy
性质如下
( x x)( y y) ( x x) ( y y )
t t 2 t t
L xy
2
Lx Ly
2
2
当|ρ|=1时,完全线性相关
当ρ =0时,完全没有线性相关 当0<|ρ|<1时,表示x与y存在着 一定程度的线 性相关。
2 2
(L xy ) 2 Lx Ly
2 2
]
q L y [1 2 ]
当 ρ=0 时, q 最大, x 和y线性无关; 当|ρ|= 1 时, q = 0 ,所有观测点都落在 回归直线上,x 和y完全线性相关。 |ρ|越靠近于 1 时,则 q 较小,表明x与y 间线性相关密切。
定量判别:|ρ|值多大,变量间线性相关密 切,所建立的回归方程有实际意义呢? 进行相关系数的显著性检验。
i 0
7
2
把 q 看成自变量 a 和 b 的一个二元函数
q(a,b),a,b取何值时 q 取得最小值