4.最小二乘法线性拟合(非常好)我们知道,用作图法求出直线的斜率a 和截据b ,可以确定这条直线所对应的经验公式,但用作图法拟合直线时,由于作图连线有较大的随意性,尤其在测量数据比较分散时,对同一组测量数据,不同的人去处理,所得结果有差异,因此是一种粗略的数据处理方法,求出的a 和b 误差较大。
用最小二乘法拟合直线处理数据时,任何人去处理同一组数据,只要处理过程没有错误,得到的斜率a 和截据b 是唯一的。
最小二乘法就是将一组符合Y=a+bX 关系的测量数据,用计算的方法求出最佳的a 和b 。
显然,关键是如何求出最佳的a 和b 。
(1) 求回归直线设直线方程的表达式为:bx a y += (2-6-1)要根据测量数据求出最佳的a 和b 。
对满足线性关系的一组等精度测量数据(x i ,y i ),假定自变量x i 的误差可以忽略,则在同一x i 下,测量点y i 和直线上的点a+bx i 的偏差d i 如下:111bx a y d --=222bx a y d --=n n n bx a y d --=显然最好测量点都在直线上(即d 1=d 2=……=d n =0),求出的a 和b 是最理想的,但测量点不可能都在直线上,这样只有考虑d 1、d 2、……、d n 为最小,也就是考虑d 1+d 2+……+d n 为最小,但因d 1、d 2、……、d n 有正有负,加起来可能相互抵消,因此不可取;而|d 1|+|d 2|+……+ |d n |又不好解方程,因而不可行。
现在采取一种等效方法:当d 12+d 22+……+d n2对a 和b 为最小时,d 1、d 2、……、d n 也为最小。
取(d 12+d 22+……+d n 2)为最小值,求a 和b 的方法叫最小二乘法。
令 ∑==ni idD 12=2112][i i ni ni ib a y dD --==∑∑== (2-6-2)D 对a 和b 分别求一阶偏导数为:][211∑∑==---=∂∂ni i n i i x b na y a D][21211∑∑∑===---=∂∂n i i n i i n i i i x b x a y x b D再求二阶偏导数为:n a D 222=∂∂; ∑==∂∂ni i x b D 12222 显然: 0222≥=∂∂n a D ; 021222≥=∂∂∑=n i i x b D 满足最小值条件,令一阶偏导数为零:011=--∑∑==ni i ni ix b na y(2-6-3)01211=--∑∑∑===ni i ni i ni ii x b x a yx (2-6-4)引入平均值: ∑==ni i x n x 11; ∑==n i i y n y 11;∑==n i i x n x 1221; ∑==ni i i y x n xy 11则: 0=--x b a y02=--x b x a xy (2-6-5) 解得: x b y a -= (2-6-6)22xx y x xy b --=(2-6-7)将a 、b 值带入线性方程bx a y +=,即得到回归直线方程。
(2) y 、a 、b 的标准差在最小二乘法中,假定自变量误差可以忽略不计,是为了方便推导回归方程。
操作中函数的误差大于自变量的误差即可认为满足假定。
实际上两者均是变量,都有误差,从而导致结果y 、a 、b 的标准差(n ≥6)如下:2)(21212---=-=∑∑==n a bx yn dni i ini iy σ (2-6-8)(根式的分母为n-2,是因为有两个变量)y y ni i n i i ni i a x x n x x x n xσσσ)()(222211212-=-=∑∑∑=== (2-6-9)y y ni i ni i b x x n x x n nσσσ)(1)(222112-=-=∑∑== (2-6-10)(3)相关系数相关系数是衡量一组测量数据x i 、y i 线性相关程度的参量,其定义为: ))((2222y y x x y x xy r ---=(2-6-11)r 值在0<|r|≤1中。
|r|越接近于1,x 、y 之间线性好;r 为正,直线斜率为正,称为正相关;r 为负,直线斜率为负,称为负相关。
|r|接近于0,则测量数据点分散或x i 、y i 之间为非线性。
不论测量数据好坏都能求出a 和b ,所以我们必须有一种判断测量数据好坏的方法,用来判断什么样的测量数据不宜拟合,判断的方法是|r|<r 0时,测量数据是非线性的.r 0称为相关系数的起码值,与测量次数n 有关,如下表2-6-2表2-6-2 相关系数起码值r 000在进行一元线性回归之前应先求出r 值,再与r 0比较,若|r|> r 0,则x 和y 具有线性关系,可求回归直线;否则反之。
例9:灵敏电流计的电流常数K i 和内阻R g 的测量公式为g i sR U dR K R R -=12测得的数据同例7,其中间处理过程如下,试用最小二乘法求出K i 和R g ,并写出回归方程的表达式。
解:测量公式与线性方程表达式y =a+bx 比较:2R y = U x = dR K R b i s1=g R a -=数据处理如表2-6-3:中间过程可多取位:x =1.67125 y =225.0 2x =3.34625 2y =6.375×104xy =461.5625相关系数998.0))((2222=---=y y x x y x xy r查表得知,当n=8时,r 0=0.834,两者比较r>r 0,说明x 、y(即U 、R 2)之间线性相关,可以求回归直线。
求回归方程的系数22xx y x xy b --==154.6192304x b y a -==-33.4代换a R g -==33.4Ωb dR K R i i s==154.6192304K i =dbR R i s =3.7170×10-9A/mm 计算标准差为:y σ=2.64561902; a σ=2.300545589; b σ=1.257626418计算不确定度: ΔR g =a σ=2Ω; K K i ∆=bb σ=0.81%; ΔK =0.03×10-9A/mm 测量结果表达式电流计内阻: R g =(33±2)Ωgg R R ∆=6.1%电流常数: K =(3.72±0.03)×10-9A/mm KK i∆=0.81% 回归方程: R 2=155U -33 5.计算器在数据处理中的应用在处理数据时,不同的计算器的编程方式各不相同,下面以震旦AURORA SC180型计算器为例作以介绍。
(1)计算标准偏差S① 标准偏差S 的计算器运行公式:12)(111211212-+-=--=∑∑∑∑====n xx x x x x n s ni n i i n i i ni i因为 ∑==ni i x n x 11所以 1)(2112--=∑∑==n nx xs ni i ni i(只有为x i 单变量)② 操作步骤和方法(ⅰ) 按[MODE][0]键,计算器进入单变量统计计算状态。
屏右上角显示“STAT1”指示符。
(ⅱ) 清除内存数据:按[INV][ON/C.CE]键。
(ⅲ) 数据输入:依次先键入数值,然后按[DATA]键,每完成一次输入的同时,屏幕均会显示数据的个数n 值。
(ⅳ) 数据修正:按[DATA]键之前,要删除错误数据,按[ON/C.CE];按[DATA]键后要删除错误数据,再次输入该错误值,然后按[INV][DEL]。
(ⅴ) 取分析结果:[INV][x ]:平均值[INV][∑x ]:数据和 [INV][∑x 2]: 数据平方和[INV][S]:测量列的标准偏差 [INV][n]:数据个数例10:一组等精度测量值为:83.1、83.3、83.3、83.7、83.9、83.6、83.4、83.4、83.1、83.2,试求x 、∑x 、∑x 2、S 、n 。
解:注:当n ≥6时,认为=S 。
(2)最小二乘法求回归直线① 求回归直线参量a 、b 、r 的计算器运行公式由(2-6-6)、(2-6-7)、(2-6-11)式得到以下只含x i 、y i 两个变量的公式:nx b ya ni ini i∑∑==-=11∑∑∑∑∑=====--=ni i n i i ni ii ni ini ix n x y x n yx b 1221111)(])(][)([12122112111∑∑∑∑∑∑∑=======---=n i ni i i n i i n i i ni in i i n i i i y y n x x n y x y x n r② 操作步骤和方法:(ⅰ) 按[MODE][.],计算器进入双变量统计计算状态。
屏幕右上角显示“STAT2”指示符。
(ⅱ) 清除内存数据:按[INV][ON/C.CE]键(ⅲ) 双变量数据输入:先键入x 的值、 按[a]键, 然后键入y 的值、 按[b]键,再按[DATA]键,完成输入。
屏幕会同时显示数据的个数,即n 值。
(ⅳ) 数据修正:同单变量数据输入。
(ⅴ) 取分析结果[INV][a]:回归直线的截距 [INV][b]:回归直线的斜率[INV][r]:相关系数 还可以取以下值:[INV][x ]、[INV][y ]、[INV][Σx]、[INV][Σx 2]、[INV][Σy]、[INV][Σy 2]、[INV][Σxy], 以便计算y σ、a σ、b σ(计算器没有该三项的计算程序)。
例11: 灵敏电流计实验所测数据如下:要求所使用计算器具有计算最小二乘法的功能,求回归直线以及电流计的电流常数K i 和内阻R g 。
解: 测量公式g i sR U dR K R R -=12与线性方程表达式y =a+bx 比较y =R 2 x =U ,则:查表知道,当n =8时,r 0=0.834, r>r 0,说明U 、R 2之间线性相关。
得到: 回归方程 R 2=154U -32 电流计内阻 R g =32Ω电流常数 K =3.74×10-9A/mm习 题1.指出下列测量结果的有效数字: (1) I =5010mA(2) C =2.99792458×108m/s2.按“四舍五入”修约法,将下列数据只保留3位有效数字:(1) 1.005 (2) 979.499 (3) 980.501 (4) 6.275 (5) 3.134 3.单位变换:(1) m =3.162±0.002kg= g = mg = T (2) θ=(59.8±0.1)°=( )ˊ(3) L =98.96±0.04cm= m = mm = µm4.改错并且将一般表达式改写成科学表达式:(1) Y =(1.96×1011±5.78×109)N/m 2(2) L =(160000±100)m5.按有效数字运算规则计算下列各式:(1) 1000-5=(2) 3.2×103+3.2=(3) tg3005ˊ=(4)125.100325.100125.100325.100 +=(5) R 1=5.10k Ω,R 2=5.10×102Ω,R 3=51Ω。