当前位置:
文档之家› 线性回归中被测样不确定度评定的几种方法及其分歧根源
线性回归中被测样不确定度评定的几种方法及其分歧根源
果的不确定度评定中,往往占有显著的比例。目
线性回归引入的不确定度
一般化学检测中,是通过观察激励值(例如浓
度)戈和响应值(信号)),之间的关系,来实现被测样 戈。。。的间接检测的。在大多数情况下,菇和y认为是 线性关系(限于直线线性段),即
y=口+k
(1)
前,对拟合直线中的参数,斜率6和截距口的不确 定度公式基本无分歧,但对线性回归结果不确定 度M(石。。)的评定,分歧较大,也是本文讨论的
[8]龚思维,等.分光光度法测定磷的测量不确定度的评定[J].化
学分析计量,2004,13(6) [9]郭兰典,等.仪器分析中线性回归标准曲线法分析结果不确定 度评估[J].检验检疫科学,200l(4) [10]罗颖.一元线性回归系数比值不确定度的评定[J].赣南师范 学院学报,2011(6) [11]唐象能,戴俭华.数理统计[M].北京:机械工业出版 社,1994 [12]宋妲音,等.化学检测实验室线性最小二乘法校准的不确定度 评定[J].环境监测管理与技术,2003(6) [13]金正一,李风岐.一元线性参数最小二乘法中斜率及截距的不 确定度.沈阳工业学院学报,2000,19(1)
(o,6)=一1。
由于方法I中截距口和斜率6的相关性是通过 统计学推导得出的,由式(7)得到的线性回归不确 定度也更为科学合理,为《指南》等权威参考资料所 采用。而方法Ⅱ和方法Ⅲ中,在缺乏理论依据的基 础上,为了方便计算分别直接采用截距口和斜率6 为正强相关或不相关,这是不科学的,需要摒弃。
・65・
简化为:
方法I
《化学分析中不确定度评估指南(CNAS・GL 的被测样戈删的不确定度Ⅱ(z删)为[1’3]:
2:
2006)》(下文简称《指南》)指出,由线性回归引人
咖一=刮寺+杰+竿(14)
在有些文献中,甚至认为线性回归引入的不确 定度只包括截距口和截距6所引入的不确定度,所 以,式(13)中不包括M(y)部分‘7’81。 除了以上三种方法,郭兰典等人一。将最小二乘 法中n和6的计算公式分别代人式(8),然后,再按 照方法II的步骤,展开计算M(戈涮),但该方法计算 过程非常复杂,缺少可读性,应用实例很少,这里不
M2
3几种评定方法的区别
《材料》案例归纳的三种方法,也是广泛应用于 各类线性回归不确定度评定参考文献的方法,但三 种方法的结果是否有差异,并未引起大家的重视。 从式(7)、式(12)和式(14)可以看出,三种方法得 到的u(髫。。。)的计算公式结构相似,但内容不完全相 同,导致数值和变化趋势上存在显著差异。
1
。∑洲 。∑H
,L
鬈 一V
一 一筇
2
、,
=
mLeabharlann 。∑川,k筇
一
一X
、,
m【弦一告c和2】
㈤
值得注意的是,很多参考资料中计算公式的不 统一和错误,是由于混淆了式(2)和式(3)而引起 的。下面讨论的情景,都针对每个溶液测量m次的 情况,即下面涉及的L。。计算公式均选用式(3)。利 用式(1)确认的线性关系,根据被测样品中被分析 物产生的响应值(用y。h表示),可求得其对应的浓
doi:10.3969/i.issn.1000一0771.2016.11.20
O
引言
基于最小二乘法原理的线性回归是化学分析
£。为戈的方差,则‘1 3|:
k。;(戈i一习2 2荟zi2一寺(善菇i)2
(2)
中常用的一种方法,通过建立被测样与响应值的线 性关系,可快速实现被测样的间接测量。由最小二 乘法拟合得到曲线和相关参数的不确定度,是评定
参考文献
[1]中国合格评定国家认可中心,等.材料理化检验测量不确定度 评估指南及实例(cNAs—GL 10:2006)[M].北京:中国计量出版 社,2007 [2]李慎安,等.化学实验室测量不确定度[M].北京:化学工业出 版社,2006
(cNAs.GL 2:2006)[s]
[4]cn’Ac/EuRACHEM istry[S].2002
唧¨p圳一———————1厂—————一
(15)
,、var(儿bs)+var(a)+菇■・var(6)+‰・covar(口,6)
其中:M(石,red)=√var(戈畔。),M(口)=/var(口),
u(6)=√var(6)。 该步骤和方法Ⅱ一样,是通过对式(8)展开,再 利用已有的u(o)、u(6)公式代人,但是不同的是, 关于a、6的相关性部分,是利用协方差来表示,且统 计学表明,他们之间的协方差¨0。11]:
万方数据
■瞄目甚圈翟圈
[3]中国合格评定国家认可委员会.化学分析中不确定度评估指南
5结论
目前,线性回归引起的线性回归结果不确定度 的评定存在至少三种方法,这些方法评定结果的大 小、变化趋势都明显不同。分析表明,这些方法都 是基于截距。和斜率6不确定度统计结果基础上, 对z的计算公式通过传统的不确定度分析方法展开 得到的,产生分歧的根源在于对截距口和斜率6的 相关性取值不同。简单认为两者正强相关或不相 关都是不科学的;统计学表明二者负相关,且相关 程度与戈的取值有关,在此基础之上建立的线性回 归结果不确定度M(戈。。。)公式才更为科学的。
(薏)u(。)×(嘉)M(6)>o,所以式(12)的数值>式
(14)的数值,又显然式(14)的数值>式(7)的数 值,所以,在戈≥0的条件下,可以得到不确定度数值 大小:方法Ⅱ>方法Ⅲ>方法I。 3.2变化趋势的差异 根据方法I对应的式(7),菇。捌越接近校准曲线 中点i时,Ⅱ(石。。。)越小;当被测样品的浓度越偏离 校准曲线中点时,由线性回归得到的样品浓度值的 不确定度将增大,如图1所示。这与实践经验相吻 合,为了提高测量准确性,需要对样品进行稀释或 浓缩,或根据目标浓度重新制定校准曲线,使得被 测样尽量落在校准曲线的中部。 相比之下,方法Ⅱ对应的式(12)和方法Ⅲ对应 的式(14),当x。捌>0时,戈,酬越接近于0,u(戈删)越 小,如图l所示。
(4) 利用统计方法经数学推导可得,回归方程的斜 率6和截距n的不确定度为m2,13]:
再嘻互孕㈣,
一般认为,),残差的标准差s,是u(y)的重要组 成部分。因为本文只讨论线性回归引人的不确定 度,所以,可认为“(y)=s,;如果测量结果取p次观 测值的平均值作为菇删时㈨,则可认为
啪)剐,去
厂丁——歹
重点。
・63・
其中n和6分别为校准曲线的截距和斜率,其 值可通过各校准点(石i,),;)由最小二乘法获得。如 果校准曲线共有n个溶液,每个溶液测量1次,若设
万方数据
2线性回归结果不确定度的几种评定方法
回归曲线的标准差(也称为,,残差的标准差) s。为‘l'2]: 得到:
÷×H(口)】2
(9)
如果将式(5)和式(6)代人式(9),则可以
c戈,=(雾)‘“2 cy,+(薏)‘M2 cⅡ,+(嘉)‘Ⅱ2 c6,+ 2×r(小)×(薏)u㈤×㈢M(6)
=[寺州y)]2+[一铲×u(6)-
・64・
万方数据
■豳冒重豳圜盈■
3.1数值大小的差异 由于方法Ⅱ认为r(口,6)=1,2×r(口,6)× 差var(o)、var(6)以及它们的协方差covar(口,6)是 由最小二乘法获得,戈的方差var(z)通过式(8)展开 得到"j:
10:
和方法Ⅱ一样,对式(8)展开,但是认为口和6 不相关,即r(口,6)=O,得到¨’61:
M2(髫)=(考)‘u2(y)+(耋)‘M2(口)+(嘉)‘M2(6)
(13)
2006)》¨o为例,其第五章给出了多个涉及线性回归 不确定度的评定案例,就可归纳出三种评定方法。
2.1
结合式(5)、式(6)和式(11),式(13)可进一步
covar(口,6)=一}・s; L“
(16)
如果对数据以及var(y。。。)是基于s,的p次测 量(式(12)),则式(15)变为:
V吣删,=吾睁忐+与≠】(17,
由于“(戈pfed)=√var(z,州),所以式(17)等同
于式(7)。因此,式(7)也是通过对式(8)利用传统 的不确定度分析方法展开后得到的,只是根据统计 学结论,口和6相关,但r(o,6)并不简单的取1或 0。根据式(7)和式(9)(前部分)推导得到:
r(o,6)=一亡
√石‘
(18)
图l
三种方法中线性回归结果不确定度变化趋势
K
为了判断r(口,6)值的大小,令K=戈2一孑,则
4几种评定方法分歧的根源
对于存在几种线性回归不确定度评定方法的 原因,文献[12]认为,这是由于应用者简单的对标 准不确定度分量进行了合成,而未考虑其相关性, 如斜率6与(戈,),)值有关,测量标准溶液和实际样 品时使用同一台测量仪器等。该观点过于简单,并 未能真正揭示几种方法区别的根源。 《指南》附录E旧。中给出了式(7)的简单推导步 骤,但是,由于使用了大量统计学公式和方法,推导 过程深奥,且省略了若干重要的统计学公式,对于 未专业学过统计学的化学分析和计量工作者来说, 较难理解。不过,我们发现正是这个推导过程,可 以揭示三种方法分歧的根源。 根据《指南》附录E,假设n和6的值,它们的方
㈣
“(y):芒
~p
(11)
则式(10)可进一步简化为:
一,√;再五+瓦
(6)
咄一鲁乒+电乎m,
2.3方法Ⅲ
其中式(4)~式(6)是基于统计学得到的结果, 为大部分参考文献¨‘12 3所认同和引用。但对于线 性回归引人的被测样石删的不确定度的评定方法 上,不同参考文献产生了分歧,以《材料理化检验测 量不确定度评估指南及实例(CNAS.GL
础删,=詈√古+杰+%}㈩
其中,p为被测样测量次数。
2.2方法Ⅱ
根据式(1)可得
戈=2亍(或铀=竿)
,)
…
D
(8)
进行讨论。本文将重点讨论方法I~方法Ⅲ的