第二章:精度指标与误差传播内容及学习要求本章详细讨论偶然误差分布的规律性,衡量精度的绝对指标-中误差,相对指标-权及其确定权的实用方法;方差、协因数定义及其传播律等问题。
本章内容是是测量平差的理论基础,也是本课程的重点之一。
学习本章要求深刻理解精度指标的含义,掌握权、协方差、协因数概念,确定权及根据已知协方差、协因数的观测值求其函数的方差、协因数的方法(协因数、协方差传播律)。
§2-1概述概括本章内容,其主线是偶然误差的统计规律→衡量单个随机变量的精度指标-方差→衡量随机向量的精度指标-协方差阵→求观测值向量函数的精度指标-协方差传播律→精度的相对指标-权。
§2-2偶然误差的规律性本小节阐述偶然误差的统计规律性,提出偶然误差服从正态分布的结论任何一个观测值,客观上总是存在一个真正代表其值的量,这一数值就称观测值的真`值。
从概率统计的观点看,当观测量仅含偶然误差时,真值就是其数学期望。
某一随机变量的数学期望为:ini ip x X E ∑==1)( 或 ⎰+∞∞-=dx x xf X E )()(期望的实质是一种理论平均值,可用无穷观测,以概率为权,取加权平均值的概念理解.dx x f )(表示x 出现在小区间dx 的概率。
设对n 个量进行了观测,观测值为。
、、、n L L L ⋅⋅⋅21其相应的真值分别为。
、、、n L L L ⋅⋅⋅21令i i i i L L ∆-=∆,即真误差。
由于假定测量平差所处理的观测值只含偶然误差,所以真误差i ∆就是偶然误差。
用向量形式表述为:⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡⋅=⨯n b L L L L 211、⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎣⎡=⨯n n L L L L..211、⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡∆∆∆=∆⨯n n .211 则有:111⨯⨯⨯-=∆n n n L L注意:本教程中凡是不加说明,即没有下标说明的向量都是列向量,若表示行向量则加以转置符号表示,如:TTTB A L 、、等。
对单个的偶然误差而言,大小和符号都没有规律,及事先完全不可预知。
但从大量测量实践中知道,在相同的观测条件下,偶然误差就总体而言,有一定的统计规律,表现为如下几点:1、 误差绝对值有一定限值2、 绝对值小的比大的多3、 绝对值相等的正负误差出现的个数相等或接近。
教材中分别列举两个实例,以358和421个三角形闭合差的分析结果验证了上述结论(闭合差是理论值与观测值之差,故是真误差)。
注意:统计规律只有当有较多的观测量时,才能得出正确结论。
为了形象地刻画误差分布情况,以横坐标表示误差的大小,纵坐标采用单位区间频率(出现在某区间内的频率,等于该区间内出现的误差个数i v 除误差总个数n ,而采用单位频率iind V ∆为纵坐标值,使曲线(直方图)趋势不因区间间隔不同而变化)。
根据统计规律可知,在相同条件下所得一组独立观测值,n 足够大时,误差出现在各个区间的频率总是稳定在某一常数(理论频率)附近,n 越大;稳定程度越高。
n 趋于∞,则频率等于概率(理论频率)。
令区间长度0→∆d ,则长方条顶形成的折线变成光滑曲线,称概率曲线。
由其曲线特征知,这是正态分布曲线。
于是得到结论:偶然误差服从正态分布,或偶然误差的频率分布,随n 逐步增大,以正态分布为极限。
说明了偶然误差服从正态分布后,可进一步用概率术语来概括偶然误差的几个特性。
1、 在一定条件下,超过一定限值的误差出现的概率为0 2、 绝对值小的误差比绝对值大的误差出现的概率大 3、 绝对值相等的正负误差出现的概率相等 4、 偶然误差的数学期望等于0前3个特性本质上与前述3个统计特性相同,后者仅仅是观测值个数无穷大时的理想状态下,以偶然误差的极限分布-正态分布的特征来描述同样的特性而已。
第四个特性从正态分布曲线以过0点的竖直轴为对称轴来看,是很自然的。
§2-3衡量精度的指标本小节阐述误差概念及几种精度指标 对一系列观测值而言,不论其观测条件如何,也不论是对同一量还是不同量进行观测,只要这些量是在相同条件下独立观测的,则产生的一组偶然误差必然具有上述4个特性。
如前所述,偶然误差服从正态分布,其概率密度函数为:222222))((2121)(σσσπσπ∆-∆-∆-==∆e ef E 或记为:∆~),(20σN 。
根据概率密度函数可见,最大值为σπ21)0(=f 。
其大小与σ成反比,由于对于一个必然事件,概率值为1,即概率密度曲线与横轴围成的面积值为1,因而f(0)越大,概率密度曲线形状越陡峭,反之则越平缓。
而σ小则f(0)大,σ大则f(0)小,所以σ决定了曲线的形状,σ为方差的平方根,称标准差,其估值在测量平差中称为中误差。
对于形状陡峭的图形,很显然随着误差绝对值的加大,概率值迅速地减小,也可说偶然误差更集中地分布在真值(0)附近,称误差分布离散度小、反之,对于形状平缓的图形,偶然误差分布较为分散,或者说离散度大。
不难理解,离散度小时,对应的观测值质量较好,或说精度高。
反之,离散度较大时,对应的观测值质量较差,精度较低。
由此可见,精度又可以定义为误差分布的离散程度。
两个(组)观测值对应的误差分布相同,则称同精度观测值,同理若误差分布不同,则是精度不同。
在相同观测条件下进行多个观测量的观测,各观测量对应同一种误差分布,各观测值都是同精度观测值。
注意:同精度观测值不等于真误差相同,这是因为真误差不可知,因而不可能以真误差大小定义精度,我们只能定义观测条件相同,精度相同。
所以对应于同一种误差分布的各观测值,尽管真误差不同,但都称为同精度观测值。
由于用观测值对应的误差分布来衡量精度高低,麻烦而且困难,测量上采用能描述其误差分布离散程度的数字指标作为衡量精度的指标。
下面介绍几种常见的精度指标。
一、方差和中误差方差即真误差平方的理论平均值,表达式为:∆∆∆=∆=∆=⎰∞∞-d f E D )(222)()(σ。
(0=∆)(E )如前所述,σ决定误差分布曲线的形状,反映误差的离散程度,所以可作为精度指标。
此外,根据方差的定义,可见方差实际上是偶然误差平方的理论平均值,或者说是以概率值为权,无穷观测条件下的加权幂平均。
对等精度的观测值而言,方差的计算可按下式进行:∑∑∑⎰=∞→=∞→=∞→∞∞-∆=∆=∆∆∆=∆∆∆=nk kn Nk k kn k k nk kn n n V d f d f 12)3(12)2(12122lim lim )(lim )()(σ 。
(A ) 对于观测值有限的实际情况:只能求得标准差的估值中误差 n ][∆∆=∧σ。
今后不再区分标准差和中误差,统称中误差,用σ表示。
注意公式(A )中等号(1)根据定积分的定义,在n →∞,0→∆k d 时成立。
等号(2)成立是根据观测值数(样本数)n →∞时,频率即等于概率的原理,用n V K代替了k k d f ∆∆)(,等号右边累计号∑上限大写N ,是划分的区间数。
等号(3)成立是将nVK 展开的结果,如果将n 1解释为每个误差出现的概率,不等于绝对值大小的误差出现的机会相同(概率相等),因为较小的k ∆出现的次数较多。
二、平均误差在一定的条件下,一组独立的偶然误差绝对值的数学期望称平均误差,设以θ表示,则有:∆∆∆=∆=⎰∞∞-d f E )()(θ. 同理可有:[]nn ∆=∞→limθ定义中一定条件下,在这里实指消除了系统误差法的相同观测条件下。
独立的偶然误差指各个误差的大小、符号互不影响,一般而言,独立观测,误差独立。
对照中误差是偶然误差平方的理论平均值的算术根,知平均误差与中误差定义的出发点都是避免偶然误差直接取理论平均值为0,下式可以证明两者之间存在固定的比例关系:σπσπσπσπθσσσ222212)(2)(0202202222=⎥⎥⎦⎤⎢⎢⎣⎡-=-=∆∆=∆∆∆=∆∆∆=∞∆-∞∆-∆-∞∞∞∞-⎰⎰⎰⎰e ded ed f d f可见两种精度指标是完全等价的,即分别用两种精度指标衡量观测值及其函数的精度,结果相同。
同理,在观测数有限的情况下,也只能得到平均误差的估值。
三、或然误差ρ或然误差ρ又称概率误差,其定义为:在一定的观测条件下,偶然误差落入对称区间(-ρ,ρ)中的概率为二分之一,即:21)()(=∆∆=≤∆≤-⎰-ρρρρd f P 显然,对于陡峭的误差曲线,给定概率值为1/2的条件下,ρ 较小,反之则较大。
所以ρ 也能较好地反映精度的高低。
令,t =∆σ则有:dt d t σσ=∆=∆,.dt ed et 22222121--∆--⎰⎰=∆σρσρσρρππ.t 是服从标准正态分布的随机变量。
根据标准正态分布概率积分表可得:ρσσ326750.0≈≈.由此可见,或然误差与中误差也存在固定的比例关系,所以作为衡量精度的指标,理论上是等价的。
同样地,由于观测值数量有限,不可能求得或然误差.实用上是将偶然误差按绝对值大小排序,n 为奇数时取中间值,n 为偶数时取中间两个的平均值作为ρ的估值。
理论上三种精度指标是等价的,但当n 不够大时,精度估值均不太不可靠。
实践表明∧σ对较大真误差的影响较为灵敏,目前世界各国都采用∧σ作为衡量精度的指标。
四、极限误差极限误差本身不是一种误差指标,而是在一定观测条件下,以中误差为标准确定的,不大可能出的误差绝对值。
根据标准正态分布概率积分表,∆落入区间(-σ,σ)、(-2σ,2σ)、(-3σ,3σ)的概率分别为:68.3%、95.5%、99.7%。
由此可见,出现绝对值大于2-3倍中误差的偶然误差属于小概率事件。
通常小概率事件在实践中被认为是不大可能发生的,所以在测量工作中,通常根据实践确定中误差的估值,而以二倍或三倍中误差作为外业成果检核的标准,超过即视为不合格。
如三角测量时以三角形闭合差超过一定限值视为不合格等五、相对误差同样的,相对误差严格说也不是一种精度指标,而是观测值或其函数值的中误差作分子、观测值或其函数值作分母的比值。
一般而言,一些与长度有关的观测值或其函数值,单纯用中误差还不能区分出精度的高低,所以常用相对误差。
相对误差没有单位,测量中一般将分子化为1,即用N1表示。
对应的,真误差、中误差、极限误差等都是绝对误差。
§2-4协方差传播律本小节阐述由观测值(随机向量)的方差-协方差矩阵求观测值函数的方差-协方差的问题,即定义观测值向量与其函数的方差协方差矩阵之间的运算关系。
一、协方差设有观测值X 、Y ,X 、Y 都是随机变量,则它们之间的协方差定义为:))}())(({(Y E Y X E X E xy --=σ对于离散型随机变量: ij j n injin xy P Y E Y X E X))())(((lim--=∑∑∞→σij P 是(),j i Y X 同时出现的概率。