当前位置:文档之家› 基于最小二乘法的数据处理问题研究综述

基于最小二乘法的数据处理问题研究综述

基于最小二乘法的数据处理问题研究综述摘要:对基于最小二乘法的数据处理方法进行了介绍。

首先对传统最小二乘法基本原理进行了介绍,然后根据例子来说明怎样运用传统最小二乘法来解决实际辨识问题。

而且本文针对传统最小二乘存在的缺陷进一步阐述了一些改进型最小二乘法,综述了最小二乘法的研究现状,最后对最小二乘的发展趋势做了预测。

关键字:最小二乘法数据处理改进型最小二乘法发展趋势1引言在科学实验中经常要把离散的测量数据转化为直观的便于研究的曲线方程,即曲线拟合[1]。

由于在实验室或实际应用中,误差是不可避免的,所以为了不把原有离散数据中的误差引入,人们经常用拟合来确定模拟函数。

拟合方法不要求模拟函数通过已知离散的点,而追求的是所有点到模拟函数达到某种误差指标的最小化,是一种整体上的逼近性质。

最小二乘法是解决这类曲线拟合中一种较为常用的方法,根据最小二乘法的定义[2]:“最小二乘法是一种数学优化技术,它通过最小化误差的平方和寻找数据的最佳函数匹配。

”最小二乘法是从误差拟合角度对回归模型进行参数估计或系统辨识,因此最小二乘在参数估计、系统辨识以及预测、预报等众多领域中得到极为广泛的应用。

本文在阐述最小二乘法理论的基础上对于其在实际问题中的辨识应用做了简单介绍,并指出实际应用中存在的不足,列举了几种改进型的最小二乘算法来进行优化比较,最后给出了最小二乘法的发展趋势。

2 最小二乘法的理论基础及应用 2.1最小二乘法的理论基础最小二乘法作为一种传统的参数估计方法,早已经被大家所了解。

然而大多同学对最小二乘法的认识都比较模糊,仅仅把最小二乘法理解为简单的线性参数估计。

事实上,最小二乘法在参数估计、系统辨识以及预测、预报等众多领域都有着广泛的应用[3]。

特别是针对动态系统辨识的方法有很多[4],但其中应用最广泛,辨识效果良好的就是最小二乘辨识方法,研究最小二乘法的应用在就要对其基本原理有较为深刻的理解。

下面是一般的最小二乘法问题:求实系数线性方程组11112211211222221122.........00 0n n n n m m mn n m b b b a x a x a x a x a x a x a x a x a x ++-++-++-⎧+=⎪+=⎪⎨⎪⎪+=⎩ (1)方程组可能无解。

即很可能不存在一组实数x 1,x 2,……,x n 使2112120()i i in n i mi a x a x a x b =++⋯+-=∑ (2) 恒成立。

因此我们转而求其次,设法找到实数组 x 1,x 2,…,x n 使误差的平方和最小,这样的 x 1,x 2,…,x n 称为方程组的最小二乘解,这样问题就叫最小二乘法问题[5]。

2.2 最小二乘法的应用举例理论只有被利用才能体现其价值意义,下面我就以系统辨识中的最小二乘法的例子为大家讲讲怎样在实际中应用最小二乘法解决辨识问题。

考虑如下图1中的线性系统:()()()()()() 1111a bn a n bz k a z k a z k n bu k b u k n e k +-++-=-++-+(3)其中,u(k)为系统激励信号,y(k)为系统输出,e(k)为模型噪声。

其系统模型如图1所示:图1 SISO的系统模型结构图其中G(z-1)是系统函数模型,N(z-1)为有色噪声系统模型,e(k)为白噪声v(k)经过系统函数为N(z-1)的系统后的输出[6]。

通常()()()()()()111111,B z D zG z N zA z C z------==(4)式中:()()11212112121aabbnnnnA z a z a z a zB z b z b z b z--------⎧=++++⎪⎨=+++⎪⎩(5)()()11212112121ccddnnnnC z c z c z c zD z d z d z b z--------⎧=++++⎪⎨=+++⎪⎩(6)则系统可表示为:()()()()()()()1111B z D z z k u k v k A zC z----=+(7)设样本和参数集为:1212()[-(-1) , -(-2), ...... -(-), (-1),(-2), ......, (-)][,,......,,,,......,]TTn n h k z k z k z k n u k u k u k n a a a b b b θ⎧=⎨=⎩(8) h(k)为可观测的量,差分方程可写为最小二乘形式()()()T z k h k e k θ=+ (9)那么如何在系统噪声e(k)存在的情况下从该方程中正确的解出θ,即是系统辨识的任务。

为了求出θ,我们面临三大问题:一是输入信号的选择,二是判决准则的选取,三是辨识算法的选择,下面一一探讨。

一.选择输入为了准确辨识系统参数,我们对输入信号有两大要求,一是信号要能持续的激励系统所有状态,二是信号频带能覆盖系统的频带宽度。

除此之外还要求信号有可重复性,不能是不可重复的随机噪声,因此我们通常选择M 序列或逆M 序列作为输入。

二.准则函数因为本文主要探讨最小二乘方法,在此选取准则函数()()()()2211Tk k J e k z k h k θθ∞∞==⎡⎤==-⎡⎤⎣⎦⎣⎦∑∑ (10)使准则函数()min J θ=的θ估计值记做LS θ,称作参数θ的最小二乘估计值。

在式(7)中,令k=1,2,3,……L ,可构成线性方程组:()()()TL L L z k H k e k θ=+ (11)式中()()()()()()()()()()()()()()()()()()1122, 010*******L L a b a b L a b z e z e z e z L e L z z n u u n z z n u u n H z L z L n u L u L n ⎡⎤⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥==⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦⎣⎦----⎡⎤⎢⎥----⎢⎥=⎢⎥⎢⎥------⎢⎥⎣⎦准则函数相应变为:()()()()()()2211LLTTL L L L k k J e k z k h k z H z H θθθθ==⎡⎤==-=--⎡⎤⎣⎦⎣⎦∑∑ (12)极小化()J θ,求得参数θ的估计值,将使模型更好的预报系统的输出。

三.最小二乘算法实现辨识 设LS θ使得()min J θ=,则有()()()0LSTL L L L J z H z H θθθθθθ∂∂=--=∂∂ (13) 展开上式,并根据以下两个向量微分公式:()()2 TT TT a x a xx Ax x A A x∂=∂∂=∂为对称阵 (14)得正则方程: ()T TL L LS L L H H H z θ= (15) 当T L L H H 为正则阵时,有()1T TLS L L L L H H H z θ-= (16)且有()2220LSTL L J H H θθθ∂=>∂,所以满足式(16)的LS θ唯一使得()min J θ=,这种通过极小化式(12)计算LS θ的方法称作最小二乘法。

而且可以证明,当噪声e(k)是均值为0的高斯白噪声时,可实现无偏估计。

3 最小二乘法改进型3.1传统最小二乘存在的问题最小二乘法存在一些缺陷制约着最小二乘法的应用,在处理日益复杂的参数估计、系统辨识等问题中,最小二乘法在系统辨识中存在的缺陷逐渐显现出来。

如传统的最小二乘法不适合在动态辨识系统中使用,而且其参数估计存在偏差,耗时较长等问题,因此,随着科学技术的发展,涌现出了很多改进型的最小二乘法。

3.2递推最小二乘算法为了减少计算量,减少数据在计算机中占用的内存,并实时辨识出系统动态特性,我们常利用最小二乘法的递推形式[7]。

下面我们来推导递推最小二乘算法的原理。

首先,将式(12)的最小二乘一次完成算法写为()()()()()()1111T T T WLS L L L L L LL L Ti i H H H z P L H z h i h i h i z i θ--====⎡⎤⎡⎤=⎢⎥⎢⎥⎣⎦⎣⎦∑∑ (17)定义()()()()()()11111111kT Tk k i k T T k k i P k H H h i h i P k H H h i h i -=----=⎧==⎪⎪⎨⎪-==⎪⎩∑∑ (18) 式中()()()()()()11122 1T T T T k k T T h h h h H H h k h k -⎡⎤⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥==⎢⎥⎢⎥⎢⎥⎢⎥-⎢⎥⎢⎥⎣⎦⎣⎦(19) 式中,h(i)是一个列向量,也就是H L 的第i 行的倒置,P(k)是一个方阵,它的维数取决于未知参数的个数,假设未知参数的个数是n ,则P(k)的维数是n ×n 。

由式18可得P(k)的递推关系为:()()()()()()()()11111k T T i T Pk h i h i h k h k P k h k h k --=-=+=-+∑ (20)设()()()()()()11,2,,11,2,,T k Tk z z z z k z z z z k -⎧=-⎡⎤⎪⎣⎦⎨=⎡⎤⎪⎣⎦⎩ (21) 则()()()()()111111111T T k k k k k i k H H H z P k h i z i θ------=-=⎡⎤=-⎢⎥⎣⎦∑ (22)由此可得:()()()()11111k i P k k h i z i θ--=--=∑ (23)由式20和21可得()()()()()()()()()()()()()()()()(){}()()()()()()111111111k T Tkk k ki T T k H H H z P k h i z i P k P k k h k z k P k P k h k h k k h k z k k P k h k z k h k k θθθθθ-=--⎡⎤==⎢⎥⎣⎦⎡⎤=--+⎣⎦⎡⎤=--+⎣⎦⎡⎤=-+--⎣⎦∑ (24)引进增益矩阵K(k),定义()()()K k P k h k = (25)式24可以进一步写为()()()()()()11Tk k K k z k h k k θθθ⎡⎤=-+--⎣⎦(26) 接下来可以进一步把式21写为()()()()111TP k P k h k h k --⎡⎤=-+⎣⎦ (27)利用矩阵反演公式()()111111TTT A CCA A C I C A C C A ------+=-+将式(27)演变成()()()()()()()()()()()()()()()()1111111111T TT T P k P k P k h k h k P k h k P k h k P k h k h k I P k h k P k h k -⎡⎤=-----+⎣⎦⎡⎤-=--⎢⎥-+⎣⎦(28)将上式代入式25,整理后可得()()()()()()1111TK k P k h k h k P k h k -⎡⎤=--+⎣⎦ (29)综合式26、28和29可得最小二乘递推参数估计算法RLS()()()()()()()()()()()()()()()()1111111T TT k k K k z k h k k K k P k h k h k P k h k P k I K k h k P k θθθ-⎧⎡⎤=-+--⎣⎦⎪⎪⎡⎤=--+⎨⎣⎦⎪⎡⎤=--⎪⎣⎦⎩3.3广义最小二乘法广义最小二乘法的处理过程如下[8],设SISO 系统采用如下模型:()()()()()()1111A z z kB z u k v kC z ---=+(30)其中A(z -1),B(z -1)和C(z -1)的定义见式5和6。

相关主题