当前位置:文档之家› 短期风电功率预测误差综合评价方法

短期风电功率预测误差综合评价方法

短期风电功率预测误差综合评价方法徐 曼,乔 颖,鲁宗相(电力系统国家重点实验室,清华大学电机系,北京市100084)摘要:对短期风电功率预测误差进行综合评价是改进预测精度、指导预测结果合理应用的前提。

当前风电功率预测误差评价主要采用均值类指标,无法全面、准确反映预测系统的运行情况。

文中总结了风电功率预测误差的主要存在形式,提出了一套包含纵向误差、横向误差、相关因子与极端误差等在内的综合评价方法。

基于内蒙古某风电场实际数据,采用该方法对不同预测方法、预测系统的不同误差环节进行了较为全面的评价,验证了评价指标的指导价值。

关键词:短期风电功率预测;误差评价;误差指标;数值天气预报收稿日期:2011-01-08;修回日期:2011-03-25。

国家自然科学基金资助项目(51077078)。

0 引言有效利用短期风电功率预测技术可以减轻风能波动对电力系统调度的不利影响,是实现风电常规化、规模化并网的关键。

对短期风电功率预测误差进行综合评价是风电功率预测理论研究的一项重要内容。

根据评价指标,可以从各方面了解预测系统的运行情况,深入挖掘有价值的信息,对不同预测方法、预测系统进行对比评价,从而提高预测精度和算法效率,更好地利用预测结果服务生产实际。

目前各类短期风电功率预测方法,如时间序列法[1]、神经网络法[2]、小波分析法[3]等,所使用的误差评价指标多直接采用常规统计学指标,结合预测曲线的图像对比,便构成了预测结果的分析评价依据。

已有研究中常用的误差评价指标主要有绝对误差均值(mean error,ME)、绝对值平均误差(meanabsolute error,MAE)、均方根误差(root meansquared error,RMSE)、平均相对误差(meanrelative error,MRE)、误差频率分布指标等,其中RMSE,MAE,MRE是现行企业标准[4]和推荐的行业标准[5],也为多数文献采用[3,6-7]。

文献[8-9]兼用多个上述指标来对比预测结果,每种指标数值排序相同,得出的最优方案结论也一致。

文献[10]除了采用指标MAE和RMSE外,还利用误差频率分布指标给出了误差小于20%装机容量的概率。

ANEMOS预测系统的一项分析报告肯定了制定预测误差综合评价方法的重要性[11],但所给指标也是预测领域的通用指标,没有体现风电功率预测自身特点。

总的来讲,目前全面评价风电功率预测误差的研究还很少,缺乏长期大量的数据分析,难以用来研究风电功率预测系统的误差产生机理。

在欧美商业化风电功率预测应用中,电网使用综合预测或多个预测产品已经成为一种趋势[12-13]。

上述指标虽然统计方法有所不同,但都是对预测结果偏差的平均化,指标所隐含的信息是类似且单一的,指标相近的风电功率预测模型之间个体差异可能很大,对工程应用或者算法改进的指导意义也较小。

此外,与负荷预测相比,风电功率预测结果波动性更强、误差带更宽,与实际结果具有时间相关性,很多在负荷预测中广泛应用的指标并不能充分体现风电功率预测的特性。

本文的目的在于结合风速波动性特点及相应的输出风电功率变化特点,提出一套针对短期风电功率预测系统的误差综合评价指标。

该指标由横向误差、纵向误差与极端误差3类评价指标构成,可以对预测误差的平均化水平、分布情况、相关因子和极端案例作出较为全面的评判,有利于预测系统用户和预测算法研究人员合理判别和使用预测结果。

为了贴近实际工程应用,本文选取内蒙古某风电场2010年上半年的实测数据和数值天气预报(numerical weather prediction,NWP)数据进行详细误差分析,并在此基础上给出了若干借助误差评价指标提高预测水平的案例。

1 预测误差的综合评价体系1.1 预测误差的存在形式风电功率预测的误差可以划分为纵向误差和横向误差[14],如图1所示,其中纵向误差主要描述了某一时段的预测结果在竖直方向与实际结果的差别,往往可以用偏大或偏小概括;而横向误差则主要描述预测结果在水平的时间轴上与实际结果的差—02—第35卷 第12期2011年6月25日别,概括地说就是预测序列峰值的超前或滞后。

单纯的纵向误差可以通过系统误差修正或误差时间序列统计等手段得到明显改善。

从概念上讲,纵向误差的单位是预测量本身的单位,横向误差的单位是时间,但在很多误差指标中,如ME,MAE,RMSE,MRE等,横向误差往往被归算至纵向误差中。

nP(2)式中:P为风电场额定容量;n为样本数量。

需要说明的是,文献[4]中P采用平均开机容量,由于该数值难以准确计算,本文采用额定容量来替代。

一般来讲,如果某一段预测结果中同时存在较大的正误差和负误差,由于正负相抵,反映在ME上,将是一个较小的数值。

这种情况的存在,有可能导致对预测效果的错误判断,因此ME一般不会作为单独的误差指标,需要与其他误差评价指标配合使用[15]。

2)MRE,指标定义如下式所示,该指标将误差除以相应的真值进行规范化,以便相互比较。

eMAE=∑eiyin(3) MRE指标需要将绝对误差逐点与实测值相比,这种处理方法一直应用于电力系统负荷预测的误差评价,也曾为一些标准意见稿[5]所沿用,但该指标在风电功率预测中的实用性有待商榷。

这种评价方式在负荷预测中是可行的,因为作为基值的负荷实测值最低至负荷谷值;而在风电功率预测中,由于风的间歇性,实际出力可能低至0,即使较小的绝对误差也会得出很大的相对误差,将导致MRE太大而丧失指导意义。

3)MAE,指标定义如下式所示,该指标是对预测误差平均幅值的评价。

eMAE=∑|ei|nP(4) 4)RMSE,指标定义如下式所示,可以用来衡量误差的分散程度。

eRMSE=1P∑e2i槡n(5) 指标MAE和RMSE不存在正负抵消的问题,易于计算,对于预测系统的整体性能评价十分重要,它们可以用来监视预测系统的长期运行状态,对系统误差特性进行“宏观”评价。

以上误差指标构成了经典的基于逐点求和再平均思想的误差测量方式,目前几乎所有的短期风电功率预测研究都用到了其中的某一种或某几种的组合来评价预测结果。

但是,这类指标都仅仅给出了针对某一段数据序列笼统的指标结果,丢失了许多有利用价值的信息。

图2给出了2个时段(24h)预测序列与实测序列比较结果,表1给出了上述4个误差指标数据。

从图2来看,虽然时段1和时段2的eMAE和eRMSE几乎一致,但二者的误差类型显然不同,时段1以纵向误差为主,时段2则存在明显的错—12—·绿色电力自动化· 徐 曼,等 短期风电功率预测误差综合评价方法报现象。

误差类型的不同,一方面对应不同的预测修正手段,另一方面在实际生产中造成的后果也是有差别的,而这些信息都是传统的平均化误差指标很难给出的。

%1-16.215 2 78.54 23.699 1 26.970 42 20.991 5 8 139.00 22.156 1 27.542 01.3 多指标的误差综合评价体系建立多指标的短期风电功率预测误差综合评价体系是对原有误差评价指标的发展和提高,综合评价指标应能涵盖多方面信息,从不同形式、不同预测环节、不同相关因子、不同预测模型、不同预测粒度、不同电力系统应用等多个角度分析预测误差的产生机理和不同特性。

本文主要按误差形式分类,兼顾其他误差研究需求,提出如下评价指标体系。

1.3.1 纵向误差指标这类误差指标从ME,MAE,RMSE等指标发展而来,描述了横向误差归算之后的系统综合纵向误差情况:1)MAE和RMSE保留其作为“宏观指标”,长期监测预测系统整体运行性能的作用。

2)误差频率分布指标这项指标是对指标ME的改进,以频率分布直方图的形式替代了原有的求平均过程,如图3所示。

误差频率分布指标保留了ME指标衡量系统是否无偏的作用,此外,它还具体给出了预测结果误差带的分布情况。

目前风电功率预测的精度还很有限,预测误差带的分布可以帮助调度运行人员合理判断风电功率预测结果的可信程度,更加有把握地利用预测结果。

对于预测系统研发人员来说,误差频率分布对零点的集中程度可以作为不同预测算法间比较选择的依据。

%风速预报模型拟合功率预报样本总量0~4 13.365 8 1.905 1 20.300 0 1 5014~14 10.299 4 2.867 1 23.063 9 7 053>14 15.824 2 3.820 1 27.485 7 333全风速段11.123 9 2.772 0 22.805 2 8 887不同风速段误差水平不同的原因主要有以下2点:①不同风速情况下风力机的控制方式不同。

在大于额定风速的高风速段,风力机采用定桨距失速调节或变桨距调节等叶片控制方式,限制风力机的输出转矩和功率,这种相对于低风速段较复杂的控制方式导致同一风速下,功率输出的分散度增大,在现有风速—功率模型下,预测误差增大。

②不同风速段样本数量不同。

由于风速分布通常符合威布尔分布,中间风速段的样本较多,大于额定风速的高风速段样本数较少。

使用某一段时间的数据训练模型时,样本数量的多寡也在一定程度上影响不同风速段中功率点的分散度,使模型的误差水平不同。

误差随风速的分布指标有助于探寻风电功率预测误差与风速大小之间的关系,从而帮助确定预测过程的主要误差源环节,以采取相应的改进措施。

—22—2011,35(12)1.3.2 横向误差指标相关系数(correlation coefficient,CC)可以描述数据间的相关程度。

将实测功率与预测功率作为2个随机变量Y1和Y2,相关系数如下式所示:ICC=cov(Y1,Y2)DY槡1DY槡2(6)式中:D表示方差。

CC指标可以实现实测序列和预测序列相似程度的比较,是直接衡量横向误差和随机误差的主要手段。

该指标可以帮助判断预测系统的主要误差来源是横向误差还是纵向误差,从而针对性地采取不同的修正手段。

例如:图2中,时段1的CC指标数值为0.824 1,时段2则是-0.349 2,与时段1相比,时段2的主要误差来源是横向误差。

1.3.3 峰/谷值预报准确度指标峰/谷值预报指标用来评价风电功率预测中的极值点预测情况。

功率波动的峰/谷值包含上升和下降阶段,以上升情况为例,如图4所示,图中斜线具有功率变化量dp和变化时间dt这2个参数,可分别定性和定量分析。

定性分析比较了某段时间里实测序列和预报序列中是否存在预测序列漏报和错报峰/谷值的情况,漏报表示预报结果中不存在峰/谷值而实际存在,反之则用错报表示。

定性分析指标具有简单、直观的优点;定量指标则是功率波动dt时间段内误差的最值和均值,可以实现不同时段预测结果的细化比较。

峰/谷值预报准确度关系到电网运行的安全性和稳定性,是调度运行人员特别关注的问题。

图5 2种方法日平均模型误差变化曲线对比Fig.5 Comparison of daily eMAEand eRMSEof two methods2)误差频率分布指标。

相关主题