1. 背景电力系统的负荷预测长期以来只有国有的电力公司才会关注,研究人员也主要是电科院,高校以及国网电力公司的相关工程师。
随着能源互联网的发展以及电力改革的推进,针对电力系统负荷预测应用逐步扩展到售电商以及用户,尤其是售电商,其利润的主要来源是对负荷的准确预测,购买长期的有竞争力的电能,而比较大的负荷预测偏差,可能会使售电商高价购买临时电能,降低利润。
当前储能在大工业用户以及工业园区发展比较快,储能的释放以及存储时间选择,也是依靠准确的负荷预测来控制最大需量,同时结合峰谷电价获得最大的经济效益。
因此本文以《电力系统负荷预测》这本书为依据,同时阅读其他的论文,对负荷预测的相关基本理论,数据处理方法,超短期以及短期负荷预测的主要方法进行了分析和介绍。
2. 负荷预测基本原则2.1 拟合与预测历史拟合的最佳不等于预测结果的最佳,例如3个历史数据,通过一个二次多项式可以得到零误差拟合,但是实际的预测效果可能并不好,核心问题是不能把负荷预测作为单纯的数学问题来解决。
2.2 近大远小物理量未来的变化趋势更多的取决于历史时刻近期的发展规律,远期数据与未来的相关性较弱,也就是对远期数据的拟合程度可以比较低。
2.3 负荷成因分析不能把负荷预测作为单纯的数学问题,应该从电力系统的角度,重视负荷发展的内在规律分析,通过分析,可以得到影响负荷的重要因素以及其发展规律,对算法的选择应用有重要的作用。
2.4 负荷预测需要考虑的因素长期负荷预测主要是GDP和人口等,而短期负荷预测主要是温度,湿度,天气类型,节假日类型等,预测方法应该和实际相结合,尤其是天气因素,尖峰平谷电价以及负荷构成的影响。
2.5 综合预测法单个预测方法可能只能揭示了负荷变化规律的一部分,因此如果将多种预测方法进行有机结合,可以对负荷变化规律进行更好的描述,这种称为综合预测或者组合预测。
综合预测法主要是在预测结果上进行判断,给每种预测模型赋予不同的权重,得到预测效果更好的综合模型。
电子科技大学的唐小我教授这方面研究比较突出,并且证明,综合预测模型的预测误差平方和不大于参与组合的单一模型的预测误差平方和的最小者。
3.负荷预测的数学方法3.1 非线性规划典型的非线性规划可以进行如下的描述: 求取f(x)的最小值 min f(x),条件为hi(x)=0,其中i为1到m,gj(x)>=0,j为1到l,相当于有i+j个约束条件;这类问题分为有约束极值的问题以及无约束极值的问题,无约束极值问题相当于i和j都为0,一元回归分析模型是典型的无约束极值问题,一般梯度法是最优解法。
有约束极值问题的解法制约函数法以及库恩塔克条件。
综合预测属于二次规划问题,是典型的有约束极值问题。
3.2 遗传算法GA属于随机优化算法,传统算法一般以目标函数的梯度作为寻优方向,容易收敛到局部最优点,而GA通过选择,杂交,变异,评价等各类操作,使群体进化到搜索全局最优解。
GA可以直接用于不带约束的优化问题,同时可以方便的求解带决策变量上下限约束的优化问题。
GA的缺点:1、遗传算法的局部搜索能力较差,导致单纯的遗传算法比较费时,在进化后期搜索效率较低2、三个算子的实现也有许多参数,如交叉率和变异率,并且这些参数的选择严重影响解的品质,而目前 这些参数的选择大部分是依靠经验3、没有能够及时利用网络的反馈信息,故算法的搜索速度比较慢,要得要较精确的解需要较多的训练时间.3.3 最小二乘法假设实际数据对为(Xt,yt),使用预测模型进行拟合,假设拟合的函数为:yt=f(S,Xt,t)使得拟合的残差平方和最小,则使得拟合函数值与实际数据的差的平方和最小。
此残差的最小值可以用下列条件取得,注意S是一个参数矩阵。
这样一般会得到一组线性或者非线性方程组,如果是线性方程组,可以直接求解;如果是非线性方程组,需要迭代求解。
对于线性方程组,方程的形式已知,对于非线性方程组,需要先给出具体方程,再估计参数。
3.4 回归分析法回归分析法按照自变量和因变量回归方程之间的关系,可以分为一元线性回归,多元线性回归,一元非线性回归。
一元线性回归分析模型可以表述为:利用最小二乘法,以残差的平方和最小为优化目标,残差对a和b分别求偏导数,可以直接求解a和b。
多元线性回归的分析模型可以表述为,S为参数矩阵,利用同样的方法可以求解。
注意回归模型一般只适用于自变量和因变量的单调序列,也就是不能出现周期性的相关性。
3.4 时间序列分析法时间序列分析法是将时间序列作为随机过程来研究,假设所分析的时间序列是由某个随机过程产生的,然后用时间序列的原始数据建立一个描述该过程的模型,并进行参数估计。
主要的分析方法有自回归模型(AR),移动平均模型(MA),自回归移动平均模型(ARMA),对于非平稳的时间序列,可以用累积式自回归移动平均模型(ARIMA),对于周期性时间序列,则可以用X12ARIMA。
3.4.1 自回归移动平均模型自回归模型认为,负荷现在的值可以由过去的值的加权线性组合以及一个干扰量表示,而移动平均模型,则认为负荷现在的值由随机干扰的当前和历史项的加权之和。
其中Xt1是上一时刻的负荷值,最右边的是随机干扰的当前和历史值的加权之和。
3.4.2 累积式自回归移动平均模型上面的自回归移动平均模型都是建立在随机序列平稳的基础上,天气变化,设备故障/检修以及节假日等都会使负荷的时间序列出现非平稳的随机过程。
可以通过差分计算将其转换为平稳的随机过程,然后按照上面的自回归移动平均模型进行处理。
差分可以进行一次或者多次来实现平稳化。
3.4.3 傅立叶分析以及小波分析傅立叶主要是认为电力负荷是有较强的周期性时间序列,可以通过频域分析法进行分析。
这种分析方法在短期负荷预测时会遇到问题,主要是傅立叶是在整个时域和频域上的分解,对局部的的详细信息分析会遇到问题,而小波分析可以对局部特性做详细分析。
3.5 特征选择以及特征提取技术样本的特征选择是非常重要的,一般在机器学习中,需要学习考虑的相关特征越少,整个学习过程就越快,并且减少学习的特征可以提高学习结果的准确性。
比如负荷可能跟温度,湿度等都有关系,假设湿度的关联性很低,则减少湿度这个特征就可以极大的提高学习速度和准确度。
算法主要有过滤模型,用来寻找最小特征子集;包装模型,根据随后学习算法的准确性评价选用的特征选择算法。
3.5.1 Efroumson算法其主要思路是在选择集中每添加一个新的自变量后,测试在当前的选择集中是否可以去掉一些以前加入的自变量。
假设Qp为选择集中加入p个变量后的拟合函数与目标值之间的余项平方和,当增加一个变量后,余项平方和为Qp+1.当R大于某一个阈值时(说明残差是变小的),允许这个变量加入。
去掉一个变量的的方法类似,R小于某一个阈值时,允许删除。
3.5.2 基于学习方法的特征提取技术这里有多元数理统计的两个方法,分别是主成分分析和因子分析法。
3.5.3 聚类分析特征提取技术通过聚类分析,可以寻找有相似特征的记录数据,据此来选择参考输入,比如通过聚类分为同一组的数据,其某一个特征值的取值差异比较大,却分为同一组,说明此特征值不是主特征。
当前聚类算法用的比较多的是kmeans算法。
3.6 支持向量机传统的负荷预测的机器学习算法是神经网络,尤其是BP神经网络,应用非常广泛,但是其泛化性能不强,且训练效率收初值的影响比较大。
支持向量机SVM的出现有效解决了传统神经网络陷入局部极小值,过拟合等问题,并且在小样本,非线性,数据高位等机器学习问题中表现非常好。
其基本思想是把训练数据非线性的映射到一个更高维的特征空间,在这个高维的特征空间寻找一个超平面使得正例和反例两者之间的边缘距离最大化,这是针对分类问题,而针对回归问题,就是在高维空间寻找输入和输出变量的非线性关系。
4.预测模型选择的标准4.1 基本准则基本的准则有残差平方和以及均方误差(MSE) , 残差平方和定义为:均方误差的定义为:n为样本容量。
如果模型选择以MSE为标准,则容易出现过拟合。
过拟合(over-fitting)也称为过学习,它的直观表现是算法在训练集上表现好,但在测试集上表现不好,泛化性能差。
过拟合是在模型参数拟合过程中由于训练数据包含抽样误差,在训练时复杂的模型将抽样误差也进行了拟合导致的。
所谓抽样误差,是指抽样得到的样本集和整体数据集之间的偏差。
直观来看,引起过拟合的可能原因有:模型本身过于复杂,以至于拟合了训练样本集中的噪声。
此时需要选用更简单的模型,或者对模型进行裁剪。
训练样本太少或者缺乏代表性。
此时需要增加样本数,或者增加样本的多样性。
训练样本噪声的干扰,导致模型拟合了这些噪声,这时需要剔除噪声数据或者改用对噪声不敏感的模型。
4.2 对自由度施加惩罚的模型选择标准4.2.1 自由度修正均方差这里的自由度是待估计的参数个数, 增加自由度惩罚的均方差定义为:从上面公式可以看出,变量个数k的个数影响均方差,引入更多的变量不一定会使均方差变小。
4.2.2 赤池信息准则这个是日本统计学家赤池根据极大似然估计原理提出一种模型选择准则,通常称之为AIC,计算公式为:部分软件给出的是AIC的对数值,就是两端取ln。
4.2.3 施瓦茨信息准则施瓦茨信息准则SIC是另一个非常重要的模型选择准则,针对上面的三个选择原则,在k/n变化情况下,S2的惩罚最小,且随着k/n的变化增长缓慢,AIC的惩罚稍大,SIC的惩罚最大,并且随着k/n的变化增长最快。
4.3 预测残差平方和准则预测残差平方和准则(PRESS)是一个衡量你和函数对样本数据集推广能力的准则。
其具体实现为:在全部n个观测样本集中取消第t个观测值后,对余下的n-1个样本做函数拟合,然后检验拟合结果和第t个值的差值,针对这个样本集中的n个观测值做同样的操作,则PRESS的定义为:其中vt为第t个观测值和拟合值的差值。
5. 负荷分析的相关基本概念这里的负荷是需量,而不是实时负荷,这点要特别注意,因此需量的定时记录是非常重要的,可以记录每个实时需量,定时记录也应该保证不记录重复的需量值,保证需量产生后再记录。
日最高负荷:每天的需量最大值。
日最低负荷:每天的需量最小值日平均负荷:每天的所有需量平均值。
日负荷率: 日平均负荷与最大负荷的比率。
分析每天的最大负荷以及发生的时间,最小负荷以及发生时间,高于给定数值的段数以及低于给定数值的段数,对于分析负荷特点是非常有意义的。
6. 基于同类型日的短期负荷预测方法短期负荷预测的最大特点是短期负荷有明显的周期性,第一是不同日之间的24时整体变化规律的相似性,第二是不同周,同一星期类型日的相似性;第三是工作日/休息日各自有相似性;第四是不同年度的重大节假日负荷曲线的相似性。