近年来,大量风能、光伏等新能源发电快速发展并积极参与到电力市场当中,区别于传统火力发电,由于其发电的不可控,打破了电能的实时供需平衡关系,因此包含新能源的电力市场中电价波动变得较为剧烈。过去在进行电价预测时往往探索历史电价、负荷与待预测日电价之间的关系。当新能源参与时,在风力发电功率、光伏发电功率、新能源渗透率等多个新能源相关因素的影响下,使电价的时间序列呈现强波动性、非线性、双峰性、尖峰性和跳跃性、均值回复性等特点[1]。
基于“分解-预测-集成”的思想,本文提出互补集合经验模态分解-改进麻雀搜索算法- LSSVM的电力市场价格预测模型。首先,采用随机森林法,在N个相似日中通过计算得到不同因素对历史电价的影响情况,将不同影响程度的因素赋予不同权重并通过灰色关联分析筛选出n个相似日集合;其次,利用 CEEMD将相似日的历史电价序列分解为多个固有模态分量及残余项[2],建立 ISSA-LSSVM预测模型,对分解得到的多组信号进行预测,得到日前电价预测值;最后,选取某地的电价数据进行仿真。
1 相似日选取
1.1 基于随机森林的影响因素量化
本文为尽量充分考虑高比例新能源对电价的影响,考虑将新能源渗透率相关数据作为电价的影响因素。为了准确区分不同因素对电价的影响程度,采用RF算法对各个因素进行计算,从而得到各因素对电力市场日前价格影响的重要程度。
将变量重要性评分记为V,基尼指数记为G,设有i个特征x1,x2,⋯,xi,对每个特征的重要性进行计算。基尼指数的计算式如下:
(1)
式中,K表示包含类别的总数;pmk表示类别k在节点m中的占比。
1.2 灰色关联分析法的相似日筛选
本文采用灰色关联分析法计算不同历史日与待预测日的相似度分数。日前电价历史相似日筛选方法如下:假定待筛选的样本集合共N天,考虑电力现货市场电价影响因素的相似性,对使用RF算法得出的影响因素权重进行历史相似日筛选,计算得到不同天的相似度得分,将得分最高的前n天作为电力现货市场电价相似日。
2 电价预测原理
由于电价的时间序列表现为非平稳的随机过程[3],本文提出一种基于CEEMD-ISSA-LSSVM的日前电价预测方法,模型流程如图1所示,主要步骤为
1)采用CEEMD方法对筛选后的相似日电价序列进行分解,得到j个分量{IMF1,IMF2,⋯,IMFj}及1个残余项。
2)采用mapminmax函数对IMF分量和残余项归一化到[-1,1]的范围内。
3)对归一化处理后的数据进行ISSA-LSSVM回归预测。
4)将预测结果反归一化处理,得到最终的预测电价。
图1 CEEMD-ISSA-LSSVM模型流程图
3 基于CEEMD的原始电价时间序列分解
CEEMD是针对EMD在分解信号时容易出现混叠问题而改进的一种完整的模态分解技术方法,可以完整地分解信号[4]。CEEMD原理:在重构信号的过程中添加大量幅值相同、相位相反的高斯白噪声,然后对合成的信号进行EMD分解,可避免模式混叠的问题[5],添加的正负白噪声可使残余噪声的值保持较小的水平。使用CEEMD法进行信号分解得到的结果较为理想。CEEMD分解步骤如下:
1)在原始电价序列x(t)中加入n组符号相反的白噪声q+、q-,构成合成信号M (t)和N(t),如下:
(1)
(2)
2)对2n个合成信号进行EMD分解,其中第i个信号的第j个IMF分量表示为IMFj,i,将残余分量记为最后一个IMF分量。
3)计算所有固有模态函数分量的集合平均值,得到CEEMD的分解结果为
(3)
原始电价序列x(t)经CEEMD分解后得到n个IMF分量和1个残余分量R。
4 基于ISSA-LSSVM的预测模型
4.1 最小二乘支持向量机
在数据回归分析时,运用支持向量机处理小样本数据可达到较好效果,但该方法仍存在模型中需选择的参数数量过多、处理数据过多及运行速度较慢等问题[6]。改进的方法有支持向量自回归方法、LSSVM等。LSSVM将支持向量机中的不等式约束线性化,将原问题转化为一个线性方程组的求解问题[7];将损失函数定为最小二乘线性系统,避免了二次规划,使运行速度和计算精度得到很大提升,但其预测精度在很大程度上依赖于惩罚参数c和核函数参数 σ 的选取。c主要权衡最大间隔和分类误差,σ 主要影响映射到高维特征空间的复杂程度。
LSSVM优化函数为
(4)
(5)
式中,J为优化函数;yi为样本分类标记;φ为xi在特征空间的映射;xi为样本向量;w为权向量;b为偏置量;ζi为误差。
本文选择径向基函数作为 LSSVM的核函数。此外,c 和 σ 的选取对LSSVM的影响较大,通过回归拟合得到预测结果的准确性与这两个参数选取的合适与否有极强的关联性。因此,本文采用ISSA对LSSVM的参数进行寻优,建立最优预测模型。
4.2 改进麻雀搜索算法
麻雀搜索算法是一种新型群体智能优化算法,具有精度高、收敛性好、运算速度快、鲁棒性好等特点。但当SSA算法搜索接近全局最优时,易陷入局部最优。SSA算法是模仿麻雀寻食过程而被提出的,设定种群内麻雀个数为N,10%~20%作为发现者,对食物进行寻觅,利用发现者的帮助引导种群进行搜索;70%~80%作为加入者,根据发现者提供的食物信息进行觅食,在种群出现威胁时进行反捕食行为;10%~20%作为侦察者,对种群可能遇到的危险进行预警。将SSA获得优化问题解的过程类比于模拟麻雀寻食的过程。
发现者在种群中的适应度较好,位置更新公式如下:
(6)
式中,t为迭代次数;T为迭代次数的上限;α 为(0,1]之间的均匀随机数;Q是阶数为 1 × d、元素均为1的矩阵;xi,d为第i只麻雀在第d维的位置;R2和S分别表示预警值和安全值,R2∈[0,1],S∈[0.5,1]。当 R2 < S时,发现者将在安全环境中广泛搜索,提高种群的适应度;当R2 ≥ S时,种群中部分麻雀发现了危险,向种群传递预警信息,随即种群向安全区域前进以躲避环境可能发生的危险。发现者之外的麻雀作为加入者,按式(7)对位置进行更新。
(7)
式中,表示种群第t次迭代时麻雀在第d维的最劣位置;
表示种群第t + 1次迭代时麻雀在第d维的最优位置;当i >时,表明第i个加入者缺乏食物,适应度低,将通过扩大搜索范围来觅食以提高自我适应度;当i ≤时,第i加入者继续在xb附近觅食。
种群中警示的麻雀位置更新如下
(8)
4.3 Lévy飞行策略改进麻雀搜索算法
引入 Lévy飞行策略能够进一步提高SSA全局搜索能力,得到ISSA。当发现者多次迭代后适应度保持不变时,将加入者变为发现者,在加入者更新式中引入Lévy飞行策略,避免陷入局部最优。位置更新式如下:
(9)
其中,是当前发现者占领的最佳位置,Lévy飞行机制如下:
(10)
式中,r3、r4均为[ 0,1 ]范围内的随机数;ξ 选取1.5。
4.4 组合模型的构建
最终的训练结果和电价预测准确情况与LSSVM的核函数中 c 和 σ 的取值精度呈正相关。ISSA使SSA算法能够选出更为合理的种群位置迭代式,提高全局搜索能力并高效搜索,缩短求解时间,避免陷入局部最优,有助于LSSVM模型选出更合理的c和 σ,从而更好地适应较为复杂的优化问题。模型的流程如图2所示,具体步骤如下:
1)初始化LSSVM的参数c和 σ。
2)设定种群的基本参数:种群规模为N,发现者个数为pN,侦察预警的麻雀个数为sN,目标函数的维数为D,初始值的上下界为lb和ub,最大迭代次数为im。
3)以LSSVM的均方误差(mean-square error,MSE)作为适应度函数,计算每只麻雀的适应度fi,选出当前最优与最劣的适应度fg、fw及其对应的位置 xb、xw。麻雀i的位置坐标信息代表着参数c和 σ 的取值,即( c,σ )。
4)选取适应度最优排序的前pN个麻雀作为发现者,根据式(6)更新发现者的位置;剩余的作为加入者,引进Lévy飞行策略,根据式(9)更新加入者的位置。
5)在种群中随机选取sN只麻雀作为种群预警,按照式(8)更新位置。
6)进行迭代操作,每次迭代结束后,更新种群中麻雀的适应度值fi、平均适应度值favg及当前最优值。
7)当迭代到设定值im时,得到LSSVM的 c 和 σ 的寻优结果,输出最优参数,停止迭代,否则继续迭代。
8)将寻优后的c和 σ 赋给LSSVM模型,得到基于ISSA-LSSVM的预测模型。
图2 ISSA优化LSSVM流程
5 算例分析
在电力现货市场电价预测的研究中,采用某地的实际电价数据进行分析,数据收集时间为2020年1月1日—2020年1月30日,共30 d,每0.5 h采样1次。原始数据包括电力负荷实际值与预测值、电力消费实际值与预测值、发电量实际值与预测值、风力发电量与预测值、光伏发电量与预测值及实时电价等多元信息。
5.1 相似日数据选取
基于某地的电力现货市场历史数据,采用RF算法计算各特征影响因素的重要程度。将各个因素对于电力现货市场电价的重要性作为特征指标进行归一化处理,得到相似日选择的权重。对某地2020年1月31日的日前电价进行预测,按照相似日筛选的计算方法,计算出样本集中与预测天的关联程度,取关联度排序前20 d的历史天数据作为ISSA-LSSVM模型的训练集。关联度排序前20 d的日期及相似度如表1所示。
5.2 预测结果对比分析
采用CEEMD-LSSVM(模型1)、ISSA-LSSVM(模型2)、CEEMD-ISSA-LSSVM(模型3)及CEEMD-SSA-LSSVM(模型4)对相似日筛选排序前20 d的电价数据进行预测,得到相应结果;使用关联度最低的20 d的电价数据对模型3进行训练(作为模型5),通过预测得到相应结果。为叙述方便,将上述模型按顺序定义为模型1~5,经过仿真得到的结果与实际情况的对比如图3所示。
图3 实际电价与不同模型预测电价对比
选取均方根误差(root-mean-square error,RMSE)、平均绝对误差百分比(mean absolute percentage error,MAPE)及平均绝对误差(mean absolute error,MAE)等指标对模型进行评价,各预测模型评价指标计算结果如表2所示。
由表2可知:
1)本文采用CEEMD分解后得到的电价预测结果比直接进行预测的RMSE降低了66.00%,MAPE降低了65.90%,MAE降低了65.48%。这表明CEEMD比较适合对非线性、强波动的时间序列数据进行处理,在对电力市场价格预测时能够提高模型预测的准确性。
2)模型3与模型4相比,模型3的预测结果的RMSE降低了24.91%,MAPE降低了24.74%,MAE降低了22.90%,与实际电价更为接近,充分说明了经Lévy飞行策略优化后的 ISSA 可以避免陷入局部最优,从而有效提高了预测的全局搜索能力。
3)模型1与模型3相比,模型3的预测结果的RMSE降低了39.53%,MAPE 降低了39.41%,MAE降低了37.50%。最终预测结果表明了使用ISSA对 LSSVM 的c和 σ 进行寻优可以有效降低模型预测误差。
4)与关联度最低的20 d的电价情况相比,本文选取关联度最高的20 d的数据,得到预测结果的RMSE降低了74.01%,MAPE降低了80.69%,MAE降低了73.6%。这说明在对电力市场日前电价进行预测前,采用历史相似日筛选得到了与预测日相似度高的历史天样本数据,对日前电价预测的准确性有较大提高。
6 结 语
本文针对新能源参与的电力市场日前价格预测问题,提出了一种基于相似日选取的CEEMD-ISSA-LSSVM 日前电价预测模型,经仿真可知:
1)使用基于RF和灰色关联分析法的相似日选取方法,得到了最优相似度的训练集,提高了训练数据的质量,最终提高了预测精度。
2)考虑了风光发电量等新能源因素对电力市场电价的影响,能更好地反应日前电价的波动情况,提高了预测精度。
3)使用CEEMD将原始电价数据进行分解,得到一系列平稳的时间序列,避免了在原始数据尖峰处出现预测失准的问题,降低了预测误差。
4)ISSA-LSSVM模型很好地解决了LSSVM中因参数c和 σ 选取不合适而导致模型出现欠拟合、泛化能力差、预测准度低、训练和预测速度慢等问题,预测效果优于LSSVM和SSA-LSSVM。
综上,本文所提出的模型对日前电价有良好的预测精度,可较好地解决日前电力市场价格预测问题。
参考文献
[1] 刘丽燕,邹小燕.GARCH族模型在电力市场电价预测中的比较研究[J].电力系统保护与控制,2016,44(4):57 - 63.
[2] 黄羹墙,杨俊杰.基于BP神经网络与马尔可夫链的短期电价预测[J].上海电力学院学
报,2017,33(1):1 - 3.
[3] 黄元生,张利君.基于遗传算法的BP-LSSVM组合变权模型权重优化的短期电价预测研究[J].煤炭工程,2019,51(5):172 - 176.
[4] 吕维港,王 辉,周子扬,等.高比例风电下电力市场短期电价预测[J].科学技术与工程,2021,21(30):13 002 -13 009.
[5] 杨 颖,杨少华,张 燕,等.基于相似日的短期电价区间预测[J].智慧电力,2018,46(12):23 - 29.
[6] 杨 昭,张 钢,赵俊杰,等.基于变分模态分解和改进粒子群算法优化最小二乘支持向量机的短期电价预测[J].电气技术,2021,22(10):11 - 16.
[7] 王 瑞,陈泽坤,逯 静.基于VMD和IBA-LSSVM的短期风电功率预测[J].河海大学学报(自然科学版),2021,49(6):575 - 582.