1 大数据技术在智能配电网中的价值
目前,大数据技术正受到人们越来越多的关注,各国政府、企业等机构都开始意识到数据将成为未来最珍贵的资源,但这也依赖于大数据分析能力。随着信息技术的快速发展,对数据获取、存储、分析等技术提出了新的要求,因此诸如分布式存储、分布式计算、流计算、内存数据库、PB级行式/列式数据仓库、数据挖掘与分析等大数据技术迅速发展。
目前,智能配电网还存在运营管理体系不完善、海量数据价值有待挖掘分析等特点,主要表现在以下几个方面。
(1)由于电气元件的灵活连接和可再生能源的不稳定发电,智能配电网的拓扑结构和线损都发生频繁且显著的变化,而传统的诸如等效电阻法、等效直流(RMS)电流法、最大电流法等计算线损的方法因此受到挑战,亟待通过大数据技术的方法探索实测数据和线损分布的映射关系。
(2)配电网运行状态的估计可以提高整个智能配电网的供电质量和供电可靠性,具有重要的科学研究价值。如今,智能配电网正在产生大量的多结构化和非结构化数据,长期以来这些数据并没有得到深度挖掘和分析。如何挖掘这些数据背后的价值,如何用大数据描述量大面广、复杂多变的智能配电网实时运行状态,有待进一步研究。
2 大数据技术在智能配电网中的应用路径
2.1 数据预处理
配电网中常常由于数据量测装置故障、人工手动记录失误等原因,产生大量异常数据、不完整数据和重复数据等。由于数据规模大,这些质量差的异常数据和不完整数据会影响后续的数据挖掘和分析。因此,数据清洗是大数据技术应用的一个重要环节。目前,修复异常数据和填充不完整数据的常用方法有插值模型、均值替代模型和回归模型等。但现阶段传统的数据预处理方法未考虑数据之间的时空相关性,使用这些方法清洗得到的数据并不完全可靠。而如今随着大数据技术的蓬勃发展,新的配电网数据清洗技术也逐渐涌现并达到较好的清洗效果。
近年来,作为深度生成模型之一的生成对抗网络(GAN)被广泛应用于各个领域。由于GAN可以学习历史数据的变化规律而其他方法难以显示建模数据之间的时空相关性,因此GAN提供了一种有效的异常数据修复、不完整数据填充和数据增强的方法,如图1所示。GAN由2个神经网络组成,分别是生成器和判别器。历史的高质量数据样本作为训练集的真实样本,生成器将低维空间的噪声向量z映射到高维空间。通过训练生成器学习真实样本的数据分布并生成新数据来欺骗判别器;而判别器的输入同时来自真实样本和生成样本,其试图区分输入数据是真实数据还是生成数据。经过2个神经网络的对抗博弈,在训练结束后,生成器可生成符合实际分布的数据。因此,在清洗智能配电网数据过程中,提取出生成器生成样本的数据,替换或填补到异常数据或缺失数据的对应位置即可。另外,针对智能配电网数据类别不平衡的问题,应用GAN也可以生成无穷个少数类样本,从而平衡多数类样本和少数类样本的数量,提高后续模型的分类性能。
2.2 深度学习技术辅助智能配电网网损管理
为了最大程度减少线损引起的不必要经济损失并降低安全风险,应制定有效的智能配电网网损管理策略,其中,要充分考虑线损产生的原因并能准确计算线损。由于电气元件的灵活连接和通信错误等原因,智能配电网拓扑信息常常来不及更新或信息不够准确,为了实现线损计算和智能配电网网损管理,首先要进行拓扑辨识。
2.2.1 智能配电网拓扑辨识
通常智能配电网节点数量众多,枚举节点之间的拓扑关系需要大量计算,时间成本较高。若将拓扑辨识问题当作概率推断问题处理,则可以采用大数据技术之一的深度神经网络来完成。拓扑辨识中用到的数据大多是电气测量数据,例如有功/无功功率注入、电压幅值、相角等。
2.2.2 智能配电网网损管理
基于深度神经网络的拓扑辨识是线损计算的基础,而基于线损计算结果可进一步通过深度学习方法给出优化线路开关、电容器数量和位置等设置,最大程度地减少智能配电网网损,从而实现智能配电网网损管理,其中网损管理框架如图3所示。
拓扑辨识结果与智能配电网电气测量数据作为深度学习模型的输入,该模型获取了智能配电网拓扑和线损的映射关系,最终模型输出每条线路的线损和线路开关、电容器数量和位置等可控元件的优化设置。
与传统的循环神经网络相比,LSTM网络加入了输入门、遗忘门和输出门,该结构可根据不同的数据特征在不同程度上记忆和遗忘输入数据。选择与输出结果更相关的输入变量,可以得到更好的网络输出结果,因此在所提出的模型中,将三相有功/无功功率、电压幅值、相角、功率因数等电气测量数据作为LSTM输入特征。
3 大数据应用背景的智能配电网安全防护
3.1 智能配电网网络攻击分类
事实上,大数据技术的网络安全是必须关注且具有挑战性的问题。理想的具有安全防护的大数据系统应具有机密性(Confidentiality)、完整性(Integrity)和可用性(Availability),这些性质统称为CIA,CIA的详细解释如下。
机密性(C):是否能够保障模型参数和数据集的隐私性。针对机密性的攻击目标通常是截获大数据系统的敏感数据,例如根据智能配电网终端的负荷数据获取当地生产、消费水平等。
完整性(I):大数据模型的工作过程是否受到干扰。针对完整性的攻击目标很多,例如设计噪声破坏了正常的数据样本,攻击者更改模型参数等。
可用性(A):大数据模型是否正常运行且运行稳定。攻击可用性的目标通常是破坏模型的有效性,例如在面对对抗性样本时,模型输出有误等。
3.2 智能配电网网络安全防护策略
针对智能配电网网络安全防御问题,应针对攻击类型,采取相应的应对网络安全手段。首先,为了避免隐私威胁,可以采用同态加密技术、安全多方计算技术和差分隐私技术。这3种隐私保护技术各有适用场景,同态加密技术具有计算开销大、计算效率低、实用性不高等特点,适合集中式学习、外包计算等场景;安全多方计算技术是一种不依赖于单个机构或个人的密文计算技术,适用于数据协同统计、保护隐私的数据统计等场景;差分隐私技术具有计算开销小、计算效率高、实用性不高等特点,适合模型参数保护、大数据收集等场景。其次,针对投毒攻击,应有效应用防火墙、入侵检测技术、杀毒软件等手段抵御外来不良攻击。
4 结束语
本文对大数据背景下智能配电网的运营管理方式进行了系统性的分析,研究了以下几个方面的智能配电网大数据技术。
(1)数据预处理技术。针对数据规模庞大的智能配电网,应用生成对抗网络可有效实现异常数据修复、缺失数据填充和数据增强等功能,解决传统数据清洗技术未考虑数据之间的时空相关性问题。
(2)网损管理。使用深度神经网络实现智能配电网拓扑实时辨识,进而准确计算线损。基于线损计算结果,通过长短期记忆神经网络分析与计算,得到配电网线路开关、电容器数量和位置等可控元件的优化设置,从而提高智能配电网网损精细化管理水平。
(3)状态估计。通过采用数据挖掘技术对智能配电网动态结构及参数进行辨识,有效提升状态估计准确度。
(4)健康度评估。利用关联规则分析挖掘智能配电网健康度与量测数据的潜在关系,有利于全面评估智能配电网健康运行状态。
大数据技术在智能配电网的应用具有广阔前景,但也存在网络安全隐患等问题,未来可加大开展大数据可视化技术、智能配电网故障辨识、智能配电网风险预警及防护策略等方面的研究。
参考文献
[1]刘灏,毕天姝,徐全,等.配电网高精度同步相量测量技术方案与展望[J].电力系统自动化,2020,44(18):23-29.