PDF下载
基于大数据分析的输电线路故障数据分析研究

杨通斌

贵州电网有限责任公司智能作业中心,550002

摘要: 针对现在输电线路故障数据多,故障发生的机理复杂的问题,本文将含有环境状态信息的故障记录作为输入变量,通过大数据分析进行隐含的环境元素和故障规则的信息数据挖掘,深度挖掘出输电线路故障数据中的罕见变量及其规律,提高了输电线路故障预警的完整性,提高了预警系统在极端情况下的应对能力。
关键词: 输电线路;大数据分析;罕见变量;数据分析
DOI:10.12721/ccn.2023.157952
基金资助:
文章地址:

输电线路覆盖范围广,环境变化大,影响因素多,电力系统运行故障大多数情况下是因某段输电线路故障导致的[1],电网发生输电线路故障时,多种装置和系统均会提供关于故障定位结果的数据信息[2];当前普遍使用的故障预警方法大多集中于利用现有的数据诊断故障并预警[3];而空输电线路所处环境复杂多变,设备状态的关联因素相对较多,故障发生的机理相对复杂[4],不同类型的故障造成的影响不一,导致数据利用率低下,在现有的数据支撑下无法保障预警结果的全面性和前瞻性,预警结果不准确。

大数据分析方法主要针对复杂、不确定性系统或混动规律进行研究,以数据驱动为核心,针对特定问题或者业务,收集数据实现多源数据有效融合,从而构建数据的数学分析和挖掘模型,大数据能够被用于分析挖掘各个输入参数之间的联系、过程的运行模型以及结果发生的趋势等不同方面的较大容量的数据集。而这些分析挖掘出的结果往往难以直观地感受或察觉到,因此利用大数据分析技术能够有效提高输电线路故障预警的准确性。

1 构建故障预警模型

输电线路故障预警模型构建,首先需要采集输电线路相关数据、气象数据和环境数据等相关信息,然后对信息进行预处理确定故障预警特征项,针对特征采用神经网络算法分析已分类的数据,确定不同类型故障特征之间的关联性,分析引起输电线路故障的主要特征,将其定于为故障因子,构件故障因子库;最后依照现场实际情况反馈输电线路故障分析结果,持续完善故障样本库优化故障预警精度。1.png

图1输电线路故障预警模型构建

2故障数据分析 

2.1利用大数据分析变量

采用含有环境状态信息的故障记录作为输入变量,通过大数据分析进行隐含的环境元素和故障规则的信息数据挖掘,在输电线路系统外部环境特征与输电线路系统故障发生时段中,往往存在一些出现频率较低的环境元素以及一些故障发生较少的时段,当面对环境特征中的不同环境元素以及不同时段时,往往会进行排除过滤,即选择性使用是最直接的做法,但通过对这些罕见变量进行挖掘和分析,可以有效改善现有输电线路系统故障预测的准确性。

2.2分析输电线路中的罕见变量

分析输入的输电线路数据中的罕见变量,提升模型的预测性能,罕见变量是现有的输电线路系统故障预测方法中出现频率较低的环境元素,以及故障发生原因的变量数据,现有的预测方法会直接忽略或筛除掉,但输电线路系统故障中这些罕见变量有着明显的时间、空间分布规律,一旦能够挖掘并掌握这些规律,则可以求解输电线路系统中的高故障风险区域及时段,从而使故障的防范处理工作变得更加完善。

先将输入的线路系统数据按年度划分并进行数据的预处理操作,在所有的输电线路系统输入数据库中,故障数据是以集合的形式通过不同的环境特征进行组合的,需要从所有的输入数据中选定设定的目标变量,因此进行数据的划分和预处理,排除不需要的环境变量数据;然后依据故障数据在各个时段中的分布,提出重要度诊断标准阈值设定方法,分别针对性地为各个时段设定不同的阈值,可以从输入数据中挖掘罕见变量时计及故障罕见时段的影响;

重要度诊断标准阈值设定方法的运行步骤为:

(1)通过选择一个季度作为基准单位时间,针对在相同季度中所发生的故障记录数据,应用相同数值的条件重要度诊断标准阈值,采用条件重要度诊断标准阈值设定方法,为春夏秋冬分别依据各个季节中故障的分布情况设定不同的阈值,使得发生在冬季的故障同样能够得到充分分析;

(2)从选取的已经划分为年度的故障数据中,进一步将包含所有故障记录的数据按照季度进行划分,得到更细的罕见时段的故障数据,考虑到在冬季甚至在春秋两个季节中故障的发生频率都将相对较低,使得相应环境状态的重要度得分较低,容易低于基于一整年故障的发生情况所设定的阈值,从而导致这些罕见时间序列极易被直接筛除,尽管在罕见时段中故障的发生频率较低,但其中的故障同样可能造成输电线路系统运行的中断,从而导致严重的损失,因此需要在分析时计及这些罕见时段;

(3)基于故障数据在各个季度中的分布情况,利用条件形式得分计算方法分别设定阈值,传统的重要度诊断标准得分计算方法,一些故障数据记录所得到的重要度得分很难达到设定的阈值,也就容易被直接排除,而采用相应的条件形式得分计算方法,这五种条件重要度诊断标准得分计算方法能够依据不同环境特征中罕见变量的分布,通过不同的计算方法计算其重要度得分,从而能够同时从罕见变量集中进一步挖掘出可利用变量。

最后采用不同的得分计算方法为罕见环境元素与常见环境元素进行计算,从罕见变量中继续对高风险低概率变量进行挖掘时计及罕见环境元素的影响,依据各个环境特征中罕见环境元素的分布对五种重要度诊断标准得分计算方法的传统形式进行了改进;

构建两个变量映射空间以分别对常见变量和罕见变量与故障之间的相关程度进行分析,计算输入数据相对权重时能够更加准确地衡量罕见变量的影响,也可以尽可能涵盖所有可能出现的故障类型以及环境状态,以加强故障模型在罕见或极端情况下的应对能力。

2.3分离离特征和连续特征的环境数据

同步针对输电线路系统中离散特征和连续特征两种类型的外部环境数据进行分离处理,离散特征的环境元素以相互分离的个体形式存在,可直接通过关联规则挖掘进行处理,而连续特征则需要事先离散化,由于主观性较大而存在一定的随机性和不确定性,故直接基于关联规则挖掘进行处理时的预测效果通常有限,因此将离散特征和连续特征分别基于不同的专家模型进行挖掘分析,尽可能发挥出不同模型各自的优势,进而提升预测的准确性;

将输电线路系统外部环境数据中连续特征与离散特征分离,通过考虑不同类型输入数据的特性,可以使后续模型的预测性能能够得到更进一步的提升;离散特征通过罕见变量的动态关联规则挖掘故障模型进行处理;

连续特征采用基于罕见变量的关联规则挖掘故障模型和模糊推理系统组成的集成式模型进行处理,一方面采用层次模糊推理系统结构,可以减小运算复杂度,另一方面,在构建隶属度函数时应用了概率模糊风险取代传统的直接模糊风险,能够以相同的函数形式处理不同类型的连续特征,从而可以减小运算复杂度并提升实用性,通过集成式学习原理分别求解了两个模型各自的最优专家权重,可以尽可能的减小误差的影响。

连续特征的处理方法包括以下步骤:

(1)计算所有输入连续环境特征的概率分布,并通过采用概率模糊风险的模糊推理系统将上述概率分布转化为模糊风险指数;

(2)通过概率分布函数表示连续环境特征中的特征值在输入数据库中的出现频率;

(3)基于得出的概率分布函数曲线,将每一个连续环境特征的特征值划分设定的数值区间,基于上述概率分布函数曲线和设定的数值区间,即可以求解出各个特征值出现在相应特征中每一个数值区间的概率。

3对输电线路故障位置及时段进行预测

故障模型根据输电线路系统各个空间位置在未来不同时段中的环境状态,对系统中具有高故障风险的空间位置及时段进行预测,在不同时段中,输电线路系统外部的不同环境状态与系统故障之间存在着不同的关联程度,因此一套更为合理准确的输入数据相对权重计算方法能够进一步提升输电线路系统故障预测的准确度。

对系统中具有高故障风险的空间位置及时段进行预测的方法是基于系统风险结构理论描述系统的整体故障风险,利用部件关键度分析原理刻画不同环境元素对其产生的影响,基于电力系统稳定评估理论对所有时段进行故障风险分级,并基于随机过程风险模型构建时间风险指数计算模型以及构建环境风险指数计算模型进行故障风险预测,通过利用环境元素的出现而导致系统整体故障风险的变化趋势及幅度来衡量各个环境元素的相对权重,得到的权重结果更为真实准确,时间风险指数计算模型能依据各个时段中的故障分布对各个时段进行故障风险权重衡量,能够计及故障的不均衡时间分布所带来的影响。

4结论

本文基于大数据分析技术,通过采用含有环境状态信息的故障记录作为输入变量,通过大数据分析进行隐含的环境元素和故障规则的信息数据挖掘,分析输入的输电线路数据中的罕见变量,同步针对输电线路系统中离散特征和连续特征两种类型的外部环境数据进行分离处理;最后使用预测模型根据输电线路系统各个空间位置在未来不同时段中的环境状态,对系统中具有高故障风险的空间位置及时段进行预测。

5参考文献

[1]卢明,赵书杰,刘振声等.基于灰色投影优化随机森林算法的输电线路舞动预警方法[J].电测与仪表,2020.57(9):45-51,57.

[2]孙梦晨. 基于电网运维多源数据的线路保护通道及输电线路故障定位方法[D].山东大学,2019.

[3]方玉河,陶汉涛,张磊等.基于大数据的输电线路故障预警模型设计[J].机械设计与制造工程,2021,50(10):110-114.

[4]白剑锋. 基于大数据分析的输电线路状态评估和故障预测研究[D].华南理工大学,2020.DOI:10.27151/d.cnki.ghnlu.2019.003886.