基于大数据分析的园区综合能源企业能效评价
摘要: 作为未来能源革命的一个重要发展趋势,集成能量系统已成为当今世界范围内的研究热点。构建综合能源系统,可以增强社会电力供应系统的可靠性与灵活性,增强社会整体用能效益。目前对综合能源系统开展了一系列的试验研究,以推动电力系统的发展。综合能源企业能效的评价是推进综合能源系统建设重要的反馈环节,能为下一阶段发展提供参考依据,因此有必要基于大数据分析对园区综合能源企业能效进行评价。

前言

当前,我国正处于能源转型的关键时期,在确保社会经济发展速度的同时,提高能源使用效率和减少环境污染,已成为当今社会关注的热点。普遍存在。能源企业在能源控制、能源消费、能源结构转型及相关技术升级过程中会产生各种各样的数据,能源大数据的容量是 PB 量级的。基于海量综合能源数据,利用大数据分析技术深挖数据价值,建立科学高效的园区综合能源企业能效评价体系,对提升能源利用率,促进能源企业发展和经济转型具有积极意义。

1园区客户运营特征分析

选取某工业园区14家企业为研究对象,整合客户用电、交费、欠费、行业特性等数据,利用大数据分析,掌握客户运营特征,对高耗能企业的综合经营情况给出科学评价。

1.1 建立能效评价数据基础采集

2019-2021年某工业用户用电、设备、负荷等数据共670余条,对缺失值、冗余数据、噪声数据进行清洗。基于以上数据清洗方法,共清洗缺失值 164 条、冗余数据 7 条、噪声数据32 条,最终得到有效数据256 条。

1.2 构建价值客户识别模型

根据2019-2021年的行业特征、购电量比例和年用电量增长率;年用电量,年缴款金额,年缴款次数;以年欠费金额、年度欠费次数、每月用电负荷变化幅度作为训练样本。利用多层次聚类的大数据算法,对数据进行100次重复,将用户分为4种类型:高价值客户、潜在客户和普通客户;高风险的顾客,确定高价值顾客,并对顾客进行价值排序。

1.2.1 聚类分析

首先,采用K-Means聚类算法对于工业用户进行分组,由于其行业分布较为分散,共49个行业,首先将227名用户划分为20个类别,分别标注为1,2,3;4、5、…、20,一共20个类别,方便我们剔除无用的使用者,选出有用的使用者,并以表格形式呈现给使用者看。

1.2.2 对价值客户进行聚类分析

采用K-Means聚类方法,对不同类型的顾客进行了分类。种群1的各性状都比较稳定,表明其运行状况稳定,抗冲击能力强。组2的各种特性均较小,在四个组中,购电率是最小的,表明这一类型的用户在外部环境变动较大的情况下,其经营状况还算正常;那么,能源企业的经营就会受到很大的影响。群组3的购电量、购电率和年度缴款金额均为最大,表明该公司的生产规模越大,对能源的需求量也越大。同时,用户欠费金额最高,用电量增长幅度小,这一类用户的供电能力不强,欠费风险大。

2  构建企业能效评价体系

2.1 初步确定指标体系

根据工作实际,采用调查、查阅资料、专家研讨等方法,对所要求的指标进行了初步的确定。第一类是经济能源效率指数,管理能源效率指数,技术能源效率指数。其中,能源利用效率又细分为两个方面,即每万元产值的能耗和每万元增加值的电耗。管理能源效率又分为三个部分,分别是电力设备在用率,节电率,节电率三个方面。其中,技术能源效率又分为电器效率、电力效率、电压不合理等9个方面;电网不平衡率,企业线损率,谐波失真率;单位产品的电力消耗,变压器负载率,电力设备的停机时间。总共有14个次级指标。这一指标从经济、管理和技术三个角度来诊断电力消费者的能源效率,比较全面地反映了电力企业的能源效率。

2.2  采用主成分分析法构建指标体系

为了保证评价的科学性,选取的指标要有一定的代表性。因此,系统的能源效率诊断指标必须要有代表性,如果某一项指标对系统的贡献度过低,就会导致故障诊断的计算量增大,从而降低诊断的准确率。主分量分析(PCA)的基本思想就是通过对已有的变量进行重组,使其成为新的且互不相关的多个综合变量,从而使其在降维的过程中能够体现原始指标的信息。

首次能源效率评价指标系统中,第一个指标不需要进行筛选,而是由有关专家根据自己的经验,通过反复考虑而得到。本研究以14个次级指标为研究对象。将各个一级指标所对应的次级指标看作是一个独立的体系(例如,经济能源效率子系统中包括了企业万元产值电耗、万元增加值电耗),通过 PCA来抽取各个系统的主分量,一般来说,第一个主分量(也就是第一个指标)已经把大部分的数据信息都包括进去了,因此,只需要对各个二级指标在第一个主分量上的组成系数进行计算,把系数大的指标保留下来,把其他的次要指标剔除掉。其次,对次级指标间的相关系数进行相关分析,如果一个指数与其他指数之间的相关性较大,可以认为该指数是冗余性的。若关联分析与 PCA结果不一致,则主要考虑主成份分析,比如一个指数在主成分中所占的比例较大,则该指数虽与其他指数呈线性相关,但仍不能剔除。

3  构建企业综合能效评估模型

3.1 基于组合赋权法评估

第一级指标权重的计算,第二级指标的权重计算,第三级指标的权重计算,以及最终的综合赋权法。

在使用组合赋权法进行评价时,当一个评价指标 xi的重要性比 xj大(或不少于)时,将x> y表示,如果评价指标x1、x2、x3、...、 Xm的关系是以“>”的形式表示的,那么,评价指标的排序关系是以“>”来表示的。针对一组评估指数 X={x1,x2,x3,..., xm},可以按照以下的程序来构建排序关系:在 m个指数中选择一个最有价值的指数,用 xi表示。在剩余的 m—1指数中,选择最有意义的一项作为 xj。……在剩余的m-(k-1)个指数中,选择最有意义的指数,并将其表示为 xn。……把剩下的一种量度标记为 xk。那么,一个惟一的顺序关系就可以被决定。

将专家对于评估指数xk-1和 xk之间的重要度的比率pk-1/pk表示为 rk,并且 rk=pk-1/pk,其中, pk是指标组X中第 k个项目的评估指数所对应的权值。

3.2 基于熵权法评估二级指标权重

利用熵理论,给出了加权最优值的计算方法。若指数有信息熵,则用来衡量系统的失序程度。值愈小,则其所能反映的信息愈多,其在综合评估中的地位理应愈高,故加权值应愈高。最后,运用熵权法对各指标进行了权重分析。按照以下方法,利用熵加权法来确定各项指标的指标权:

微信图片_20250225093231.png

利用上述方法可计算出二级指标对一级指标的权重。

3.3 模型验证用

本文拟以2021年度能耗数据为研究对象,对其进行验证,发现其与2021年真实用户类别的拟合程度达到94.2%,也就是模型的可信度高达94.2%,能够满足实际商业需求。

结束语

本文以大数据为基础,以高能耗行业大工业用户端的能耗数据为基础,采用大数据算法对其运行特性进行分析。构建了基于价值的用户认知模型、能效评估指标体系和能效集成诊断模型。该方法融合了主观评估经验与客观评估信息,使评估结果既能反映使用者的总体能源效率,又能对局部能源效率做出诊断。通过算例分析,提出了一种新的能量效率分级评价方法,该方法简单易行,实用性强,是一种很有实际意义的方法。

参考文献

[1] 田立亭,程林,李荣,等 . 基于加权有向图的园区综合能源系统多场景能效评价方法[J]. 中国电机工程学报,2019,39( 22) : 6471 - 6482.

[2] 刘人境,高曦含,张光军 . 基于灰熵模型的区间型指标和权重的不确定多属性决策方法及其应用[J]. 控制与决策,2020,35( 03) : 657 - 666.