在人们对生产生活回归日常、走上正轨的无限期待中,各行各业陆续“复苏”,电力大数据每天都真实地反映着复工复产情况。目前,吉林省吉林供电公司基于电力大数据的企业复工复产日监测机制基本建立,实现常态化运作。疫情防控与复工复产,如何两手抓、两不误?目前有多少企业已经复工复产,各行业产能恢复如何?政府部门如何制定助推企业复工复产的科学决策?电力大数据可以为这些问题提供一个参考。
1大数据分析的电力行业复工复产风险
预期供应商供货中断时间分为三种情况,即乐观预期、风险中性预期与悲观预期。供应商出现供货中断的原因包括两个方面。一是在生产环节,新冠肺炎疫情造成的企业停工停产会影响零部件供应商的生产量。与此同时,供应商的存货周转率越高,出现在生产环节产生的延迟时间就越短。二是在运输环节,新冠肺炎疫情导致的交通停滞,会使得零部件运输出现延迟。而断路器柜制造商将零部件组装成断路器柜也需要一定时间,可以通过存货周转时间来体现。
2大数据分析的电力行业复工复产对策
2.1用户分群方法
在某个条件下的两组数据,分别讨论时都会满足某种性质,但是一旦合并考虑,却可能导致相反的结论,换句话说,变量在不同的空间中可能与目标变量形成完全不同的相关趋势。辛普森悖论同样会发生在电力领域:不同用户的用电规律通常有较大的差异,而春节期间是否停工决定了用户的用电规律,但如果用相同复工标准判断两类用户,将会得到错误的结论。为了避免辛普森悖论,需要将其在不同的子空间中单独进行分析。因此,根据春节用电规律将用户分群,并使用Kneepoint算法对春节期间停工用户是否复工进行判断,同时可以较好地平衡局部差异优化和模型运行时间之间的关系。
2.2K-means分析法
电网公司用电量及用电负荷曲线等数据由企业经营、商业活动与居家生活等多种生产生活用电模式的叠加构成,通过对客户细分能更好地反映不同企业或行业的复工复产情况。传统的电力客户细分方法通常是根据企业行业、区域等静态属性对用户分类,并据此进行权重标签处理,建立“用户-标签”网络并构建关系权重模型分类,通常适用于数据量较少,数据计算后较为固化,这种分类的优势简便快速,但结果更多依赖经验水平。基于电力数据的客户细分方法则是利用电力用户大数据,通过选取特征和权重,采用聚类方法对样本数据进行检索,根据用电数据进行分类,实现客户分群的精细化管理。主要常见的方法包括回归法、聚类算法、BP神经网络、深度学习等。
2.3降低用电成本
“阶段性降低企业用电成本的举措非常好,茅台股份作为白酒行业龙头企业和贵州的支柱企业,根据电费降价措施,将节约用电成本约80万元。”某集团公司设备能源处处长说,有了政策的支持,某集团的全面复工复产也必将对整个行业及经济社会稳定发展、提振信心,起到明显的带动作用。在疫情防控的特殊时期,在前期已出台的支持疫情防控和企业复工复产供电服务保障举措基础上,又下发《关于坚决贯彻落实阶段性降低用电成本政策支持企业复工复产的通知》,全力支持企业复工复产、共渡难关。在实施阶段性降低企业用电成本的同时,电网公司还积极推行互联网“无接触”办理用电业务,进一步简化业务流程。
2.4历史数据抽取
从分析区域(按行业、产业、用电类别、单位、日期、特定用户群体)抽取分析一段时间(如一个月)的用电量等相关数据作为研究对象,并定义维度变量:用户单位、行业、用电类别、计量点、用户属性、数据时标、电量等,再把数据按进行分组,每组数据按数据时间进行排序并形成初始化数据集矩阵。
2.5事后供应链金融减损
在抗击新冠肺炎疫情期间,各企业的生产活动均受到一定程度的影响,为应对可能出现的财务风险,企业可以选择采用供应链金融服务来缓解资金压力。上节提到的CCC较大且存货周转率较低的企业,需要重点考虑使用供应链金融服务。核心企业如南方电网,可以为上游供应商提供多样化的供应链金融产品。在悲观预期情况下,一级供应商存在较高的零部件缺货风险,可以在接收订单阶段采用订单融资的方式维持企业现金流。在乐观预期情况下,一级供应商能够较快恢复生产,因此,可以选择采用应收账款融资方式获取资金。供应链金融服务能够以较低的利率为上游企业提供资金,一方面能够帮助上游供应商维持现金流,助力供应商的生产活动,另一方面也提高了上游供应商的准时交货速度,从而使得核心企业原材料的准时到达,核心企业的生产活动也能正常进行。
2.6企业复工判断标准及算法原理
企业用电水平会随着经营情况发生变化,形成一条具有明显波动性的用电曲线。春节停工企业在春节期间处于较低的用电水平,到复工节点会出现电量骤增的现象,届时用电曲线将会出现明显的拐点。基于此特征,采用Kneepoint算法判断历史上同时期春节后其用电量出现拐点的时间,确定相对于正常生产时达到复工状态的用电量,并计算其与春节前平均用电量水平的比值,以此作为企业复工的判断标准。
2.7基准用电数据的复产指数模型
为了考虑计算方法的精准性,将复工复产以后新增部分的企业用电从分子里面剔除,以免算出来的复产指数过高,同时把过去已经销户或者关停的企业的用电数量从分母里面剔除,以免计算出来的复产指数过低。这样可以避免在实际计算过程中,少数地区有可能将一些企业列作销户或是关停将其从分母中剔除,以提高整个复工指数的情况出现。所以,该计算方法通过动态调整样本库的企业用电量的数据,实现了整个复产指数计算科学性。此外,值得说明的是,在选择基准日的时候,要综合考虑工作日和周末的用电量情况,以及要避开天气过热或者过冷造成的非生产用电激增导致复产指数不准(如夏季企业开空调导致电量突增)。
2.8用户分群识别
本文用户分群主要使用聚类分析,聚类指的是把集合,分组成多个类,每个类中的对象都是彼此相似的。K-means是聚类中最常用的方法之一,它是基于点与点距离的相似度来计算最佳类别归属。采用并行分布式计算的聚类算法进行分群,聚类算法首先生成空聚类并编号,从所有的样本数据集中随机选择K个对象作为K-means聚类的中心点,将聚类中心点作为各个聚类的代表。
结语
为有效辅助政府对新冠疫情形式下企业复工复产情况进行管控,供电公司充分发挥自身电力数据资源优势,在深入开展数据挖掘的基础上,提出了企业复工电力指数的具体计算方法。基于企业复工电力指数计算方法,对企业复工情况进行测算,并将其与实际情况进行对比分析,验证了所提计算方法的有效性。
参考文献
[1]本报评论员.干在实处走在前列大考中的浙江答卷[N].科技日报,2020-03-31(001).
[2]安国俊,贾馥玮.新冠疫情对经济的影响分析及对策研究[J].金融理论与实践,2020(03):45-51.
[3]凌德祥,黄拓,关晓林,等.基于大数据的电力客户行为分析体系研究及实践[J].电力大数据,2018,21(10):19-23.