一、可视化方法研究现状
大数据可视化分析技术可以在PB级的信息中,抽取出大量蕴藏于其中的我们之前还没有了解却又很可能有用数据和信息。它不同于过去基于数学模型的传统科学研究方法,待发现的新信息都能够在模型与假说一致的前提下加以研究,并把大量数据置于庞大的计算机集群中,如果发现了彼此关联的新信息,利用统计分析方法就能够找到过去传统科学研究方式所找到不到的新方法、以及新理论随其至的发展规律。基于大数据挖掘所使用以及获得的结果数据往往具有海量、高维度、价值密度低、处理速度快的特点.目前我国国内基于强大数据可视化分析能力的事故辨识、设备状态评估方案的研发工作正在起步阶段,而针对现有的设备故障数据可视化分析还没有一个完善过程。所以,需要通过一个事故大数据分析可视化流程,来对于所分析的故障数据加以简单分类,为便于事故数据分析员更直接、迅速地了解数据结构及其故障分析情况,提供了一个综合人的视觉处理能力的对抽象、乏味数据分析的良好理解渠道,为良好地管理和解读上述数据分析结果提供了借鉴。
二、输变电设备分析具体电网业务的大数据分析方法
2.1数据整合
通过消息队列、信息输入器、信息提取器、信息复制器等各种手段,完成结构化、非结构化、海量的/准实时、电网空间的信息连接。数据源主要包括质量管理体系、状态监控体系、设备的GIS系统、气象网络系统、雷电检测体系等结构化数据,以及试验报告、现场视频、声音/视频文件、设备的出厂检测报表、运行报表、事故统计分析报表、检验文件、日志档案等的零点五结构化和无结构化数据。
2.2数据存储
对各种接入信息依照统一的标准进行规范格式储存,并按照实际应用要求储存于分布式文件管理系统、分布式数据仓储、非关联式数据库系统、关联式数据库系统等,进行各种信息的集中存放和联合处理,以实现更大规模、多元化信息的低成本储存要求。信息存储管理分为数据库信息管理、内容质量控制、信息的流动控制、信息访问控制和信息运维业务辅助控制。基本信息管理:实现对大数据元数据资源的统一集中管理,实现大数据源的规范使用,为质量监控、流转管理等提供基本信息。大数据质量控制:建立业务明细信息、报表内容和更多数据模型的大数据质量统计分析与校核机制,不断提高大数据管理质量。信息土地流转控制:实现在信息接入环节、抽取环节、业务管理过程等信息管理实现逐层控制、层次管理。信息授权控制:实现对各种信息的许可控制,保证数据的安全和准确性。信息运维服务支持控制:提供数据日常管理和监控的支持控制。
2.3数据计算
提供了流量运算、内存运算、批量运算、查询计算等分布式方法,以适应于各种高准确性的运算需要。同时,流量运算技术支持即时进行;内部运算支持交互性数据分析;批量运算支持对大量数据分析的离线分析;检索运算支持对各类数据库的检索数据分析技术。
2.4数据分析
整合常规数据分析方法,完善分布式数据分析方法,建立大数据分析基本方法数据库。在此基础上,建立了支撑输变电设备状态分析业务所需要的大数据分析数字建模算法。而关于数字建模算法的,主要取决于所要处理的技术问题,以及输变电设备分析的实际业务需要。对于预测类的计算,分为回归与分析类的二种,方法可能是决策树、逻辑回归、神经网络、计算机深入学习研究等;针对所描述类型的对象,先分别进行了聚类分析、关联分析、最优化方法等。然后再按照所选定的建模算法,使用分析模型方法得到模型。例如,利用摄像机获得的监测画面,通过图象/影像数据结合的流计算实时分析发现输变电装置问题;通过信息关联分析和主成分分析和聚类分析技术,通过关联的技术设备状况信息、电网运营信息、设备故障知识背景信息、环境信息、天气实况和预测信息等信息,构建设备的故障预判模式,从而进行设备潜伏性故障预测;通过聚类分析和关联分析技术,构建在产品管理体系中的设备故障信息,和物资供应商的质量记录、设施适用情况信息、设备检测结果信息之间的关联关系,从而完成对物质供应商质量问题的追溯和闭环控制。
2.5可视化服务
通过可视化的组件库与系统设计器,能够实现可视化配置服务分析场景,并提供自助式或"DIY"的交互式可视化数据展示。
三、基于大数据方法的输变电设备故障数据可视化方法展望
3.1用于移动设备的可视化技术
采用大数据分析方法的可视化分析方式,可以通过类别众多的背景信息搜索出适合于各种应用场景的数据和方法。因此.这些可视化技术不但适合于在设备的控制中心上实现信息的显示,而且适合于在远离计算机屏幕的设备维修人员上应用。
如何在移动设备上更高效地进行大数据分析的可视化工作,是十分值得重视的。这类设备由于往往具有更小的显示屏,所以对显示的图像存在着更多的空间局限性,当显示较复杂数据时往往很难让使用者更直观地对数据加以理解,从而要求研究人员需要研制出更为有效的数据显示技术。而移动装置往往具有更多的输人方式,如触控屏、陀螺仪、电子罗盘等,而怎样使用这种资源也是研究人员必须思考的因素,例如电子罗盘就能够辅助使用者观察特定方位的数据。
3.2丰富人机交互的可视化技术
目前的大数据分析显示平台主要为静态或人机交互图形,使用者可通过自身的选择来对数据分析的可视化做出一定程度的定制。但是这些模式的选择输人与图像输出人并不能一致,也就是说选择输入人通常是完全独立于图像自身的菜单和按键。在面对着大数据多选择人的情况下.这个方式显然较为复杂。
因此,致力于更丰富多彩的人机互动的可视化科技迫在眉睫.这项功能可以使图像显示的参数和图像本体实现无缝融合。使用者也能够通过浏览图片里的管理单位从而得到该管理单位较为详细的展示数据。
结束语
在新大数据分析方法的发展背景下,传统的数据可视化技能已不适用作国家电网企业对输变电设备的故障数据呈现,所以本章主要介绍了基于R语句的高维、高速响应、能进行海量低价值密度数据分析的数据可视化技能。内容涉及层次分类、即时展示、相关性分析、事件频率等,这些数据可视化方式可以为后期的大数据分析技术发展。
参考文献
[1] 尹立群, 郭丽娟, 张玉波,等. 一种电力输变电设备故障数据的可视化分析方法:, CN106055548B[P]. 2018.
[2] 王珣王馨赵盟许鹏马琳. 输变电设备状态大数据分析应用探讨[J]. 贵州电力技术, 2018, 021(001):1-5.
[3] 王斌. 大数据可视化分析技术应用研究[J]. 科学与信息化, 2021.