引言
时下,我国的移动互联网发展速度之快,移动通信技术应用之广泛,极大地方便了广大人民群众的工作、学习和生活。通信网络建设在经过建设期、发展期和稳定期之后,随着网络通信用户基数的逐渐增大,人们的需求和感知要求也在不断增高[1]。过去传统的依赖计算机技术的应用方法已远远不能满足当前信息存储、分析体系和通信网络用户的需求。针对这些问题,本文以通信网络系统优化中大数据分析技术的应用为研究课题,从三个方面进行探索。
1.大数据分析理论与关键技术概述
1.1大数据分析理论的主要内容
大数据分析理论的主要内容有三:一是聚类分析理论;二是关联分析理论;三是预测分析理论。聚类分析就是在对数据进行分析的基础上,先对大量的不同数据进行类别定义,然后将类别相近的数据进行量化,再从同类属性的数据中提取有用信息,以提高数据信息的层次性[2]。关联分析就是在对大量分散无序的数据进行聚类分析的基础上,建立相对稳定的数据群,然后在这些数据群中,运用关联分析法,从不同角度来分析聚类内部数据之间、不同类别数据之间的联系[3]。预测分析就是在对大量数据进行挖掘和进行可视化分析,已知结果的基础上所作的预测性判断的过程,称之为预测分析[4]。
1.2大数据分析技术
大数据分析的主要关键技术有三:一是数据采集技术;二是数据库分析技术;三是对决策技术的支持。作为大数据分析的关键环节的数据采集技术,核心功能是收集、滤化以及传送数据。采集数据的类型分为三种:主要是担负数据的收集、过滤和传输。进行数据采集的产品主要有三:⑴克劳德拉公司的FIUME;⑵LinkedIn公司的卡夫卡;⑶波动的楚克瓦。其中: Flume作为分布式日志收集系统是克劳德拉公司开发,是目前使用性能最佳的数据采集系统;KafKa是高吞吐量的分布式信息系统,符合收集日志、处理数据流失、处理消息等场景的应用;作为Hadoop的子项目的楚克瓦,通常在大型分布式数据收集系统中广泛应用,核心功能是对客户端的数据流进行收集汇聚。数据库分析技术的运用可以为通信网络优化提供基础数据搜集、处理和信息保障,能够针对地域网数据利用数据库存取方式进行问题定位和有效分析,规划网络的优化,通过质量大幅度提升满足客户。决策支持技术是用于为通信决策人员提供决策支持的一种技术,这种技术就是决策树算法,它可以对基础数据进行分类,从中找到具有重要价值的信息,并快速进行分类和用语言进行描述。对大规模的数据分析、处理和移动通信网络的优化工作尤为适合[5]。
2.通信网络系统优化中存在的主要问题
2.1通信网络系统优化中的前台测试工作滞后
通信网络系统优化中的前台主指道路测试、定点测试、现场调整等工作类型。在移动通信网络用户的使用过程中,时常出现网络覆盖盲区、网络信号服务较差、中途掉话、无法接通等问题,这些问题的出现给通信网络优化人员带来了极大的困扰,他们往往疲于奔波,哪里出现问题就到哪里进行道路测试,然后再做一些亡羊补牢的工作,使通信网络系统的优化工作处于严重滞后状态,道路测试的成本也越来越高[6]。
2.2通信网络系统优化中的后台数据分析出现瓶颈
通信网络系统优化中的后台主指警告监控与处理、故障排查与定位、KPI分析与优化等工作类型。这些年随着5G时代的到来,移动用户猛增,原来建设的网络规模已远远不能适应现在的需求,运用传统的故障排查和告警监控方法已很难解决现实的问题,比如,建网初期,基站建设少,网络用户也少,故障点也少;网络快速发展之后,基站成倍的增加,网络用户也在成倍的增长,自然网络故障也会按比例增加,受影响的用户群体也会增加。通讯网络优化的目前这种瓶颈状况,如不及时采取新的管理办法和分析处理手段,通过网络结构的清晰化进行优化管理,就会制约通信网络的可持续发展,不能优化通讯网络系统的。
2.3通讯网络系统优化中的投诉业务增多
通信网络中的投诉主指移动通信用户在使用通信网络过程中,对使用的质量问题向运营商进行反映情况,要求予以解决,比如速率慢、无法上网、无法接通、串线、掉话等问题。通信网络中投诉业务的增多,给网络优化人员带来了极大的工作量,也增加了通信运营企业的经营成本。
3.通信网络系统优化中大数据分析技术的应用对策
3.1运用数据库等关键技术对通信网络前台进行预测分析
针对通信网络前台的故障问题,本文认为,应从三个方面入手: 一是通过网络测量数据和网络业务数据进行建模,掌握分析网络的整体状况,更难以进行评估和定位;二是对网络动态业务和模型的获得必须利用道路测试数据实现;三是在网络测量和道路测试的基础上开展综合分析,进行反向推理,验证问题发生的真实程度,为后续通信网络的优化,提供预测分析数据和行之有效的建议。具体预测分析流程:第一,进行基础数据的采集。主要有六:⑴详细说明文档;⑵系统配置数据;⑶统计数据;⑷手机测量数据;⑸地理信息文件;⑹路测数据。第二,构建矩阵分析框架,优化矩阵分析的六大功能。分别是覆盖优化、邻区优化、频率优化、网络健康检查、路测栅格分析以及干扰源挖掘与消除等[7]。其具体分析流程详见图1。
图1 : 矩阵分析流程图
3.2优化聚类分析的后台数据及其应用
3.2.1优化后台数据库的构成
后台数据库的优化步骤有三:一是数据库建表。虽然数据库的结构是固定的,但数据库的数据内容是动态的,不断变化的,要不断进行完善。在表格方面有必要创建和完善的包括:网络基础配置表、网络网元表、网络新能表、网络告警表等。二是建立数据库查询表。三是建立数据库更新表,以便为通信网络优化人员及时准确地提供有效数据[8]。
3.2.2优化聚类分析的后台数据实施方案
为了帮助通讯网络优化人员从大量分散的、无规律的数据中获取有用的信息,更有必要聚类分析诸多的网络KPI数据,并进行各自权重的赋予,真正有说服力的数据必须进行加权计算,方可更有效、更准确。聚类分析的概念,即是针对性极强的分类方式,目标是所罗列的所有指标,根据分类进行权重的赋予,按照优先级和重要性分别进行加权平均,最终形成指标评估机制。如此方式获取的网络KPI评估与预测结果,更具备有效性和合理性,更具备普及推广的价值。
3.2.3聚类分析后台数据模型的有效优化
以上述的数据聚类分析和数据库存储为前提基础,构建经过聚类分析优化的后台数据模型。其步骤是:首先,进行后台数据采集;其次,进行后台数据分类,详见表1;最后,建立聚类分析模型。
表1:后台数据分类表
3.2.4实现后台数据的自动优化
自动优化后台数据,并非是真正意义的自动化,而是有针对性地处理存在问题的指标或者数据,主要是面对移动通信网络,进行后台数据的问题分析和问题定位,最终提炼出处理问题的措施。
3.3优化关联规则的网络投诉方案
用户对网络运营情况进行投诉是正常情况,关键是遇到投诉后如何进行有效地处置。对此,本文认为,建立一个优化了的关联规则网络投诉方案,是解决问的有效办法。
所谓关联规则是对数据的综合分析和问题定位,数据的对象包括后台关键数据、用户投诉内容、用户业务类型、用户地理位置等信息,因此形成特定的关联系统,划定对应的区间,然后聚类分析某段时间内的投诉,以此定制批量的优化方案。例如,针对投诉问题的类型,将后台数据有效关联就可以分析用户业务内容和网络报警情况,并通过举一反三的模式,将同类型的投诉问题在短时间内解决,因此既节约了通信网络优化人员的精力,同时也节约了时间。其具体方法有七:一是建立评估体系,主要是按照覆盖率、通话质量、用户满意度等进行建立;二是针对评估项,建立对应的KPI指标体系;三是进行不同评估项权重的设置;四是网格化管理特定区域的移动通信网络;五是构建小区和网格的对应关系,依托区域内的小区指标进行性能数据和MR数据指标的计算;六是验证评估结果可以使用投诉数据,并对评估体系有效性和合理性进行检查;七是利用投诉数据与评估结果的双向验证,有效推广和应用依托关联规则的投诉处理模式。
4.结论
综上所述,本文以理论联系实际的方法,从三个方面对通信网络系统优化中大数据分析技术的应用 进行了探讨。首先,从理论研究的视角对大数据分析理论与关键技术进行了探讨;然后,从现实的角度对当前通信网络系统优化中存在的主要问题进行了剖析;最后,从解决问题的角度对通信网络系统优化中大数据分析技术的应用对策进行了研究。具体研究成果有三:一是运用数据库等关键技术对通信网络前台进行预测分析;二是优化聚类分析的后台数据及其应用;三是优化关联规则的网络投诉方案。
参考文献:
[1] 康波,刘胜强.基于大数据分析的互联网业务用户体验管理[J].电信科学,2013(3):32-35.
[2] 刘洁,王哲.基于大数据的电信运营商业务精确运营平台的构建[J].电信科学,2013 (3):22-26.
[3] 王曰芬,宋爽,熊铭辉.基于共现分析的文本知识挖掘方法研究[J].图书情报工作,2007(4):18-22.
[4] 张春磊,杨小牛.大数据分析(BDA)及其在情报领域的应用明.中国电子科学研究院学报,2013(1):17-23.
[5] 姜开达,李霄等.基于网络流量元数据的安全大数据分析田[J].技术研究,2014(5):33-39.
[6] 李存华,孙志挥一类数据空间网格化聚类算法的均值近似方法[J].软件学报,2003,14(7), 1267-1274
[7] 牛馄.聚类分析中若干关键技术及其在电信领域的应用研究[D].北京邮电大学博士学位论文,北京,2007:49-57.
[8] Jiawei HAN; MICHELINE KM.数据挖掘概念与技术四.范萌,孟小峰,译.北京:机械工业出版社,2007:131-139.