铁路大数据应用及实施策略研究
张相国
生成PDF 清样下载 引用

复制成功

导出题录

参考文献( GB/T 7714-2015 ) 复制

张相国,. 铁路大数据应用及实施策略研究[J]. 数据与科学,20243. DOI:10.12721/ccn.2024.157027.
摘要: 大数据是继云计算后的新一代信息技术,其开发与应用正深刻地影响着政府、企业的决策以及人民的生产生活。大数据标准体系就是为了在大数据领域内实现标准化而建立的一个系统。当前,各类大数据存储产品以及面向各个行业的大数据应用层出不穷,如何通过标准化的渠道来规范人们的认识、整合资源、推动各方达成共识,是大数据产业良性发展的重要前提,在保障数据安全性的前提下,也需要推动大数据交易等新业态的有序发展。铁路运输生产与运营过程中,产生并积累了大量的旅客出行、货物物流、安全监控、工程施工等数据。这些数据的应用对推动国家综合交通系统的规划与发展,满足社会公众与工业企业对交通信息需求的不断增长,服务“走出去”、“一带一路”等国家战略的实施具有重大的理论意义与现实意义。
关键词: 铁路;大数据;应用;实施策略
DOI:10.12721/ccn.2024.157027
基金资助:

一、大数据价值分析

大数据时代,大数据已经成为国家的基本战略资源,其规模与使用能力是衡量一个国家综合实力的一个重要指标,被称为新石油和钻石矿。在进行大数据应用前,首先要弄清楚大数据给我们带来了什么价值。

1. 技术层面的价值

大数据技术层次上的价值在于,在不涉及业务功能的前提下,单纯利用大数据技术,提高现有应用程序的运行速度与效率。大数据是指具备“4 V”特性的数据集,其规模大、种类多、运算速度快、价值密度低。这种情况下,常规的数据处理方法已很难应付。由于大量的数据,使得处理过程缓慢,并且需要很长的时间来进行处理,很难达到实时的需求,从而影响了用户的体验;在海量的视频、音频、图像和网络日志等数据中,传统的分析方法已不能有效地处理这些数据,造成了大量的有用信息的损失。利用分布式存储、分布式计算、内存计算等大数据技术,把一项大规模的数据处理任务拆分开来,分散到多台服务器上进行并行计算,大大提高了处理的效率,并且能够迅速获得处理结果。在此基础上,利用非结构化文本分析、深度学习等技术,实现对数据的快速、准确处理与分析,并从中抽取有用信息。

2.业务层面的价值

大数据商业层次的价值意味着,通过采集、整理、处理和分析数据,可以获得以前潜藏在数据后面的有价值的资料,为进行决策的判定提供了必要的支持。《促进大数据发展行动纲要》指出,要发现新知识,要创造新价值,要增强新能力,要用数据说话,要用数据做决策,用数据管理,用数据创新。

大数据的含义或者说价值,归根结底就是四个字:辅助决策。通过对大数据的研究,可以总结经验,发现规律,预测趋势,实现从经验支撑到数据支撑的转型。通过搜集和分析有关的资料,为管理决策提供参考,既能消除人为因素造成的主观、片面性和局限性,又能有效地减小由于缺乏资料支持造成的误差,从而有效地减小了决策的风险。

二、铁路大数据的应用

1. 加强市场分析和预测

大数据技术可以收集到大量的原始信息,为市场分析与预测提供强有力的支持。区别于传统的以抽样调查的统计数据为重点的分析手段,以大数据为基础的市场分析与预测技术,不仅可以充分地运用这些大数据,对客、货物运输的完整、全面的演变过程进行分析,并对其进行深刻的剖析,从而对其未来的发展趋势进行预测。同时,还可以利用物联网技术,如 GPS、传感器等,收集获得精细的交通信息,并将政治、经济、其它交通方式、气候等影响因子纳入互联网,进行人货两流的精细化解析与影响要素间的关联关系研究,深入剖析影响客流变动的主要影响因子的作用路径及滞后时间,进而定量刻画各个因素对客流变动的影响程度。

2.提高运输收益管理

收益管理就是根据对市场需求的精确了解,对铁路运输资源进行全面、合理的利用,对各种运输产品进行设计,并将其按照适当的价格体系进行销售,从而达到铁路收入的最大化。长期以来,我国铁路部门在开展收入管理时面临的最大困难是:市场需求的准确识别、运输产品的定价、目标人群的确定,大数据技术为解决这些问题提供了可能。

运用大数据技术,铁路可以实时或半实时地获取和监测市场信息,对客户在运输产品或运输服务方面的需求进行监控。通过对已有运输产品的经营数据、客户对已有运输产品的反馈信息进行收集、评估,并与已有的运输产品进行综合评价,并将其与已有的运输产品进行整合,并通过对其进行分析,从而实现既有运输产品的市场需求,又能满足铁路的实际需要。通过对历史上铁路运价变化的分析,研究不同顾客群对货运产品价格的敏感度,在此基础上,建立运输产品的定价策略和定价系统,并对目标顾客群进行营销,达到准确的铁路营销定位,使运输产品与市场需求更加契合,从而提高铁路收益。

三、铁路应用大数据技术的实施策略

1. 工作思路

借鉴和行业在大数据领域的实践,大致可以分为两个方向:(1)自下而上,将企业的全部数据进行集成,进行全面的数据治理和标准化等工作,建立一个企业的数据模式,对这些数据进行数据分析等工作,这种方式在互联网和金融行业中得到了广泛的应用。(2) 自上而下,也就是从特定的大数据分析要求出发,导出所需的数据,对以上数据进行汇总,进行数据清理与整理,最后通过对大数据的处理来应对各种要求。

铁路总公司层面因为持有的结构化数据比例较高,所以很容易形成一个统一的数据规范,并对统一的数据模式进行计划。所以,可以参照具有良好数据品质的网络和金融业,自下而上的开展大数据工作。由于各铁路局非结构化数据比例过高、数据质量偏低、数据大集中成本较高且难度太大,因此可以采取自上而下的思路。

2.分部门汇集整理数据

铁路不同部门之间的信息化程度并不统一,对大数据的处理能力也存在较大差异。为此,应根据铁路总公司、铁路局的总体规划,对信息化薄弱部门进行完善。在信息化程度高的各部门信息系统中,应优先对其进行汇总和整理。同时,率先进行数据汇总的部门,也能为后续的相关部门提供了一个探索性的示范。

3.主数据和GIS平台同步建设

主要数据是指能够在不同的业务部门中重复利用的企业核心商业实体。主数据平台由主数据查询、下载、版本管理等组成。并且,在铁路大数据工作中,还需要将各个部门的数据进行整合,比如车站、线路、物资编码、组织机构和人员等,因此,主数据的标准化将直接影响到大数据工作的成功与失败。

GIS平台实现了车站、线路、固定设施等元素的三维可视化,并支持铁路局管界、站段管界等图层服务。同时,它还可以实现铁路公里标与经纬坐标的相互变换,可以在地图上直观地显示地理信息相关的数据或大数据分析的结果,从而方便人们更好地了解数据。

GIS平台与主数据平台是对大数据平台的有效补充,可以在数据准备与展示两个层次上为大数据工作提供支持。

4.加强非结构化数据分析能力

铁路部门在生产运行中产生了海量的非结构数据,包括故障报告、供电设备检测图像、周界入侵检测视频、客服语音记录等。其中包含了许多有用的信息,但是利用效率却很低。随着深度学习在图像识别,语音识别,自然语言处理等方面的快速发展,传统的以模式识别、专家规则为基础的研究方法正逐步被替代。由于深度学习是一种新一代的神经网络,它更适合用来进行无结构数据的特征学习,并与机器学习分类器相结合,可以更好地对非结构化数据进行分析和挖掘。

参考文献

[1]胡卫平.大数据助推铁路创新发展的思考[J].理论学习与探索,2021,0(1):52-54.

[2]马小宁.铁路大数据应用实践及展望[J].铁路计算机应用,2019,28(4):8-13.