PDF下载
数据挖掘技术在软件工程中的应用

李鑫

黑龙江外国语学院,黑龙江哈尔滨,150025

摘要: 社会的不断发展,促进了计算机技术的进一步提高,也使得软件工程的任务变得更加繁琐。同时,人们对于软件研发的要求也逐渐增多,其使用的范围也在扩大,所以软件研发的复杂程度不断提升。而数据挖掘技术以其综合性强的优势,能够在一定程度上缓解研发人员的压力,有效满足软件开发工程的相关需求。本文通过对数据挖掘技术的应用作用的分析,提出了该技术在软件工程中的具体应用。
关键词: 数据挖掘技术;软件工程;计算机
DOI:10.12721/ccn.2023.157083
基金资助:
文章地址:

 数据挖掘技术在软件工程中起到了一定的辅助作用,最初是帮助工程人员查找能够循环使用的程序代码,而如今,因为工程工作逐渐复杂、困难以及技术的进步、升级,使得其功能也变得更加强大、全面。目前,数据挖掘技术能够在软件工程中将各个数据信息进行统计、分析、归类、查找,并对出现的故障、漏洞问题进行有效解决,为软件工程提供了有力的技术支撑。

1.数据挖掘技术在计算机软件工程中的应用

1.1应用于信息挖掘

第一,由于软件工程包含的内容较多,其中的数据信息也就更为繁杂,所以工作人员处理起来非常耗费精力,但是在使用了数据挖掘技术后,其就可以对数据信息进行全面的把控,将数据信息整合、实行合并式管理,让软件在升级、研发时,也能够将数据信息实时同步更新,这就在很大程度上提高了软件工程的效率和质量。同时,该技术中存有丰富的数据信息,可以提供给研究人员进行学习借鉴,增加关于软件内部构造的理论知识,从而可以更好的将该技术与软件工程相融合,发挥出其更大的价值,为工程中其他部门的人员提供强大的技术支持,推动软件研发工作进一步发展。

第二,在版本控制系统中,数据挖掘技术的作用就是让软件研发参与人员一同编写的档案和数据信息、文件资料能够保持统一性,保证后续的数据更新工作能够更有效率的开展。版本控制是软件工程中最常使用到的一种对相关研究信息进行监管的工程技巧,将该技术和其相结合使用,便能挖掘出更改信息的历史记录、以往版本模块和系统之间的关联性,进而能够对软件程序投入使用的结果进行预测、对其之后的变化进行及时的跟踪检测,以查找出其中隐藏的漏洞。可见,数据挖掘技术能够显著提高版本控制系统的维护率,强化软件后期的安全性,有效减少软件存在的缺陷,减少维护成本,从而提高了软件研发的质量。

1.2应用于软件执行记录

在数据挖掘技术使用过程中,需要对软件执行时的数据记录进行综合地分析和挖掘,并对软件的应用性能进行全方位考察,从而让其完全符合预期的判定标准。所以,在深入分析挖掘执行记录的时候,要认真寻找设置好的安装路径,并且使用逆向建模法来分析数据的构成,以便对之后的软件维护形成有利影响。为更好保证设备能够正常运行,除了应用技术手段对记录进行监控,工作人员也应该对软件问题加强关注,及时发现运行问题并积极解决,同时,程序规约挖掘还会注重剖析与其相关联的其他程序的状况,从而能够快速地发现和解决与之对应的程序代码。除此之外,为了确保记录追踪的有效实施,可利用反向建模技术综合检验、维护所涉及到的各个步骤。其流程包括:①对目标系统进行初步的接入安装;②将与挖掘软件相匹配的API接口、程序、系统的状态变量进行研究处理和记录;③将追踪时获得的数据信息进行筛选及合并同类,以此建立能够对相关系统全部性能进行准确描述的标准模型。

1.3应用于软件漏洞检测

通过数据挖掘技术对研发的软件进行漏洞检测,能够有效减少软件后续开发步骤、应用步骤中出现漏洞、缺陷的情况,从而可以有效加快软件的研制进度,确保系统运行的稳定性、可靠性和安全性,为之后的研发工作奠定了良好的基础。同时,该技术还能够将检验出的漏洞进行及时处理、修补,增强了软件系统的安全性和运行性能。数据挖掘技术在这方面的应用步骤包含有:①选择合理的漏洞检测方法,进行信息漏洞采集。在对客户的具体要求清楚掌握后,制定相应的软件检验步骤和方案,对既定软件中的所有信息进行全方位的检验、考察、剖析,之后对采集到的重要数据资料进行研究,以便对于软件出现漏洞的根源进行定位,最后便可对存在缺陷的数据、程序进行删除或更改。此外,还要借助有关技术的帮助,挖掘软件的初始信息、研发来源、开发目的,从中提取出存在问题、漏洞的所有相关数据,进而清除无存在意义、多余的数据信息,补入缺少的重要数据。②选取适合的数据模型,利用其进行软件漏洞检测的培训项目,并以软件研发目的为参考,选取科学合理的挖掘方法,形成有效的测试集、训练集,经过试验研究,找到最为恰当的方式。其次,按照规范步骤对漏洞检验工作反复进行实操训练,从而寻找到更多的未知漏洞,丰富人员经验,进而更好将数据漏洞知识运用到未来的软件检验工作中。

1.4应用于软件管理

数据挖掘技术可以检测到软件应用中各类数据的运作规律,当软件发生运行终止、卡顿、崩溃等问题时,就可以在问题根源处运用同一类别的数据运作模式,让其进行自动修复,且还能够降低同种类型故障产生的几率。其中最常见的故障根源定位技术为程序切片,其适用范围非常广泛,但是由于社会市场发展,软件工程的研发工作变得更加复杂,导致其切片技术定位功能的精准度不够,不再具有满足工程要求的能力。因此,要加强数据分析处理工作,尽量缩小问题根源出现的范围,以此来降低定位工作的困难程度。

2.数据挖掘技术的应用方法

2.1关联法

关联法即为一种常用来分析两个独立事物间联系的方法,将其与数据挖掘技术相结合,便能够形成一种有效的数据采集和分析方式。其次,在使用关联法的时候,要遵循利益关联原则,将数据挖掘技术与计算机软件工程有机地融合起来,依据两者之间的关联特性:支撑度和置信度,按照规定要求建立起相应的关联体系。

2.2分类法

在数据挖掘技术的具体运用过程中,需要使用类别标记来对执行动作进行分析和预测,之后,针对其类别特征构建分析模型,再依照规则输入数据。而在建立模型时,技术工作者应注意观察相关数据种类,以突出其实用性。另外,在数据挖掘技术的分类方法中,普遍采用的是以网络和最接近分类为原理的鉴别树算法。

2.3聚类法

在软件工程中使用聚类法时,必须按照规定的分类标准,将软件研发的数据信息划分整理、归类。因此要尽量让同类数据资料之间具有一定的相似性。与此同时,通过聚类技术,对有关数据进行科学的分类,便保证了数据信息处理的科学性和有效性,从而提高软件数据处理的效率和准确度。

结语:当今社会,因为信息科技的快速发展,使得许多新技术被研发出来,数据挖掘技术就是其中之一,并且该技术在发展过程中逐渐成为了软件工程的关键构成部分。因为其能够将软件工程中的研发过程进行优化,将杂乱数据信息进行收集分类,并避免了数据过多造成系统的瘫痪,进而有效提高了软件研发的质量和效率,保证了软件运行的稳定性,推动了软件工程行业的快速进步与发展。

参考文献:

[1]武琳琳.数据挖掘技术在网络故障诊断中的应用[J].中国高新科技,2022(23):57-59.

[2]米仁沙·艾尼.“互联网+”背景下数据挖掘技术在软件工程中的应用路径[J].网络安全技术与应用,2022(02):61-63.