一、数据挖掘技术在软件工程中的应用过程
数据挖掘技术及时数据库中的信息知识,它产生和发展的基础是数据库。其的发展历程,是对理论的研究进行实际应用的转变,并将它与其他领域的共同结合应用,使它自身的作用得到最大的发挥。软件工程的概念在1967年被提出,它的主要目的是通过维护和构建工作,从而创作出实用有效的软件,针对客户需求产出有所需的产品。目前,数据挖掘技术在软件工程中的应用越来越重要和迅猛。
二、数据挖掘技术在软件工程中的应用
(一)在软件项目中的应用
数据挖掘在软件工程管理中的应用主要体现在两个方面,一方面是挖掘组织关系,另一方面实地版本控制信息的挖掘。对软件工程的管理是一个非常复杂的过程,通过对人力资源进行协调和分配,来对人员组织关系的挖掘。举个例子,如在一个软件工程项目的开展过程中,可能会有数百人,甚至上千人来参加,在工作进行的过程的当中,都会产生信息交流和传输,电子邮件和文档都会产生交互,在这其中势必会造成一定的秩序混乱,降低工作的效率。而数据挖掘技术在软件项目管理中的应用,就可以很好地将工作人员和团队的组织关系进行关联和区分,推进软件项目管理的顺利开展。
(二)在开源软件中的应用
开源软件就是指代源代码属于开放式的应用,开源软件与其他软件类型相比较而言更受到群众的欢迎,主要原因还是其属于免费软件。对于这种情况而言,利弊分明,这一类软件在受到广大消费者青睐的同时,也对软件各个进程的管理造成难度和负担。所以在面对这些问题时,需要结合实践经验和现实情况,将数据挖掘技术应用到开源软件的质量提高上去。在日本大学校园里,就有学生在基于基本数据处理的功能上,利用大规模的数据挖掘技术进行对其的挖掘,处理和分析,从而获得想要的数据资源。
(三)在机构代码中的应用
机构代码就是指程序代码,也可以指克隆代码,顾名思义就是对代码进行简单的复制和粘贴得到可以再次使用的代码。数据挖掘在克隆代码中的检测作用也是较早产生的,到目前为止,对克隆代码进行数据挖掘的方法有以下几种:基于文本比较法,基于标识符号对比法,基于程序结构表示的方法以及运用潜在语义检索等方法。其次是对横切关注点的挖掘,这一方面主要是因为有些关注点在它的程序代码中非常的相像,甚至就是原代码。
(四)在软件故障中的应用
数据挖掘技术在软件故障探索中的应用也是非常广泛和有效的,它除了能够在完成必要的挖掘任务之外,还能根据所需要的程序执行记录来对其进行具体说明的挖掘,可以通过这些程序对软件中出现的故障进行及时的测定判断。在对程序挖掘的进行过程当中,首先需要明确挖掘的目标和初中,在对所需要的信息进行跟踪追寻,再结合实际情况和信息进行建模工作,这样就能在极大程度上加深对程序的了解,对以后工作的进行提供便利。在当代得到广泛应用的挖掘方式中,种类复杂繁多,其中基于规则化和自动化的两类更是得到广泛的传播和应用,对于前者来说,其就是按照具体的程序来进行探索必要的规则,然后选择合理恰当的逻辑表达式来进行论述表达;后者就是对处理方式变的更为抽象化,进行抽象处理和挖掘。
(五)在软件维护中的应用
1.在软件修复的环节
软件修复过程中,会根据鉴别和评估软件缺陷程序,确定其修复的先后顺序,从而找到每个缺陷对应的最合适的修复者。在缺陷进行自动分配的方法中,通过将缺陷分配转化为文本的问题类型中,采取措施进行修复,但缺点就是准确率非常低。但是如果将其转变为强化检测重复缺陷报告技术,在技术中再增设执行和自然语言两种信息,根据定义的向量维度来表示软件的缺陷,最后获得两种相似度的加权,从而可以达到为缺陷者选择合适修复者的目的,通过实验证明,这种技术的正确率可以达到65%以上。
2.在软件改善的环节
软件结构优化的前提应当是先理解软件设计和程序。在对软件理解的过程中,可以采取跟踪软件需求的方式在需求文档中发现和设计与条目文档具有对应关系的条目,从而对软件是否符合相关法律进行保证。通过构建软件测试程序,对漏洞库中的数据进行收集,整理和分类,再借助科学的数据挖掘方法进行训练和验证,从而对其进行定位,分类和描述。
三、结语
总而言之,随着我国经济社会的发展,信息化时代的脚步也在快速前进,在这个信息大爆炸的时代,人们对于数据的处理也大大增加。互联网大数据技术的产生和发展,也帮助人们更好地对数据进行处理,挖掘和分析。数据挖掘技术是人们解读信息的重要步骤,会让人们更好地接触到复杂而又充实的信息环境,帮助获取更有效的信息。本文将对数据挖掘技术在软件工程中的应用进行分析和探讨。
参考文献:
[1]王祎菡.软件工程中数据挖掘技术的应用[J].电子技术与软件工程,2014(14)
[2]陈建桦.数据挖掘技术在软件工程中的应用研究[J].硅谷,2016(18):171