1 引言
产品质量管理和控制需要对工业生产全阶段进行预测、分析、考核、计算[1]。对企业质量改进、成本控制、经济效益、发展改革有着重要的决策影响。可见,通过对产品质量进行全方面数据监控和评定,以有效措施改善生产中存在质量隐患,降低隐性成本,对于实现企业长久经济发展有积极作用。
2 影响工业产品质量的因素
工业产品生产是一个十分复杂的过程,生产运行时其中涉及着多种机械产品,产品受环境影响参数大。常见的性能参数有质量、厚度、伸长率、变形程度等。按照常见工厂建设要求评估分析,工业产品质量受多方面影响,其中结合工序环节,相关工业生产专家提出了(5M1E)理论法。相关影响元素有人、材、机、方法、检测、环境6种。在以上因素影响下,工业产品质量会存在不同程度差异。
② 力(Man):指的是劳动力劳动技能掌握程度、文化水平、身体素质、劳动态度。
②机器设备(Machine):代替人力劳动力机械设备,其设备先进程度、技术性能、使用频率和维修状态也会影响资料
③原材料(Material):原材料质量、成本、外观形状和使用方式会影响产品质量。
④技术(Method):生产技术标准与否、操作流程和操作正确与否都会影响产品质量。
⑤测量(Measurement):正确的检测方法和仪器会对评判质量标准造成影响。
⑥环境(Environment):工厂建设环境、温度、照明、空气流通程度会对生产人员的安全健康和产品质量造成影响。
通过5M1E方法,能够对质量结果进行预测和控制。减少可控风险造成大规模产品质量风险。也能对工厂的环境质量和管理进行改善。
3 产品数据质量数据信息采集
在数据采集模式下建立的质量分析体系,能够实现数据采集和产品质量的预测和控制。由于影响产品质量因素较多,并且产品质量相关采集的数据信息量大、内容复杂。对此,需要结合实际需要建立适合的信息采集分析体系。常见的体系有:“动态数据”、“静态数据”两个分支。
3.1 动态数据采集
动态数据的采集建立在产品生产的全过程。常见的类型有废品报废、产品返工维修、质量费用索赔等。通过相关因素数据的采集分析,将工厂加工产品各项运作状态进行数据收集,如在一个时间段内零件返工、返修维护、报废率进行精确全面的采集。为后续质量和成本控制提供必要的参考分析,也能进一步优化产品生产工序,实现产品质量的进一步拓展建设。
3.2 静态数据采集
静态数据是指的是在基于产品生产长时间是固定不变的数据,例如在一定范围内工厂人员的薪资结构、人员数量、工资福利、机械固定折旧损失、质量监督评审费等。静态数据的收集是通过相关质量检测人员定期收集数据收据以及报表,结合质量检查记录进行整合。
4 常用数据挖掘工具分析
结合当代数据挖掘相关应用,本文对常见几种类型的数据挖掘工具进行了相关分析,如对于预先数据处理的SPSS;用于时间序列分析的Clementine;分析神经网络的MATLAB工具等[2]。
4.1 MATLAB
MATLAB被称为矩阵实验室,它主要用于算法开发、数据可视化等功能,它也能实现交互式数据管理,实现智能化数据分析的功能。和很多软件模块交互式使用,它能在特定环境下开发工具箱学习、产品应用评估等功能,帮助使用者使用优化代码编写流程。如今,MATLAB也开发了如数据库接口、算法优化、模型预测等功能。在产品质量预测与控制方面,它能提供一个创造、传递、学习和训练的函数环境,为相关工业产业进一步预测产品质量提供了一个好的平台。
4.2 SPSS
这种程序是以较为常见的统计分析软件,它能实现数据分类管理、图表统计分析以及相关结果的管理输出等。其还能实现对回归模型、时序性分析等操作。在具体操作中,它能够支持我国广为运用的Windows系统,操作简便,通用性广,不需要进行转码和编程运行。
4.3 Clementine
Clementine是由专业的商业开发公司研究的数据挖掘平台,它的特点是能够迅速结合工业生产的需求建立理想型预测性模型,将其投入到工业生产的控制之中,从而帮助人们改变工序,降低产品生产成本,同时也帮助数据检测人员对于数据进行深度挖掘,保证在其人工智能、关联分析优势上帮助工业在短期内提高投资回报率。这种工具也能优化如神经网络、聚类分析等模型建设[3]。
5 常见质量预测以及控制模型分析
结合当代数据挖掘相关应用,本文对常见几种类型的数据挖掘工具进行了相关分析,如对于预先数据处理的SPSS;用于时间序列分析的Clementine;分析神经网络的MATLAB工具等。
5.1回归模型分析
回归模型原理是通过成本数据库数据整合,结合产品生产项目现阶段成本建设要求和目标进行一定程度的质量水平评估,从而有助于建立适合更为合适的质量生产模式。这种模式能够利用生产过程中一系列类动态数据和静态数据对产品质量进行预先预测[4],如存在不理想实验结果,可以通过相关规则改变制定,根据工序流程和影响因素进行适当改善,从而找到最适合产品质量的生产模式。
5.2 BP神经网络模型分析
BP神经网络模型利用了数据挖掘相关算法,能够逼真地还原工序流程,让虚拟产品质量在预测中贴近真实情况[5]。这种网络系统模型接住了MATLAB系统,经过大量的工业实践中,这种技术在产品各方面性能预测、质量评估有着精细化的作用。同时,其在运用中带来很多问题,如BP神经网络的黑盒运算模式不能精确解决隐含层节点个数相关问题,导致实验室会出现数字反复循环现象,降低产品质量预测可信度和可控性。同时,这种方式也不适用于反归一化标准,在特殊使用时存在较大误差性。
5.3 径向基函数神经网络模型分析
通过对BP模型的优化,这种模型能够降低黑盒运算兼容性误差影响,提升反归一化标准相关运算的精准性,相关领域专家研发了“径向基函数神经网络模型”。这种方式能够有效克服隐含层节点相关问题,采用聚类方式也能实现稳定性预测和控制产品质量。
5.4 时间序列模式分析
以上方式采取建模的方式都对产品质量预测和控制进行了有效分析,不过耗时较长,在时间效率方面存在缺陷。对于产品生产,时序性也是主要考虑的重要因素之一。对此,需要通过时间序列模式进行数据化挖掘算法,实现综合化分析产品质量和性能。常见方式是对产品中涉及因素如环境、原材料、劳动力以及机械等进行分析,通过离散化数据挖掘能够分析出时间序列影响下产品质量预测与控制[6]。
6 BP神经网络产品质量预测
6.1 BP神经网络产品质量预测分析
BP神经网络模型是最为常用的分析方法,它的建设原理是通过利用计算机人工神经网络模拟生物神经相关系统,以信息元之间的联系模拟生物神经元,实现对数据之间分析整合。这种网络模型具有非线性特点,不受程序影响,也是人工智能工业化生产一种表现模式。其信息传递模式类似于计算机拓扑结构,根据信息传递需求分为了“输入层”、“隐层”、“输出层”三个结构。
在进行质量预测和控制数据化分析时,BP神经网络模型搭建主要有“网络建设”、“网络预测”两个方面。在基于数据挖掘下产生的训练集和测试集下,系统将工业产品各个生产操作流程数据、成分数据、产品性能数据进行了分析。通过训练集确定相关网络参数,实现网络搭建;测试集实现网络检测数据的有效性判断。从而实现整个质量预测和控制的全过程。此外,模型建设中也涉及到了相关数据集合归一化、反归一化等处理问题。
为了检测整个神经网络搭建有效性以及对产品质量预测控制的精准化,需要对网络有效性进行检测。常见方法是在已经除去噪音后数据随机筛选,按照和数据集相同方式进行归一化处理。利用仿真函数sim()进行随机测试,对比测试数据的相关值,建立设计训练网络函数“net”、“out”的函数。
out=sim(net,test) (1)
经过仿真函数检验后,网络需要根据得到检测out数据,并在(0,1)之间进行归一化数据处理。为得到更加精确化的结果,确保网络有效性,因此还需要对于分析结果进行反归一化处理,让使用后的值回复对比后与生产过程中相关值进行对比,从而实现预测和控制质量的检测。同时,BP神经网络在进行数据挖掘建设时,需要长时间数据测试集训练,因此在大量数据堆积时候会降低系统运行速度,降低产品质量预测效率。而对于重复数据,BP神经网络系统不会做出甄别判断,会造成重复数据读取,因此精度也会受到数据整体特性影响。
6.2 BP神经网络产品质量预测流程
BP神经网络进行产品预测的算法流程分五个步骤进行,如图1所示。
步骤一:网络拓扑结构构建。确定网络基本结构(包含输入层、隐层、输出层节点数)。
步骤二:初始化BP神经网络三层(输入层、隐层及输出层)神经元之间的连接权值,初始化隐含层阈值,给定神经元激励函数和学习速率,给定输出层阈值。隐含层输出计算。
步骤三:获取最优权值阈值,根据输入向量,隐层阈值,连接权值等参数,计算BP神经网络预测输出。
步骤四:计算误差。根据BP神经网络输出和预期输出进行比较,计算网络预测输出的误差。
步骤五:权值阈值更新。根据网络输出预测误差,更新网络连接权值、阈值等。
步骤六:判断算法迭代条件是否满足结束条件,若不满足,返回步骤四。
步骤七:仿真预测,得到结果。
图1 BP神经网络产品质量预测流程
6.3 BP神经网络产品质量预测实验设置
利用Matlab2011a平台建立BP神经网络模型,PC硬件为CPU: 英特尔 酷睿 i7-6700HQ、内存容量: 8g,编程实现了BP神经网络模型进行产品质量预测,对某公司的LED产品的质量合格率进行预测实验。
BP神经网络基本结构为10-15-1,学习方法为梯度下降法,输入激发及输出激发函数设置为sigmoid函数。训练次数为100,精度0.001。本次实验样本数量为1400例产品质量合格率的相关数据信息,抽取30例为预测样本,其余均为训练样本。选取总误差、总误差百分比和均方误差(errorsum、perc、mse)作为实验误差评价指标,其定义分别为:
(2)
6.4 BP神经网络产品质量预测实验结果
实验共进行10次,取平均结果,具体如图2所示,期望输出指产品的实际合格率,通过计算得出总误差Errorsum=0.2806621,总误差百分比Perc=0.29%,均方误差mse=2.71E-04,具有很高的精确度,基本上能够精确地预测产品的质量。
图2 BP神经网络的产品质量预测结果
7 结语
综上所述,基于数据挖掘基础上,工业产品质量预测和控制技术都能得到提升,方便各企业对自身产品质量进行宏观分析,有助于优化工序流程、降低工业质量风险,降低质量检测投入成本,也能为消费者创造更多高质量的产品。可见,正确将如回归模型分析、BP网络模型运用于工业生产,有助于改善企业对产品质量和工艺的把控,实现产业信息化发展。
参考文献
[1] 段桂江,严懿,王洋.基于数据挖掘的质量成本分析与控制[J].计算机集成制造系统,2013,19(07):1692-1703.
[2] 朱晓峰.大数据分析与挖掘[M].北京:机械工业出版社, 2019.
[3] 王帅, 杨秋辉, 曾嘉彦等. 增量关联规则挖掘在通信告警预测中的应用[J]. 计算机应用,2018,38( 10) : 2875- 2880.
[4] 朱玉全, 孙志挥, 季小俊. 基于频繁模式树的关联规则增量式更新算法[J]. 计算机学报, 2003,26( 1) : 91-96.
[5] Wang Danshi,Lou Liqi,Zhang Min,et al. Dealing with Alarms in Optical Networks Using an Intelligent System[J]. IEEE Access,2019,7: 97760-97770.
[6] 汪星, 黄小瑜, 刘瑄璞等. 面向工业大数据的多层增量特征提取方法[J]. 西安电子科技大学学报, 2018,45( 4) : 106-111.