基于卷积神经网络的异常区域检测方法,采用图片归一化方式对输入的原始图片进行归一化处理,利用直接作业场景特有颜色变化范围提取疑似区域,将预处理后的图片输入卷积神经网络进行区域特征提取和分类,最终根据分类结果给出报警信号。
1.1 卷积神经网络
卷积神经网络是一个前馈神经网络。其中卷积神经网络LeNet-5在手写数字识别上性能优异,与传统的神经网络相比,在图像处理领域具有局部感知、权值共享、滤波器等优势,将该方法可应用于油田生产现场特征物提取及颜色、纹理、形状等特征识别。
1.2 图片归一化方法
由于直接作业环节疑似区域的形状不固定,颜色、纹理等特征在同一图像中的分布相对均匀,且直接作业环节疑似区域拥有的本质属性特征并不会因为任意地缩放图像而发生改变。因此,为获得良好的内部特征、提高算法性能、减少外部环境对图像的影响,采用图像预处理的方法减少图像方差并增强图像固有特征,采用min-max归一化方法消除光照对检测算法的影响。
1.3 候选区域提取方法
通过RGB颜色特征模型提取颜色特征,该模型比其他颜色模型具有更少的计算复杂性,将直接作业环节原始图像通过RGB颜色模型进行候选区域分割。
1.4 扩大候选区域
考虑到整个图像中直接作业环节相关像素点比较少,检测到的区域将很小,类似于图1的矩形框。在进行神经网络训练时,容易出现误报或漏报的情况。为此,提出一种扩大候选区域的方法,该方法以检测到的原始区域为中心,以固定长度R为半径画圆,进行区域扩大,类似于图1的圆圈。经过对多个视频进行实验后发现,当R=10时,神经网络提取特征和分类识别效果最佳。把该方法与神经网络相结合,可以及时、准确地检测出直接作业场景。
图1 烟雾区域扩大图
2 算法优化
2.1 数据增强技术
数据增强技术可以从己有的数据集中得到更多的训练数据,提高训练效率。结合油田直接作业环节视频图片正样本明显少于负样本的情况,采用只对训练集中的正样本进行数据增强,获得一个更大且比较平衡的训练样本集,算法性能得到明显的提高。
2.2 网络训练
确定网络的超参数:优化算法是随机梯度下降(SGD);动量参数为0.9,用于跳过局部极小值并加速训练;初始学习率为0.01;节基本学习率;小批量数据(batch-size)为学习率衰减系数为0.01,它可以动态的调100,基于小批量数据而不是单个样本更新模型可以减少更新模型的方差,保证更稳定的收敛;权重的初始化方式为glorot-uniform分布;激活函数为ReLU;损失函数为交叉嫡函数。
在训练期间,将尺寸为128×128的己标记图像输入神经网络,得到网络输出预测值,再利用输出值与期望值计算损失函数值,也就是标签之间的误差,然后使用标准反向传播的随机梯度下降方法以最小化损失函数为目的,对权重和偏置量进行更新,训练网络。
3 模型应用场景训练分析
为了验证上述提出的算法,需要收集尽可能多的直接作业环节图像数据,数据集合主要包含2个测试集(Test1、Test2),3个训练集(Trainl、Train2和Train3)和1个验证集(Test3),并在数据上进行实验(表1)。
表1不同超参数的性能
经过大量的实验,发现学习率、弃权率和批量数据大小的取值对模型的准确率更敏感。为了找到适合本网络最优的三个参数,分别对它们做了相应的实验(表2)。
表2数据增强实验结果
由表中数据分析得出,当学习率为0.01时,实验效果最好;当小批量数据大小为100时,效果最好;全连接层的弃权率为0.5时,效果最好。训练数据不足或者训练数据不平衡会造成神经网络出现过拟合和泛化能力弱的结果,使用数据增强技术可以有效解决该问题。考虑原始图片数量少,使用上下翻转方式对图像进行增强,创建两个不同的训练数据集,即数据集Train2和Train3。从表2数据分析得出,相比Trainl和Train3,网络在Train2数据集上取得的性能最好。实验结果表明,提供一个更大,更平衡的训练集可以减少过度拟合的发生,数据增强技术可以提高算法的性能。
4 现场试验效果
根据油田7类直接作业环节场景,通过卷积神经网络算法,对直接作业现场视频进行结构化处理,实现全场景目标物的特征值提取并与7类标准结构化模型比对分析,直接作业环节规范检测准确率达到90%以上(图2)。
动土作业 井下作业
高处作业 起重作业
未穿工服 未戴安全帽
图2 全场景目标物的特征值提取
5.结论
结合油田直接作业环节图像特征,优化提出了基于卷积神经网络的疑似区域检测方法,包括深度卷积神经网络、图片归一化、候选区域提取和扩大疑似候选区域。并借助数据增强技术,形成有效训练数据集,通过实验分析,该方法在不同的场景下都能有效的检测到直接作业环节疑似区域,且具有更高的检测准确率。
参考文献
[1]林开颜,吴军辉,徐立鸿.彩色图像分割方法综述[J].中国图像图形学报,2005,10(1):1-10
[2]陈强.图像分割若干理论方法及应用研究[D].南京:南京理工大学图书馆,2007.
作者简介:万国强,男,1984年11月出生,工程师,从事大数据应用、云网安全等方面技术工作。