PDF下载
基于卷积神经网络的垃圾智能识别

徐丽珍

许子帆杭州职业技术学院,浙江杭职,310006

摘要: 鉴于社会发展下的垃圾总量的不断增加,就如何有效分类垃圾,减少污染,文本提出使用计算机深度学习技术进行垃圾识别检测研究。该方法应用卷积神经网络,基于YOLOv5 模型,融合注意力机制进行特征提取。实验表明该方法能有效识别出可回收垃圾、有害垃圾、其他垃圾,从而验证了该方法的有效性。
关键词: 卷积神经网络;YOLOv5;垃圾分类
DOI:10.12721/ccn.2022.157558
基金资助:
文章地址:

1 引言

随着现代社会的高速发展,产生的垃圾数量也越来越多。如何利用现代化的技术手段,将垃圾进行有效分类,做到能合理利用垃圾,减少地球污染,将是一项非常有意义的工作,也是现代社会必须解决的问题。

目前我国的垃圾分类主要依靠人工分拣完成。包括要求居民在投放垃圾前的手工垃圾分类,还有就是在垃圾中转站的专门垃圾分拣。居民自行的垃圾分类受到居民个人素质的影响较大,虽然近几年已经有了很大的改善,但限于各种原因,仍存在管控难度大,垃圾分类不规范的问题。垃圾中转站的专门人员分类在专业程度上有了很大提高,但中转站垃圾数量巨大,难免面临人员经费紧张,分类效率不高且精度不够的问题。因此找到一种高效的智能垃圾分类方法是推行现代化垃圾分类的必然之道。

目前对垃圾智能分拣的方法很多,其中较为突出的方法有三大类,分别为基于声波的分析检测算法、基于图像的识别检测算法、以及基于光谱分析检测的识别算法[1]。这三种方法相对于传统的人工分拣都有较大的提升。基于图像的识别算法利用图像颜色、纹理、角点、频率等特征进行分类;通过声波发生器向目标发射超声波,根据回波的声色、振幅、频率等特征来判断目标种类的不同则为声波法检测的识别原理;基于光谱分析的识别算法根据目标反射出的不同光谱特征来进行分类,该方法在同种类项目上已有较为成熟的分拣系统产品。

上述三种分拣方法中,基于图像的识别算法是当下较为主流的算法,深度学习算法在识别、分类问题上具有稳定且优越的性能,将深度学习算法与垃圾分类融合是垃圾分类智能化的必然趋势[2]

本文将计算机深度学习算法应用于垃圾分类识别问题,借助卷积神经网络[3],以图像识别为基础,结合颜色、纹理特征融合,提出了一种智能化垃圾识别系统。

2 垃圾智能分类系统结构

该智能分拣系统由摄像头、具有六自由度的机械臂、传送带以及树莓派等模块组成,分别担负着垃圾模型的识别、垃圾的抓取与分拣、垃圾模型的协同传送以及中央控制等功能,其系统框架如图1所示,具体介绍如下。

图片1.png

图1 系统总体结构框架图

智能分拣系统首先需要通过摄像头对垃圾模型进行识别,并通过形状和颜色来鉴别该垃圾所属的种类,以便后续对该垃圾进行准确地分类。垃圾模型通过图像识别算法识别垃圾所属种类后,通过树莓派控制中心向具有机械臂结构装置发出控制指令,令各个舵机协同控制机械臂抓取垃圾落入相应垃圾桶。系统人机界面主要负责管理系统的各项操作与管理,包括控制器发出的各项指令、采集到的各项信息、算法的运算与智能处理以及各类算法库的集成等,并负责人机对话的功能。

3  卷积神经网络模型

传统的神经网络算法[4]采用全连接的形式,在输入层接收输入的数据,然后将数据传输到隐藏层,接着不断向后传输直至输出层。不同于传统的全连接网络,卷积神经网络是深度学习技术中具有代表性的网络结构之一,一般用于研究和图像相关的问题,在图像识别、姿态估计、文字识别等多个领域都有广泛的应用。卷积神经网络的基本网络结构如图2所示,分为卷积层、池化层、全连接层和输出层等[5]

图片2.png

图2 卷积神经网络结构图

卷积神经网络结构具有良好的容错以及学习能力,泛化性强,运行速度快,具有传统技术所没有的优势。

4  特征提取

本系统使用处于轻量级状态下的 YOLOv5 模型。该模型相对于上一代在目标检测水平上有了极大的提升,模型大小也缩减到了27MB。其结构主要由输入端、骨干网络 (Backbone)、检测颈部网络(Neck)、检测头 (Head) 输出端四部分组成。这种结构可以在参数数量不变的情况下提高精度,同时减少超参数的数量。

然而本系统算法最终的使用场景是对垃圾进行检查并识别分类,该应用场景下通常混合了大量的其他的无关信息。因此本系统引入注意力机制[6]来对特征提取网络进行改造。

注意力机制是在网络特征提取时,对输入的特征图某一部分特征进行增强或抑制操作,选出关键信息,而忽略掉其他不重要的信息,从而使得模型依据标注好的训练集去调整注意力层级的权重,以期望后续的使用中能够更加关注有效信息忽略无关的噪声或背景信息。

考虑到最终部署时移动设备或嵌入式设备的硬件算力限制,需要同时考虑精度与速度,本系统只在特征提取网络的几个关键点插入了注意力机制。该模块基本原理如图4所示

图片3.png

图3   通道注意力机制原理

5  实验与分析

训练数据集是采用“华为云垃圾分类挑战杯”赛方按照垃圾分类标准制作的数据集,数据集一共包括了 14802 余张垃圾图片,分为可回收物、不可回收物、餐厨垃圾和其他垃圾 4 大类。

我们的训练环境配备的是python3.6+tensorflow1.12.0+cuda9.0+cudnn7.3.1。硬件配备是Windows 10 + GTX 1080Ti。

实验主要包含以下步骤:首先对图像数据做好了预处理,将垃圾图像分为训练集和测试集。训练时采用循环迭代的方式,初始迭代参数和学习率可以设置比较大,然后在关键点引入通道注意力机制,同时将损失函数的变化情况作为模型是否训练好的判断依据,当损失函数振荡不大时,我们判断模型为训练完毕。如图5是本系统训练集的Loss曲线图。

最后利用训练好的模型对测试数据进行判断识别,实现对垃圾图像的分类检测。

图片4.png

图4  模型训练集Loss曲线图

从Loss曲线图我们可以看出,该算法最终趋向收敛。但训练次数超过500 代时,会有部分过拟合现象,模型在迭代1000次左右的时候,基本稳定,我们也可以判断学习完成。

将经过预处理的测试数据集按照强光、弱光、正常光照三种不同环境光条件进行分类,在不同种类的垃圾测试集上进行了算法验证实验,将检测结果与实际情况进行比对,不同的垃圾种类识别率如表1所示。

表1 不同类别垃圾图像识别率

截图1741671675.png

从表中看出,在正 常 光 照 情 况 下 ,系 统 的 平 均识 别 准 确 率 可 达93.2%,在光线变化较大的环境下也有 82%以上的识别率,可以看出系统具有较高的识别精度,可基本满足使用需求。说明了模型的整体设计比较合理。加入注意力机制使得准确识别率提高了很多,从而有效提升了系统性能。

6  小结

本文针对垃圾分类难,成本高,时间长等问题,提出运用基于卷积神经网络的计算机深度学习方法用于垃圾分类。将添加了通道注意力机制的YOLOv5网络模型用于垃圾图像识别。在测试集上对该方法进行了验证实验,该方法能有效识别出不同光照下不同垃圾,特别是在正常光照下基本达到了理想的效果。