基于YOLOv5模型的初中化学实验物品检测技术研究
吴莲华
生成PDF 清样下载 引用

复制成功

导出题录

参考文献( GB/T 7714-2015 ) 复制

吴莲华,. 基于YOLOv5模型的初中化学实验物品检测技术研究[J]. 教育研究与发展论坛,2023.10. DOI:10.12721/ccn.2023.157331.
摘要:
初中是化学学习的启蒙阶段,加强初中化学实验操作考核有助于提高学生的基础实验操作技能。然而目前的化学实验操作考核中,主要以人工评价为主,评价主观性较强。如何采用有效的方法对初中化学实验进行自动化评估成为当前教育领域的研究热点,而对实验过程自动化评估的主要任务之一就是自动检测实验过程中的物品。文章以促进教育考试评价改革为研究目的,提出一种改进的YOLOv5模型用于初中化学实验物品的实时检测。该方法将1x1的卷积核引入到传统的YOLOv5模型中,实现对输入数据的降维操作,从而有效地减少模型的参数量。实验在自建的初中化学实验物品数据集上测试结果表明:改进后的YOLOv5模型计算量更小,检测速度更快,能够更好地满足初中化学实验物品自动检测的实时性需求,为后续初中化学实验过程自动化评估奠定了坚实的基础,在一定程度上推动了化学实验评价的客观与公平,从而有效地推进教育公平。
关键词: 深度学习;Yolov5模型;初中化学实验;过程性评价
DOI:10.12721/ccn.2023.157331
基金资助:

一、引言

化学是一门实验学科,开展化学实验操作考核有助于培养学生的科学素养[1]。《教育信息化2.0行动计划》强调推进信息技术与教育的深度融合,创新信息化时代教育评价改革的新范式。教育部发布的《义务教育化学课程标准》中指出,初中化学教育旨在发展学生的化学学科素养,鼓励学生积极参与实验的探究过程,让学生掌握基本的化学实验操作技能[]。2020年《教育部关于加强和改进中小学实验教学的意见》发布,提出将学生的实验操作能力表现纳入学生的综合素质评价,至2023年前将学生实验操作考核正式纳入初中生的学业水平考试[2]。为推进素质教育考试评价改革,湖南、湖北、上海、四川等省市已经陆续开展中考化学实验操作考试,并将其纳入中考总成绩 [3]。但在现实的中学化学实验操作考核中,实验考核形式化、实验操作不规范、实验考试评分随意性大、实验评价“重结果、轻过程”等现象明显 [4]。例如,有些学校在实验考核前将考核题目以及评分细则通报给任课教师,任课教师在考核前专门对学生进行相应的训练和强化以使学生通过考核;还有学校学生的基本操作不规范,缺少完善的评价机制,导致实验考核难以进行。针对上述问题,许原芝老师指出我国“单师监考,一次定分”的实验操作考评模式耗费人力,而且欠公平和公正,太原已将信息技术与实验评价相结合,引入了互联网实验操作考试评价系统,使用网络摄像头把学生实验操作的过程录制下来,教师通过视频给学生评分[5]。但随之而来的是教师对海量视频数据进行信息处理的压力。如何客观和全面地对学生的化学实验操作能力进行准确地评价是推动素质教育改革,培养和选拔高素质人才亟待解决的问题。

随着信息技术的发展,人工智能技术的出现给了我们解决问题的新思路——通过借助人工智能实现机器评分来减轻海量工作带来的压力。目标检测作为人工智能技术的一个分支,为实现现实的实验自动评分创造了条件,在这其中,对化学实验物品的检测是整个过程中重要的一部分,只有精准地检测到化学实验物品的类别,才能对后续操作进行评分。目前,一些较为成熟的模型已应用到物体检测领域,实现了较高的检测速度和精度,但是在初中化学实验室里,由于实验物品例如烧杯、试管等大多是透明物体,且体积较小,使得初中化学实验物品检测具有很大的挑战性。因此,文章提出了改进的yolov5检测模型,将1x1的卷积核引入到传统的YOLOv5模型中,实现对输入数据的降维操作,从而有效地减少模型的参数量,实现对初中化学实验器材的实时精准检测。

二、文献综述

近年来,目标检测的研究发展十分迅速,各种方法层出不穷,但是目前仅针对于化学实验物品的目标检测很少。文章将现有的目标检测模型分为两类,一类是基于传统特征的目标检测模型,基于传统特征的目标检测模型首先从目标图像中选择候选区域,接着从候选区域中提取特征,最后输入分类器得到分类结果。候选区域选择是为了筛选出目标位置的大致定位,然后生成检测所需要的候选框。一类是基于深度学习的目标检测模型。二阶段检测模型首先选择目标的候选区域,确定候选框,然后从候选框中提取目标的相关信息,最后通过检测网络,预测目标的位置和类别。二阶段检测模型虽然实现了端到端的检测,但无法满足物品检测的实时性需求,以YOLO模型为代表的一阶段检测模型应运而生,这一类模型将整个检测视为一个回归任务,不再单独进行候选框的提取,直接将图像输入到网络中进行目标位置的预测以及类别的识别。2015年,Redmon等人提出的YOLO模型首次实现了实时性的目标检测,核心思想是使用Darket Net作为主干网络,将一张图像划分为49个网格单元,每个网格单元负责检测两个候选框,只预测中心点落在该格内的目标,但YOLO模型的精度表现不太理想。随后,Redmon等人又推出了YOLOv2[]模型。YOLOv2模型在YOLO模型的基础上对所有的卷积层引入了批量标准化,直接去除了全连接层,在检测速度和检测精确率上有了很大的提高。YOLOv2模型之后,Redmon等人对其再次改进,提出了YOLOv3[]模型。YOLOv3模型采用多个逻辑回归分类器取代了softmax分类器,并引入了特征金字塔的网络架构,大大提升了检测速度和精度。2020年,Bochkovskiy等人在YOLOv3模型的基础上做出系列改进,提出了YOLOv4[]模型。YOLOv4加入了很多实用的改进技巧,比如加权残差连接、跨阶段部分连接、跨小批量标准化、自对抗训练等等,显著提升了检测速度和精度。两个月后,YOLOv5模型被推出,YOLOv5在YOLOv4的基础上做了轻量化改进,实现了检测速度和精度的最佳权衡,是目前目标检测领域的集大成者。

在上述方法的启发下,针对初中化学实验操作评价工作量大、人工检测速度慢的特点,文章提出一种改进的YOLOv5模型用于初中化学实验物品的实时检测。该方法将1x1的卷积核引入到传统的YOLOv5模型中,实现对初中化学实验物品数据的降维操作,从而有效地减少模型的复杂度,提高模型的检测速度。该实验物品检测方法为后续初中化学实验过程自动评价提供了强有力的支撑,在一定程度上推动了化学实验操作评价的客观与公平。

三、改进的YOLOv5初中化学实验物品检测模型

在现有的中学化学实验操作考试中,市教育局每年要组织几万名的毕业生参加,而且“每位学生可以参加两次,在两次实验考试成绩中择优计入总分”[10],工作量很大。由此就规定了实验物品检测任务在保证精度的同时要有较高的实时性。

基于此,文章整合了现有的深度学习模型的改进技巧做了大量的测试,在传统的YOLOv5模型的主干网络层引入1x1的卷积核,改进后的YOLOv5模型的主干网络结构图如图1所示。

图1 改进的YOLOv5模型主干网络结构图

1.png

传统的YOLOv5模型在目前所有的目标检测模型中速度最快,可以达到实时性要求,但对于初中化学实验自动评分任务来说,实时性还有待提高。因此论文致力于对快速模型的研究,以传统的YOLOv5为主要模型,对参数进行微调,并对主干网络进行轻量化的改进处理,以便减少参数,降低计算量,进一步提高模型的推理速度。

改进后的YOLOv5模型主干网络的特征图大小变化及相关参数如表1所示。输入端首先将输入的初中化学实验物品图像变为608x608x3的大小,接着进入主干网络。主干网络的Focus层对输入图像进行处理,使其变为分辨率更小,通道更多的特征图,经Focus层处理后的图像大小为304x304x32。接着进入卷积核大小为3x3、步长为2的卷积层,得到152x152x64大小的特征图。接着再依次进入BottleneckCSP层、3x3卷积层、BottleneckCSP层进行处理。接着再进入卷积层,与传统的YOLOv5模型不同的是,该层原有的3x3卷积核调整为1x1的卷积核进行卷积操作,有效减少了模型计算的参数量,提高了模型的检测速度。经过1x1的卷积核、步长为2的卷积处理后,特征图大小变为38x38x256。随后,特征图进入BottleneckCSP层,再继续进入卷积核为1x1、步长为2的卷积层进行处理,得到大小为19x19x512的特征图。接着进入金字塔池化层进行池化操作,最后进入BottleneckCSP层处理后输入颈部网络进行预测和回归,最终输出的特征图大小和传统的YOLOv5模型一致,均为19x19x512。

表1 改进YOLOv5模型的网络结构

1737524366714399.png文章借鉴了现有的轻量化模型的改进方法,将1x1的卷积核引入主干网络,在保证模型准确率的情况下有效提高模型的检测速度,以满足化学实验物品检测任务的实时性需求。在传统YOLOv5模型的主干网络中,文章将第5层和第7层的卷积核由原来的3x3卷积核调整为1x1的卷积核,与原有的3x3卷积核相比, 1x1的卷积核减少了模型计算的参数量,提高了模型的推理速度。相比于原有的YOLOv5模型,改进的YOLOv5模型更加轻量化,满足了初中化学实验物品的实时检测需求。

四、实验过程及结果分析

(一)实验配置

实验使用自建的初中化学物品检测数据集,如图2所示,该数据集包含六类标签:烧杯、试管、酒精灯、量筒、广口瓶和细口瓶,类别之间数据分布相对均衡。

图2 自建的化学实验物品数据集

1737524440427411.png

实验划分训练集3514张,测试集908张,其中,烧杯训练集734张、测试集179张,试管训练集496张、测试集128张,酒精灯训练集412张、测试集96张,量筒训练集511张、测试集119张,广口瓶训练集1028张、测试集278张,细口瓶训练集333张、测试集108张,具体分布如表5.1所示。

表2  数据集的分布表

1737524470698701.png

(二)评价指标

文章使用精确率(Precision)、召回率(Recall)、均值平均精度(Mean Average Precision, mAP)、检测速率(Frames Per Second,Fps)和浮点运算数(Floating Point Operations,Flops)评价YOLOv5模型和改进的YOLOv5模型的性能。

(三)实验过程

实验使用YOLOv5模型在COCO数据集上的预训练模型进行参数初始化,将epoch设置为200,模型深度倍数为0.33,网络层通道倍数为0.5,类别数为6,用改进的YOLOv5模型进行实验。实验过程参数变化如图3所示,模型的训练集和测试集损失函数均收敛,并趋近于0,且精确率曲线均完全收敛至85%,召回率曲线均完全收敛,平均精度曲线均完全收敛趋近于92.3%,实验各1737524525892311.png参数的曲线走向代表了实验过程中未发生过拟合,实验结果是可靠的。

图3 改进的YOLOv5模型实验参数变化图

(四)实验结果与分析

精确率-召回率(PR)曲线根据模型的准确率和召回率绘制而成的。实验记录了初中化学实验物品检测模型迭代过程中的准确率和召回率的变换过程,如图4所示。

 1737524550694132.png

图4 改进的YOLOv5模型PR曲线图

如图4所示,在改进后的YOLOv5模型中,烧杯的准确率为95.1%,试管的准确率为89.4%,酒精灯的准确率为94.0%,量筒的准确率为89.8%,细口瓶的准确率为95.5%,广口瓶的准确率为90.0%,平均准确率为92.3%。

改进后的模型均值平均精度为92.3%,在GeForce RTX 2080 SUPER显卡上的推理速度为42帧/秒,浮点运算数为15.2。结果表明,改进的模型在保证精度的情况下有效提升了检测速度,实现了检测速度和检测精度的最佳平衡。

表3  模型性能参数表

1737524609137039.png

改进后的YOLOv5模型在模拟的初中化学实验场景中进行测试,测试效果如图5所示,针对于图像中的实验物品,改进的模型都将其较快较好地识别了出来,在一定程度上满足了初中化学实验物品的实时性检测任务,验证了改进的YOLOv5模型在初中化学实验物品检测中的有效性。

 1737524656124018.png

图5 模拟场景中的检测效果图

五、总结

文章通过研究初中化学实验物品目标特点,以及实现初中化学实验物品自动检测需要实现的可靠性和实时性特点,针对烧杯、试管、酒精灯、量筒、广口瓶和细口瓶六种常见实验物品进行研究,提出使用改进的YOLOv5模型来解决初中化学实验物品目标检测问题,实验结果表明该模型能实现对初中化学实验物品的精准检测,并在精确率和召回率等检测指标上达到较好的效果,为后续自动评分提供了可靠的技术支撑,这对今后的教育场景目标检测提供了一个很好的基础研究。但对于初中化学实验物品实时检测来说,只是拥有一个较高的精确率和召回率是不够的,由于后续的自动评分与每个学生的成绩息息相关,因此,目标检测应用在初中化学实验场景的方法的准确性还有待提高。

后续的研究将考虑模型泛化,使其能应用到更多的中学化学实验室场景中。其次,也将对数据集进一步扩充,如增加实验物品类别和数量等等。最后,如果能够进一步改进网络模型,使其更好地适配于初中化学实验物品这一特定领域,这对目标检测或教育领域来说都将是一个很大的贡献。

参考文献

[1]刘玉荣,史鹏园.“深度学习”视野下高中化学实验教学:问题与对策[J].化学教育(中英文),2018,39(17):58-65.

[2]中华人民共和国教育部.义务教育化学课程标准(2011年版)[M].北京:北京师范大学出版社,2012:2-50.

[3]教育部关于加强和改进中小学实验教学的意见[J].中华人民共和国国务院公报,2020(08):74-76.

》在线投稿系统

*文章题目:
*作者姓名:
*电子邮箱:
*通讯地址:
*联系方式:

  备      注:

*上传稿件:

支持上传.doc,.docx,.pdf,.txt,.wps文件

投稿须知:

1、审稿结果将于1~7个工作日以邮件告知,请注意查收(包含录用通知书、审稿意见、知网CNKI查重报告)。

2、提交投稿后,若7个工作日之内未接到录用通知,则说明该文章未被录用,请另投他刊。

3、凡投寄本刊稿件,如在内容上有侵权行为或不妥之处,均应文责自负。本刊有权对来稿进行文字编辑、加工和修改,如不同意,请附说明,以便妥善处理。

4、多作者文稿署名时须征得其他作者同意,排好先后次序,通知用稿后不再改动。

5、凡投往本刊稿件一经录用发表,其版权归本刊所有。

6、本刊已全文录入中国知网、万方、维普等数据库,如作者不同意被收录,请提前申明,未申明者,本刊一律视为同意被收录。

7、请勿一稿多投。