基于YOLOv4算法的遥感图像军事目标检测系统
刘大伟 高树静
生成PDF 清样下载 引用

复制成功

导出题录

参考文献( GB/T 7714-2015 ) 复制

刘大伟 高树静,. 基于YOLOv4算法的遥感图像军事目标检测系统[J]. 光电子进展,2023.8. DOI:10.12721/ccn.2023.160462.
摘要:
针对信息化战争中的军事目标检测问题,设计实现了一款基于深度学习的遥感图像军事目标检测系统。系统基于YOLOv4目标检测算法,首先通过构建飞机、油罐、立交桥、舰船这4类常见军事目标的数据集,并对数据进行训练得到4类目标的检测模型;然后使用Flask开发了基于检测模型的B/S系统,实现了4类军事目标的快速精准检测。通过对系统的准确性、检测速度等指标进行测试,结果显示该系统各项性能良好,可以满足军事目标检测任务需求。
关键词: 遥感图像目标检测YOLOv4
DOI:10.12721/ccn.2023.160462
基金资助:武警工程大学教育教学项目“《军事地理信息系统》课程实战化教学研究”(WJX2021104)

1. 引言

在信息化战争中,遥感图像已经成为获取战场信息的重要数据源,而基于遥感图像的目标检测已成为主要的技术侦察手段之一。如何精确高效的从海量遥感图像中定位军事目标,及时掌握其信息,对于后续的制导武器精确打击、战场形势分析以及制定军事决策等均具有重要意义。

传统的遥感图像目标检测系统,如基于方向梯度直方图或基于支持向量机的系统,往往采用单一的特征进行学习训练,检测效果较差,易发生漏检、错检等现象[1]。近年来,基于深度学习的目标检测方法如YOLO、Faster R-CNN等在计算机视觉领域取得了突破性进展,其优异的性能给遥感影像的目标检测任务带来了新的启发。基于此我们开发了基于深度学习的遥感图像军事目标检测系统,本系统基于YOLOv4算法,实现了遥感图像中的飞机、油罐、立交桥、舰船等四种军事目标的检测与识别。系统具有识别速度快、检测精度高的特点,该系统可应用于战场指挥与侦察、精确制导、敌我识别等军事领域。

2. YOLOv4算法

本系统采用YOLOv4算法实现军事目标的检测,作为一种出色的单阶段目标检测算法,YOLOv4算法是对YOLO系列算法的持续改进,它在保持YOLO系列算法快速检测能力的同时,也对检测精度进行了很大的优化,下面分别从算法原理和网络结构两个方面介绍YOLOv4算法。

2.1 YOLOv4目标检测算法原理

所有YOLO系列算法的检测原理是相同的,算法将检测问题转换为回归问题,实现端到端的目标检测。算法流程如图1所示,首先将输入图片的大小调整到一定尺寸(如608*608),然后将输入的图片分割成S*S的网格并送入卷积网络中,最后处理网络预测结果得到检测目标。在进行网络预测时,每个单元格负责检测那些中心点落在该单元格内的目标,每个单元格会预测B个边界框的大小及位置信息、边界框的置信度和所属类别[2-3]

1.png图1  YOLOv4算法流程示意图

具体来说,网络将输入的图片分割成S*S网格,然后每个单元格负责检测那些中心点落在该单元格内的目标,如图2所示,可以看到狗这个目标的中心落在左下角一个单元格内,那么该单元格负责预测这个狗。每个单元格会预测B个边界框(bounding box)以及边界框的置信度(confidence score)。所谓置信度包含两个方面,一是这个边界框含有目标的可能性大小,二是这个边界框的准确度。前者记为Pr(object),当该边界框是背景时(即不包含目标),此时Pr(object)=0,而当该边界框包含目标时,Pr(object)=1。边界框的准确度可以用预测框与实际框(ground truth)的IOU(intersection over union,交并比)来表征,记为。因此置信度可以定义为Pr(object)∗。

2.png图2  YOLOv4算法网格划分示意图

边界框的大小与位置可以用4个值来表征:(x,y,w,h),其中(x,y)是边界框的中心坐标,而w和h是边界框的宽与高。(x,y)是相对于每个单元格左上角坐标点的偏移值,并且单位是相对于单元格大小的。而边界框的w和h预测值是相对于整个图片的宽与高的比例,理论上4个元素的大小应该在[0,1]范围。这样,每个边界框的预测值实际上包含5个元素:(x,y,w,h,c),其中前4个表征边界框的大小与位置,而最后一个值是置信度。

对于分类问题,对于每一个单元格其还要给出预测出C个类别概率值,其表征的是由该单元格负责预测的边界框其目标属于各个类别的概率。但是这些概率值其实是在各个边界框置信度下的条件概率,即Pr(classi|object)。同时,我们可以计算出各个边界框类别置信度:Pr(classi|object)*Pr(object)*=Pr(classi)*。边界框类别置信度表征的是该边界框中目标属于各个类别的可能性大小以及边界框匹配目标的好坏。

每个单元格需要预测(B*5+C)个值。如果将输入图片划分为S*S网格,那么最终预测值为S*S*(B*5+C)大小的张量。对于PASCAL VOC数据,其共有20个类别,如果使用S=7,B=2那么最终的预测结果就是7*7*30大小的张量。

2.2 YOLOv4网络结构

YOLOv4算法网络结构如图3所示。其主干网络在YOLOv3主干网络Darknet53的基础上借鉴了跨阶段局部网络(cross stage partial networks,CSPnet)[4],生成了新的主干结构CSPDarknet53,该结构中的Resblok_body代表残差块,Resblok_body*n代表有n个残差块(记为RBn,其中n{1,2,4,8})。在特征提取中采用了空间金字塔池化(Spatial Pyramid Pooling,SPP)和路径聚合网络(path aggregation network,PAnet)两种特征提取结构。SPP可以极大地增加感受野并分离重要的上下文特征,PAnet通过重复读取网络特征来提高特征提取能力。

3.png3. 系统设计

本系统主要包括模型训练、用户登录、图像上传、目标检测与分析四个功能模块。系统功能模块如图4所示。

4.png图4 系统功能模块图

(1)模型训练模块:该模块的主要功能是基于图像样本训练出目标检测模型。该模块由管理员在预先后台进行操作完成,普通用户无法进行操作,模型训练完成后系统可以直接调用。

(2)用户登录模块:该模块主要实现用户的验证和登录功能。

(3)图像上传模块:该模块主要实现遥感图像的上传,并将上传后的图像保存至服务器的固定目录下。系统支持的遥感图像格式包括:jpg、tiff、png等格式。

(4)目标检测与分析模块:该模块使用训练好的目标检测模型对上传的遥感图像进行检测,并将军事目标位置、类别、检测用时等信息输出。

本系统模块层次结构及调用关系如图5所示:

5.png图5 系统模块层次结构图

4. 系统实现

4.1 模型训练

系统开发环境如表1所示。在进行军事目标检测之前首先要对军事目标网络模型进行训练。系统选用Pytorch框架来搭建YOLOv4深度学习模型,采用的实验数据集为HRSC2016[5]以及DOTA数据集[6]。在模型训练过程中将数据集按照8:1:1的比例随机划分为训练集、验证集和测试集。训练过程中,batch size设置为4,一共进行100个epoch的训练,采用Adam优化器。初始学习率、动量和权重衰减参数分别设置为0.001、0.9和0.0005,学习率在经过10000步迭代后降为0.0001,其它参数与原始YOLOv4网络中的参数相同。因为YOLOv4算法有5个下采样过程,所以输入图像的大小应该是32的倍数。在训练过程中,本算法采用了与YOLOv4相同的数据增强策略,包括像素级数据增强方法、模拟目标遮挡方法以及多图混合数据增强方法等。

6.png4.2 系统运行过程

(1)模型训练完毕后,采用Flask框架对系统进行了实现和部署,系统部署完毕后在spyder中运行程序服务器程序,在Firefox、Googlechrome等浏览器输入localhost:2222/login进入登录界面(图6)。输入账号密码进入系统主页。

7.png8.png9.png4.3系统测试

(1)准确性

对于军事目标识别系统来说,能否为用户提供精确的信息是至关重要的,因此首先对该系统进行了准确性测试,测试步骤为:首先采用国产遥感图像下载平台(BIGEMAP、大地图等)下载大量包含不同军事目标的遥感数据;然后通过本文系统进行目标检测和识别,并统计总目标数、正确识别目标数、目标误判数、漏判数的;生成测试报告。测试结果如表2所示。

表2 系统准确性测试结果

10.png可以看出该系统的识别准确性较高,4种目标的识别准确率均达到了95%以上。

(2)运行速度

在现代化战争中,要想迅速部署作战行动,信息处理的速度就显得极为重要。系统分别对4类军事目标进行检测,并计算不同类别下每检测10个目标的耗时,测试结果如表3所示

表3 系统检测速度测试

11.png(3)扩展性

从识别范围来说,本文系统目前虽然只能对4类目标进行检测,但之后我们将继续对更多军事目前进行扩展,建立相应的数据集和模型库;从识别精度来说,随着数据集的不断扩展,训练得到的模型精度将越高系统性能就越成熟;从功能模块来说,本文系统具有易扩展性,针对遥感图像导入、模型训练和加载、结果导出等功能提供接口。

(4)安全性

本系统目前采取账号密码登录方式进入,账号或密码错误均不可进入。

5. 小结

本文针对信息化战争条件下的目标检测任务需求,设计开发了一款基于深度学习的遥感图像军事目标检测系统。该系统基于YOLOv4目标检测算法,通过构建飞机、油罐、立交桥、舰船这4类常见军事目标的数据集,并对这4类军事目标进行模型训练,实现了4种军事目标的快速精准检测。通过对系统的准确性、安全性、检测速度等进行测试,测试结果显示该系统各项性能指标较为良好,可以信息化战争条件下的目标检测提供一种有效的借鉴和参考。

参考文献

[1] Felzenszwalb P F, Girshick R B, Mcallester D, et al. Object Detection with Discriminatively Trained Part Based Models[J]. IEEE Transactions on SoftwareEngineering, 2010,32(9):1627-1645.

[2] REDMON J, FARHADI A. YOLO9000: Better, faster, stronger[C]// Proc. of the Computer Vision and Pattern Recognition, 2017: 6517-6525.

[3] REDMON J, FARHADI A. YOLOv3: An incremental improvement [EB/OL]. http://arxiv.org/abs/1804.02767, 2020-07-16.

[4] Wang, C. Y., Mark Liao, et al. CSPNet: A new backbone that can enhance learning capability of cnn. In: Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops, Virtual, 2020, 390-391.

[5] Z. Liu, L. Yuan, L. Weng, et al. ‘‘A high resolution optical satellite image dataset for ship recognition and some new baselines’’ in Proc. 6th Int. Conf. Pattern Recognit. Appl. Methods, 2017, 324–331.

[6] G.-S. Xia, X. Bai, J. Ding, et al. ‘‘DOTA: A large-scale dataset for object detection in aerial images’’ in Proc. IEEE Comput. Conf. Comput. Vis. Pattern Recognit, Jun. 2018, 3974–3983.

作者简介:刘大伟(1980-),男,山东潍坊人,工学博士,计算机应用教研室副教授。

》在线投稿系统

*文章题目:
*作者姓名:
*电子邮箱:
*通讯地址:
*联系方式:

  备      注:

*上传稿件:

支持上传.doc,.docx,.pdf,.txt,.wps文件

投稿须知:

1、审稿结果将于1~7个工作日以邮件告知,请注意查收(包含录用通知书、审稿意见、知网CNKI查重报告)。

2、提交投稿后,若7个工作日之内未接到录用通知,则说明该文章未被录用,请另投他刊。

3、凡投寄本刊稿件,如在内容上有侵权行为或不妥之处,均应文责自负。本刊有权对来稿进行文字编辑、加工和修改,如不同意,请附说明,以便妥善处理。

4、多作者文稿署名时须征得其他作者同意,排好先后次序,通知用稿后不再改动。

5、凡投往本刊稿件一经录用发表,其版权归本刊所有。

6、本刊已全文录入中国知网、万方、维普等数据库,如作者不同意被收录,请提前申明,未申明者,本刊一律视为同意被收录。

7、请勿一稿多投。