基于改进Caps Net的交通标志分类模型
张祝晨1,杨辉1,玉彩灵1,甘雨露1,黄安1
生成PDF 清样下载 引用

复制成功

导出题录

参考文献( GB/T 7714-2015 ) 复制

张祝晨1,杨辉1,玉彩灵1,甘雨露1,黄安1,. 基于改进Caps Net的交通标志分类模型[J]. 交通技术研究,202211. DOI:10.12721/ccn.202.157105.
摘要: 针对当今传统的标量卷积网络识别交通标志存在的姿态信息、定位精度低下的缺陷,本文开发了一种新的TSR方法Caps Net它通过动态路由算法将交通标志的定义和描述转换,从而有效地捕捉到交通标志的空间变化,比起传统的标量卷积网络,具有明显的优势。通过GTSRB和CNN的深入研究,我们发现,采用改良的Caps Net技术,TSR率可以提升至98.73%,而且具有较好的收敛性能。这种新技术为交通管理提供了有力的支持,有助于提升交通安全管理水平。
关键词: 交通标志分类; 神经网络; Caps Net
DOI:10.12721/ccn.202.157105
基金资助:大学生创新创业训练项目(S202210595334X)

一、引言

近几年,我国相关的交通技术的水平逐步提高,人类社会从石器时代走到现代信息化的时代,交通工具早已从自行车、蒸汽汽车到现在的现代化汽车,而汽车数量剧增的今天,交通标志对我们来说尤为重要。随着经济、汽车和公路技术的飞速发展,中国正在加快交通标志的部署,这将推动全球交通定位技术的进步,而这些技术的发展将需要更多的业务类型和需求,以满足日益增长的市场需求。给予用户高水平的体验质量将会是交通便利发展的需求制高点,但随之而来的许多问题也将浮现。"潮流"是当前研究的重点,它旨在解决传统标量卷积网络在识别交通标志时可能会出现的位置和姿态信息丢失的问题。

二、Caps Net创新优势

(一)识别率高且收敛速度更快

我们以Caps Net为基础改进交通标志分类模型在效率上会显得更快。由Caps Net构建的动态路由算法可以有效地捕捉和传输实物的位置、形状、状态、颜色等信息,从而比起传统的标准卷尺技术来,能够有效地捕捉和维护交通标志的空间信息。通过GTSRB和CNN的深入研究,我们发现,采用改良的Caps Net技术,TSR率可以提升至98.73%,而且具有较好的收敛性能。这种新技术为交通管理提供了有力的支持,有助于提升交通安全管理水平。

(二)Caps Net网路结构得到了优化

   VGG[2]是一种新型的图像处理方式,它具有较强的扩展性,并且在处理1000类图像的情况下表现出色。它的优点在于,它的层次结构较浅,这样就能够提供较好的性能。此外它还具备三个卷积,即1个conv7x7,2个conv1x1,这样就可以在处理多种信息的情况下,保证模型的准确性。这种方式的优势在于,它无论是在模型的性能还是在处理复杂的路况条件方面都表现出色。

Caps Net网络通过使用256个9×9的滤波器来提取图像的特征,然而,由于这些卷积核参数量较大,它们可能会影响模型的学习速度。经过改进后的Caps Net网路解决了原版的Caps Net网路在这方面的问题。根据图1,本文采用218个3×3小卷积,并结合inception Net[3]分支,有效地拓展了特征提取网络的宽度和深度,从而极大地提升了模型的表达能力。通过采用2×2的最大池化层max_pooling,我们可以有效地实现数据的降维,即使在最大池化过程中,会丢失一些关键特征,但也能够有选择地保留这些重要的特征。

 图片4.png

图1 改进Caps Net的分类框架

(三)相较于原版的Caps Net识别准确度更高;相较于LeNet[4]拟合数据更快。

根据表1的数据,三种不同的网络架构的性能参数均有显著提升。其中,采用Caps Net架设的系统,其准确度、召回率和F1-score均处于优异水平,且与其他架设相比,具有更优越的效果。经过改良的Caps Net的分类模型,其准确率极大地超过98.77%,与LeNet和原版的精准率相当,前者的准确率只有3.45%,后者的准确率只有1.3%。此外,该模型还通过两层128个3×3的滤波器和inception Net的结构来实现对数据的有效提取,而与传统的256个9×9的滤波器相比,其有效性更加显著。通过精简模型参量,同时保持对外界环境的敏锐度,我们大幅度改善了网络的表示效果,从而获得了远超过传统架构的卓越性能。

 图片5.png

表1 三种网络结构指标对比

三、特色

我们的项目面向经济、技术、汽车工业等快速发展的未来,为了完善交通标志检测和识别这一智能车辆系统中的关键技术,在未来能更好的减少交通事故的发生,保障未来智能车辆行驶的安全。基于改良的Caps Net技术,我们开发出一种新的TSR模型,它具有较强的位置、形状、状态、颜色等特征,而且采用3×3小积、inception Net结构,大大增强了网络的宽度和深度,最终在GTSRB上,可以更准确地识别出复杂的行车环境,比如阴天、雨雪、物体遮挡等,从而提高车辆的识别效率。

四、结语

采用Caps Net模型和inception Net结构,我们提取了低胶囊层的特征,并将其进行了特征整合。我们运用动态路由算法将这些特征传递给高级胶囊,从而实现了对交通标志的准确识别。使用向量神经元的胶囊网络可以大幅提升识别精度,其准确度最高可

达到98.73%,远超传统卷积神经网络。然而,目前胶囊网络的结构仍然较为简单,因此,未来的研究将进一步深化分类模型,优化动态路由算法,从而实现更加精准、高效的交通标志识别。

[参考文献]

[1] Sabour S, Frosst N,Hinton G E. Dynamic routing between capsules[C]//Proc of the 31st Annual Conference on Neural Information      Processing Systems.Canada:NIPS,2017: 3856-3866.

[2] Szegedy C, Liu Wei, Jia Yangqing, et al. Going deeper with convolutions [C]//Proc of IEEE Conference on Computer Vision and Pattern Recognition. Piscataway, NJ: IEEE Press,2015: 1-9.

[3] Simonyan K, Zisserman.A very deep convolutional for large-scale image recognition[C]//Proc of International Conference on Learning Representations. Piscataway,NJ:IEEE,2015: 362-387.

[4] LeCun Y,Bottou L,Bengio Y,et al.Gradient-based learning applied to document recognition[J].Proceedings of the IEEE,1998,68(11):2278-2324.

作者简介:张祝晨,男,天津人,本科生

通信作者:杨辉,女,内蒙古乌兰察布人