基于卷积神经网络的车辆和行人检测算法

作者:潘婷;周武杰;顾鹏笠; 刊名:浙江科技学院学报 上传者:李双玲

【摘要】针对传统的车辆和行人检测算法在提取特征时鲁棒性较差的问题,提出一种基于深度学习的车辆和行人检测算法。该算法利用更快速的区域卷积神经网络(Faster RCNN)开源框架和Squeezenet网络,通过在线负样本学习(OHEM)算法和可变的非极大值抑制(Soft-NMS)算法来改进算法的检测精度。首先采用Squeezenet网络框架对图片提取特征,然后通过区域提取网络算法(RPN)获取图片中待检测的区域,最后在检测阶段加入OHEM算法对疑难样本进行重新学习和Soft-NMS抑制重叠矩形框,从而得到目标的得分和边界框。结果表明,基于卷积神经网络的车辆和行人检测算法能够获得较好的检测效果。

全文阅读

随着中国经济的持续快速增长,车辆已成为不可缺少的代步工具,人们对汽车的舒适度和安全性提出了更高的要求。在2016年世纪围棋大战落幕之后,2017年迎来人工智能年,无人驾驶作为人工智能的热门应用迎来了巨大的发展空间。在无人驾驶领域,车辆和行人目标检测是车辆感知外界环境的基础环节,也是计算机视觉和图像处理方向的重要分支[1]。2013年随着R-CNN[2]被应用于目标检测领域并取得较好效果,深度学习的方法开始在目标检测领域发展起来,主要分为不基于区域建议和基于区域建议两种方式[3]。不基于区域建议的算法主要采用回归的思路,其检测效果相对而言不理想但速度较快,Szegedy等[4]通过深度神经网络(deep neural network,DNN)采用回归的方式估计图片中目标的概率和分数;Redmon等[5]提出了一种只需在图像上看一次(you only look once,YOLO)即可实现检测的算法,通过将整张图片分为多个网格,分别计算每个网格包含目标及位置的概率检测目标,提高了检测速度;之后出现了诸如单个多盒检测器(single shot multibox detector,SSD)[6]、YOLO算法的变形[7]、小型的单个多样检测器(tiny single shot multibox detector,Tiny SSD)[8]等算法,可以实现实时检测,但检测精度仍略逊于基于区域建议的算法。基于区域建议的算法主要分为两步,一是找到感兴趣区域;二是通过卷积神经网络检测得到目标并标定矩形框。通过在基于区域卷积神经网络(regions with CNN,RCNN)算法基础上不断改进,He等[9]提出了空间金字塔池化网络(spatial pyramid pooling network,SPP-net),取消了输入尺寸的限制;Girshick等[10]提出了快速基于区域卷积神经网络(fast regions with CNN,FastRCNN),通过增加区域建议融合层减小了计算量;Ren等[11]提出了更快速的基于区域卷积神经网络(faster regions with CNN,Faster RCNN),将目标检测的4个步骤融合提高了检测精度,并且提高了检测效率;之后出现了诸如基于区域的全卷积神经网络(region-based fully convolutional networks,R-FCN)[12]、基于掩模的区域卷积神经网络特征(mask regions with CNN,Mask RCNN)[13]等网络框架,改进了基于区域建议的方法。其中,Faster RCNN算法因较好的性能,被应用于诸如车型识别、人脸检测、医疗病理检测及电力小部件识别等,并且都取得了较好的结果。当前车辆和行人检测算法主要是在目标检测算法的基础上,针对车辆在不同尺度和角度下特征的区别,以及考虑行人多姿态的情况,设计出有针对性的算法,诸如行人检测的可变形组件模型(deformablepart model,DPM)[14]算法和可用于车辆检测的深度学习的ZF模型[11]算法等。基于上述研究,本研究提出了基于卷积神经网络的车辆和行人检测算法,该算法针对当前算法特征提取时参数较多、计算量较大的不足,以及传统检测算法中特征提取鲁棒性较差的现象,在Faster RCNN的开源框架的基础上,利用Squeezenet网络框架提取特征,有效减少参数提高计算性能,之后在训练学习阶段通过在线负样本学习[15](online hard example mining,OHEM)算法将疑难样本重新训练以

参考文献

引证文献

问答

我要提问