基于VGG-M网络模型的前方车辆跟踪

作者:刘国辉;张伟伟;吴训成;宋晓琳;许莎;温培刚; 刊名:汽车工程 上传者:韩志刚

【摘要】针对前方运动车辆复杂场景下的跟踪精度较低的问题,文中将庞大的VGG-M网络模型应用到实时跟踪中,并结合在线观测模型,实现对前方车辆稳定精准的跟踪。通过改进样本生成方案,优化网络训练集,提高了网络训练效率。采用自适应更新模型,可根据目标轮廓的高宽比、内部信息熵和跟踪的尺度置信度实时调节网络更新频率。实验结果表明,在线VGG-M跟踪模型比传统的车辆跟踪方法的性能有明显的改善。

全文阅读

前言近年来,基于车载相机的视觉目标跟踪技术已被成功应用在ADAS(advanced driver assistance sys-tems)上,其对于ADAS系统前方车辆的距离判断、碰撞预警等具有重要意义。传统的视觉跟踪方法主要分为生成式和判别式[1]。生成式的代表性算法有稀疏编码、在线密度估计和主成分分析等。LU H等[2]使用了一种新颖的pooling校正方法探索目标的部分信息和空间信息,在局部补丁上进行pooling得到的相似性,不仅定位目标更准确,且能适应一定程度的遮挡,该方法有效地利用稀疏系数在目标与背景之间的差异性,降低了跟踪漂移概率。与之相对地,判别式方法通过训练分类器来区分目标和背景,将目标跟踪转化为一个二分类问题。文献[3]中使用随机森林算法,通过在线学习高置信度的特征来更新目标模型,跟踪性能表现更加稳定。前两种方法都依赖于浅层的手工特征,有一定的局限性,无法利用目标的高级语义信息[4],导致其泛化能力不足,往往在复杂场景难以实现稳定的跟踪,如尺度自适应变化、遮挡后复原跟踪。近年来,深度学习的方法凭借其卓越的性能已经在图像识别和检测领域取得了成功。在跟踪系统中,影响其性能的关键在于特征的表达,深度学习因为其深层结构可以提取图像的高级语义特征,其较强的特征表达能力在目标跟踪领域有较好的应用潜力。本文中的跟踪模型是通过一个卷积网络的全连接层softmax分类器和在线观测模型来定位前方车辆,通过常规更新方案来更新网络,实现对前方车辆的稳定可靠跟踪。1基于深度学习的车辆跟踪器将深度学习的方法应用到车载相机的目标实时跟踪上,主要瓶颈在于短时间内可供在线训练的样本不足。WANG N在文献[5]和文献[6]中提出了DLT(deep learning tracker)算法,通过线下预训练获得物体特征的通用表示,一定程度上减少了目标训练样本的需求。但是DLT因线下训练的数据集分辨率较低,无法学习到足够强的匹配跟踪序列的特征表示。2015年在DLT的基础上提出了SO-DLT(structured output deep learning tracker),该模型使用类似AlexNet的网络结构,利用图片本身的结构化信息,直接从概率图确定目标框的位置。文献[7]中使用经过预训练的VGG-16 (visualgeometry group)网络[8],提出FCNT (fully convolu-tional networks tracker)跟踪器,对卷积神经网络特征在目标跟踪的性能进行较为深入的研究,提出VGG-16网络的特征图可以做定位,且网络的最后一层(Con5-3(1))深层的特征图具有较高的语义特征,可区分目标类间的特征差异,Conv4-3(1)较浅层的特征图可区分类内差异,该方法不再把CNN(convolution-al neural network)视为黑箱子,充分利用深度神经网络的结构特点来对目标定位。但是在实际测试中,对遮挡的表现鲁棒性不强。文献[9]中在VGG-19网络[8]上提取Conv3-4(1),Conv4-4(1),Conv5-4(1)层的特征并结合相关滤波器提出了粗/精式的跟踪算法,同样取得了不错的效果。2016年文献[10]中提出MDNet (multi-domainnetwork),运用多维的训练思路,将每个训练视频序列当成一个单独的域。该方法应用了大量的线下预训练,而减少了在线训练的样本需求。文献[11]中提出了一种简单有效的正则化技术branchout,减少了集成学习方法在模型多样化和训练样本中噪声标签较少的限制,为深

参考文献

引证文献

问答

我要提问