基于双路式卷积神经网络的车辆与行人检测

作者:林少丹;李伙钦;洪朝群; 刊名:西华大学学报(自然科学版) 上传者:黄秋兰

【摘要】针对低能见度状态下对车辆与行人的视觉特征难以提取的问题,提出一种将2路卷积神经网络融合从而实现对车辆与行人识别的方法。采用高斯背景差分法实现图像去模糊,在双路网络中分别采用不同尺寸的滤波器,调整滤波器的大小得到不同环境下图片的特征值,采用反向传播算法计算梯度。实验结果显示,与单路式卷积神经网络对比,在能见度低的环境中,该方法对车辆的辨识率提高至83. 49%,对行人的辨识率提高至87. 36%,表明在低能见度环境中,双路式卷积神经网络识别准确率高于单路式卷积神经网络。

全文阅读

车辆与行人的辨识,主要用于道路监控,自动驾驶等方面。在辨识的算法上多采用传统模型,在正常的开放环境中辨识率较高,但如遇雾霾天气、沙尘天气等恶劣环境条件,交通视频监控的对比度与能见度均会产生较大幅度的下降,导致视频成像无法识别,这将使路况观测、目标跟踪、智能导航、自动驾驶等基于视觉的检测系统无法正常运行,对道路交通安全带来了诸多隐患。图像去模糊技术将有效降低恶劣天气对于视频成像的影响。传统的单目视觉是正常的开放环境中检测车辆和行人的主要方法[1],主要特点在于其硬件的性能和价格合理,获取信息量大等特征,但其处理模糊图像的算法相对简单且效果不佳。采用双路式卷积神经网络架构结合高斯背景差分法进行车辆与行人的辨识,将提高在夜间或恶劣环境条件下车辆与行人的辨识准确率,有利于加强道路监控、自动驾驶等方面的应用,在智能交通等相关领域具有重要的应用价值和前景。1双路式卷积神经网络模型介绍双路式卷积神经网络分为A网络和B网络,分别定义为A-NET和B-NET。A-NET针对正常环境下车辆行人检测网络,而B-NET则针对低能见度环境中车辆行人的检测网络。图1为双路式卷积神经网络模型。图1双路式卷积神经网络模型双路式卷积神经网络模型可以定义为f=(fA,fB),这里fA和fB分别代表A-NET与B-NET的特征函数,那么双路特征函数可以定义为f=ω×Xi,j+b,(1)(1)式中:Xi,j代表A-NET和B-NET输入的第i,j个图片[2],ω代表一个滤波器,是一个偏置量,f是一个非线性激活函数。双路式网络模型的特点在用A-NET和B-NET分别采用不同尺寸的滤波器,调整滤波器的大小可以得到不同环境下图片的特征值[3]。双路式网络模型包含了一个图像描述符,即池化函数P。如果要在图像中的所有位置聚合双路式特征,一种方法是通过池化简单地总结所有双路式特征,可定义为Pi,j=Pi,j=W 1×HiW=∑-01jH=∑-01Xi×W+ω,j×H+h,(2)Pi,j=∑∑Xi×W+ω,j×H+h,(2)1W×Hi=0j=0∑i=0∑H-1j=0式中:Pi,j为池化函数; X为输入图片,根据X的下标i×W+ω,j×H+h,定位得到双路式特征; H,W为池化窗口的高和宽。另一种方法是最大池方法,可定义为Pi,j=max(Xi×W+ω,j×H+h),(3)(3)式中,X的下标参数h和ω的取值范围分别是0≤h≤H-1、0≤ω≤W-1。最大池方法忽略了图像特征的位置,如输入数据大小不一时可以采用最大池采样的方式进行处理,双路式网络模型允许使用最大池方法进行采样[4]。2数据集的配置双路式卷积神经网络的训练数据集整合了清晰和模糊两种图片源,其中包含车辆和行人的高清图片,也包含了低能见度下车辆和行人的图片,这些图片均是在开放环境中车辆与行人的图片,模糊图片的取得,也可以通过把高清图片进行模糊化处理生成模糊图片,建议通过Photoshop的高斯模糊功能实现数据集图片的模糊处理。本文所采用的数据集分别为12 000张车辆图片和12 000张行人图片组成,A和B各12 000张图片。图片加载程序直接从图片目录中读取图片文件,然后对图片进行JPEG格式解码操作,将图片调整成208×208。由于是二分类问题,因此,把车分类标记为1,人分类标记为0。此外,为提高后续训练的准确率,应随机打乱图片与标签的对应顺序,并生成Batch导入A-NET和B-NET进行处理。3双路式卷积神经网络的构建双路式网络主要通过待识别图像2路信息同时输入网络,卷积层提取特征后,在全连接(FC)层融合形成判别特征,最终在输出层进

参考文献

引证文献

问答

我要提问