Review on the 3D-Object Detection Based on Deep Learning
彭育辉 郑玮鸿 张剑锋(福州大学,福州 350116)
Peng Yuhui, Zheng Weihong, Zhang Jianfeng
主题词:无人驾驶 深度学习 激光雷达 目标检测 三维点云TN958.98;U463.6 A 10.19620/j.cnki.1000-3703.20190695中图分类号: 文献标识码: DOI: Review on the 3D-Object Detection Based on Deep Learning Peng Yuhui, Zheng Weihong, Zhang Jianfeng Fuzhou University, Fuzhou 350116) ( Abstract Based on the introduction of 2D- object detection methods, the deep neural network for 3D- object【 】detection based on deep learning, including 3 principal methods of indirect processing, direct processing, and fusion processing, are discussed. The advantages and disadvantages of deep neural network in 3D- object detection speed and accuracy are analyzed and compared, which provide reference basis for the selection of object detection method of onboard laser radar.
Key words: Autonomous driving, Deep learning, Laser radar, Object detection, 3D point cloud 1 前言
有别于机器视觉传感器,激光雷达传感器具有受环境和天气等因素影响小、测距精准等优点。随着多线激光雷达传感器价格的逐年下降,基于车载激光雷达进行汽车外界环境感知成为实现汽车无人驾驶的主流技术方案,同时也是汽车无人驾驶领域的关键技术和研究热点。
基于激光雷达实现车外环境信息的感知就是在汽车行驶过程中,通过车载激光雷达准确地估计出车外不同三维目标的类别和位置,即分类和定位[1- 6]。车载激光雷达获取的物体三维点云具有稀疏、分布不均、无序的特点,从而衍生出不同的数据处理算法。其中,基于深度学习的点云处理方法因其优秀的分类准确性和实时性而受到国内外学者的普遍关注。
深度学习的一般表现形式为一种深层神经网络,具有很强的特征提取能力,在监督式学习的目标分类上取得了很好的结果。图像是最早、最常用的视觉信息载体,摄像头等设备采集的图像信息大量使用,因此,图像
2010 Felzenszwalb信息的处理十分重要。 年, 团队提出
Deformable Part Model,DPM)[的可变形部件模型( 7]使传统的二维图像目标检测与识别达到一定的高度,但是算
Histogram of法的效果并不令人满意,梯度方向直方图(
Oriented Gradients,HOG)
特征提取存在的遮挡物影响
2013 Girshick问题仍然比较突出。 年, 等提出区域卷积
Region- based Convolutional Neural Network,神经网络(
R- CNN)[
8],揭开了基于深度学习的二维目标检测与识别的帷幕。目前,基于深度学习的二维图像目标检测方法不断完善[9- 13],已广泛应用在人脸识别、交通管理、文字识别等方面[14-17],技术成熟可靠。
在处理激光雷达获取的三维点云方面,借鉴二维图像的目标检测成为一种重要的技术途径。将三维点云数据降维后,利用图像目标检测的方法进行特征提取是初期的处理手段,算法耗时长且精度不足,局限性明
【摘要】在介绍二维目标检测方法的基础上,对基于深度学习的三维目标检测方法中的深度神经网络展开探讨,包括间接处理、直接处理和融合处理3类基本方法,并着重分析和对比各深度神经网络在三维目标检测速度和精确度等方面的优缺点,为车载激光雷达目标检测方法的选择提供参考依据。