视觉SLAM深度解读

2020-01-21 03:53:30 浏览: 780次 来源:亚博官网登陆 作者:

近年来,SLAM手艺取得了惊人的成长,领先一步的激光SLAM已成熟的使用于各大场景中,视觉SLAM虽在落地使用上不及激光SLAM,但也是目前研究的一大热点,今天我们就来细致聊聊视觉SLAM的那些事儿。

视觉SLAM是什么?

视觉SLAM次要是基于相机来完成情况的感知工作,相对而言,相机成本较低,容易放到商品硬件上,且图像消息丰硕,因而视觉SLAM也备受关心。

目前,视觉SLAM可分为单目、双目(多目)、RGBD这三类,另还有鱼眼、全景等特殊相机,但目前在研究和产物中还属于少数,此外,连系惯性丈量器件(Inertial Measurement Unit,IMU)的视觉SLAM也是此刻研究热点之一。从实现难度上来说,大致将这三类方式排序为:单目视觉>双目视觉>RGBD。

视觉SLAM深度解读

单目相机SLAM简称MonoSLAM,仅用一支摄像头就能完成SLAM。最大的长处是传感器简单且成本低廉,但同时也有个大问题,就是不能切当的获得深度。

一方面是因为绝对深度未知,单目SLAM不能获得机械人活动轨迹及地图的实在大小,若是把轨迹和房间同时放大两倍,单目看到的像是一样的,因而,单目SLAM只能估量一个相对深度。另一方面,单目相机无法依托一张图像获得图像中物体离本人的相对距离。为了估量这个相对深度,单目SLAM要靠活动中的三角丈量,来求解相机活动并亚博估量像素的空间位置。便是说,它的轨迹和地图,只要在相机活动之后才能收敛,若是相机不进交运动时,就无法得知像素的位置。同时,相机活动还不能是纯粹的扭转,这就给单目SLAM的使用带来了一些麻烦。

而双目相机与单目分歧的是,立体视觉既能够在活动时估量深度,亦可在静止时估量,消弭了单目视觉的很多麻烦。不外,双目或多目相机配置与标定均较为复杂,其深怀抱程也随双目标基线与分辩率限制。通过双目图像计较像素距离,是一件很是耗损计较量的工作,此刻多用FPGA来完成。

RGBD相机是2010年摆布起头兴起的一种相机,它最大的特点是能够通过红外布局光或TOF道理,间接测出图像中各像素离相机的距离。因而,它比保守相机能够供给更丰硕的消息,也不必像单目或双目那样费时吃力地计较深度。

视觉SLAM框架解读

视觉SLAM深度解读

1.传感器数据

在视觉SLAM中次要为相机图像消息的读取和预处置。若是在机械人中,还可能有码盘,惯性传感器等消息的读取和同步。

2.视觉里程计

视觉里程计的次要使命是估算相邻图像间相机活动以及局部地图的样子,最简单的是两张图像之间的活动关系。计较机是若何通过图像确定相机的活动的。在图像上,我们只能看到一个个的像素,晓得他们是某些空间点在相机的成像平面投影的成果。所以必需先领会相机跟空间点的几何干系。

Vo(又称为前端)能够通过相邻帧间的图像估量相机活动,并恢复场景的空间布局,称它为里程计。被称为里程计是由于它只计较相邻时辰的活动,而和再往前的过去消息没相关联。相邻时辰活动串联起来,就形成了机械人的活动轨迹,从而处理了定位问题。另一方面,按照每一时辰的相机位置,计较出各像素对应的空间点的位置,就获得了地图。

3.后端优化

后端优化次要是处置slam过程中噪声的问题。任何传感器都有噪声,所以除了要处置“若何从图像中估量出相机活动”,还要关怀这个估量带有多大的噪声。

前端给后端供给待优化的数据,以及这些数据的初始值,尔后端担任全体的优化过程,它往往面临的只要数据,不必关系这些数据来自哪里。在视觉slam中,前端和计较接视觉研究范畴更为相关,好比图像的特征提取与婚配等,后端则次要是滤波和非线性优化算法。

4.回环检测

回环检测也能够称为闭环检测,是指机械人识别曾达到场景的能力。若是检测成功,能够显著地减小累积误差。回环检测本色上是一种检测不雅测数据类似性的算法。对于视觉SLAM,大都系统采用目前较为成熟的词袋模子(Bag-of-Words, BoW)。词袋模子把图像中的视觉特征(SIFT, SURF等)聚类,然后成立辞书,进而寻找每个图中含有哪些“单词”(word)。也有研究者利用保守模式识此外方式,把回环检测建形成一个分类问题,锻炼分类器进行分类。

5.建图

建图次要是按照估量的轨迹成立与使命要求对应的地图,在机械人学中,地图的暗示次要有栅格地图、间接表征法、拓扑地图以及特征点地图这4种。而特征点地图是用相关的几何特征(如点、直线、面)暗示情况,常见于视觉SLAM手艺中。这种地图一般通过如GPS、UWB以及摄像头共同稀少体例的vSLAM算法发生,长处是相对数据存储量和运算量比力小,多见于最早的SLAM算法中。

视觉SLAM工作道理

大大都视觉SLAM系统的工作体例是通过持续的相机帧,跟踪设置环节点,以三角算法定位其3D位置,同时利用此消息来迫近猜测相机本人的姿势。简单来说,这些系统的方针是绘制与本身位置相关的情况地图。这个地图能够用于机械人系统在该情况中导航感化。与其他形式的SLAM手艺分歧,只需一个3D视觉摄像头,就能够做到这一点。

通过跟踪摄像头视频帧中足够数量的环节点,能够快速领会传感器的方向和四周物理情况的布局。所有视觉SLAM系统都在不竭的工作,以使从头投影误差(Reprojection Error)或投影点与现实点之间的差别最小化,凡是是通过一种称为Bundle Adjustment(BA)的算法处理方案。vSLAM系统需要及时操作,这涉及到大量的运算,因而位置数据和映照数据经常别离进行Bundle Adjustment,但同时进行,便于在最终归并之前加速处置速度。

视觉SLAM与激光SLAM有什么区别?

在业内,视觉SLAM与激光SLAM谁更胜一筹,谁将成为将来支流趋向这一问题,成为大师关心的热点,分歧的人也有分歧的见地及看法,以下将从成本、使用场景、地图精度、易用性几个方面来进行细致阐述。

1.成本

从成本上来说,激光雷达遍及价钱较高,但目前国内也有低成本的激光雷达处理方案,而VSLAM次要是通过摄像头来采集数据消息,跟激光雷达一对比,摄像头的成本明显要低良多。但激光雷达能更高精度的测出妨碍点的角度和距离,便利定位导航。

2.使用场景

从使用场景来说,VSLAM的使用场景要丰硕良多。VSLAM在室表里情况下均能开展工作,可是对光的依赖程度高,在暗处或者一些无纹理区域是无法进行工作的。而激光SLAM目前次要被使用在室内,用来进行地图建立和导航工作。

3.地图精度

激光SLAM在建立地图的时候,精度较高,思岚科技的RPLIDAR系列建立的地图精度可达到2cm摆布;VSLAM,好比常见的,大师也用的很是多的深度摄像机Kinect,(测距范畴在3-12m之间),地图建立精度约3cm;所以激光SLAM建立的地图精度一般来说比VSLAM高,且能间接用于定位导航。

视觉SLAM深度解读

视觉SLAM的地图成立

4.易用性

激光SLAM和基于深度相机的视觉SLAM均是通过间接获取情况中的点云数据,按照生成的点云数据,测算哪里有妨碍物以及妨碍物的距离。可是基于单目、双目、鱼眼摄像机的视觉SLAM方案,则不能间接获得情况中的点云,而是构成灰色或彩色图像,需要通过不竭挪动本身的位置,通过提取、婚配特征点,操纵三角测距的方式测算出妨碍物的距离。

总体来说,激光SLAM相对更为成熟,也是目前最为可靠的定位导航方案,而视觉SLAM仍是此后研究的一个支流方向,但将来,两者融合是必然趋向。

本文由亚博编辑整理亚博

本文章版权所有,转载请注明出处:www.ynvw.cn

更多阅读:

1: 中意创新产业发展论坛开幕 中电杉帝一站式智能制造提供转型新思路
2: 视觉SLAM深度解读
3: 深交所与华为成立技术创新联合实验室
4: “左拥右抱”宁德时代和桑顿 一汽能否赢回“老大哥”尊严?
5: 功率分流式(PS)混动构型