LiTAMIN2:一種超輕型LiDAR-SLAM(ICRA2021)
(文獻閱讀) LiTAMIN2: Ultra Light LiDAR-based SLAM using Geometric Approximation applied with KL-Divergence
論文作者:Masashi Yokozuka, Kenji Koide, Shuji Oishi, Atsuhiko Banno
文章來源:ICRA2021論文(點云配準)
視頻、論文地址:在公眾號「計算機視覺工坊」,后臺回復「LiTAMIN2」,即可直接下載。
其中的版本1,LiTAMIN: LiDAR-based Tracking And Mapping by Stabilized ICP for Geometry Approximation with Normal Distributions.
可參考博客:https://blog.csdn.net/Yong_Qi2015/article/details/114528734;
論文鏈接:https://ieeexplore.ieee.org/document/9341341
翻譯:chaochaoSEU
摘要:本文提出了一種可用于500-1000hz處理的3D LiDAR SLAM方法。該方法利用一種新的ICP度量,顯著減少了點云配準的點數,同時保持了配置精度。當點數減少時,采用ICP法的點云配準就不那么準確了,因為ICP基于的是點之間的距離最小化。為了避免這一問題,將對稱的KL-散度引入到反映兩個概率分布之間差異的ICP代價函數中。代價函數不僅包括點之間的距離,還包括分布形狀之間的差異。在KITTI數據集上的實驗結果表明,該方法具有很高的計算效率,性能優于其他方法,并且與現有最先進的SLAM方法具有相似的精度。
1 引言
同時定位與建圖(SLAM)是移動技術和服務的一個基本元素,如自主移動機器人。特別是,LiDAR和深度傳感器已經被商業化,且由于其穩定和準確的性能而正在被應用。在不久的將來,不僅是自動駕駛的汽車,而且所有類型的移動設備都將配備激光雷達或深度傳感器。我們預計,在這樣一個世界中,通過SLAM獲取的點云數據將被聚合到云端并共享以提供各種服務。
有必要從全球的設備中實時聚合的大量點云數據中有效地生成和更新世界地圖。由于在此過程中使用的服務器的數量比設備的數量要小得多,因此必須使用超出實時性能的SLAM方法。目前LiDAR-SLAM的性能只稍微好于實時性能。
除了服務器之外,操作邊緣設備也需要加速,而邊緣設備在計算資源方面受到了嚴重的限制。目前LiDAR-SLAM是基于使用CPU和GPU的PC保證實時性,提高SLAM方法的計算效率以確保邊緣設備的實時性。
雖然許多研究已經在SLAM基準 [1]和追求精度的方法[2]-[14]上進行,但很少有研究已經顯著提高了目前的計算效率。在未來,要集中、高效地處理大量的機器人和設備,SLAM方法將更加追求高速。
本文的目的是建立一種與最先進方法一樣準確的方法,同時實時性顯著超過當前方法。本文討論了一種3D LiDAR-SLAM,其顯著提高了LiDAR-SLAM的計算效率,可在500-1000 Hz下運行,且提供了與最先進方法相同的精度。該方法在保持精度的同時,使用一種新的ICP度量,顯著減少了用于點云配準的點數。采用ICP的點云配準方法在點云數較少時,精度低。為了避免這個問題,引入了對稱的ICP代價函數。實驗結果(圖1)表明,該方法具有很高的計算效率,性能優于其他方法,并與最先進SLAM方法有相似的精度。
圖1 使用LiTAMIN2的KITTI數據序列00的示例建圖結果。右下角圖的顏色表示由主成分分析分解的正態分布給出的正態方向,該方向是最小特征值的特征向量。
2 相關工作
LiDAR-SLAM方法可以分為兩類:基于 ICP的方法[2]-[8]和基于特征的方法[9]-[14]。
對于基于ICP的方法而言,體素化是一種簡單而有效的加速方法。通過將點云劃分為小群,并以正態分布逼近每個子點云,可以在一定程度上在保持形狀的同時顯著減少點的數量。正態分布變換(NDT)[15]-[17]和GICP[18]是執行體素逼近的最常用的icp方法,但它們之間存在一些區別。NDT只逼近具有正態分布的目標點,并確定體素對應,而GICP對目標點云和源點云進行正態分布逼近,并使用KD樹的精確最近鄰搜索尋找相關性。NDT的計算效率往往更高,而GICP則往往更準確。
基于特征的方法是從LiDAR數據中提取點、線、面等幾何特征,并有效地確定對應關系。LOAM[9]是第一個使用特征方法進行快速和準確的LiDAR里程計。它使用特征匹配顯著減少了定位階段所需的點數。LeGo-LAOM [11]只依靠良好的性能來執行特性選擇,是目前可用的最快方法之一[2]。
為了實現更快的配準,一些方法利用GPU的計算能力,包括SuMa[4]、Elastic-Fusion [6]、Elastic-LiDAR Fusion [5]和Droeschel等的方法[8]。它們將LiDAR數據的形狀近似為Surfel (面元)[19]。Surfel是一種基于點的渲染方法[20],它旨在用點云而不是多邊形網格來渲染三維形狀,并且適用于GPU處理。因此,它允許通過使用硬件支持的投影數據關聯來實現快速的點對平面ICP[21]的性能。
基于深度神經網絡的LiDAR里程計[22]-[24]的方法也已經流行起來。LO-Net[22]是一種端到端的LiDAR里程計。雖然用于訓練和測試的數據變化較少,但它顯示的精度與傳統方法相似。LO-Net主要是卷積張量運算,這使得點對點處理的并行化更加容易,對GPU的未來演化也可擴展。然而,端到端里程計估計是否可在未學習的環境和運動下工作尚未得到足夠的研究,因此需要進一步的研究。
當前的LiDAR SLAM方法大約需要N點數的O(N)或O(Nlog(N)),并且從理論上講,應該引入不同的方法來改進算法。本研究中的主張簡單明了:基于ICP的方法所需的點數應該少。通常,基于ICP的方法的準確性會隨著點數的減少而降低;因此,應該找到一種方法來解決速度和精度之間的權衡問題。
3 數學模型
在本節中,我們描述了該方法與LiTAMIN[2]之間的差異;這些差異是用于減少點數的方法和使用ICP代價函數。
A.減少點數
如圖2所示,LiTAMIN將一組輸入點投****到體素網格中,使用投****點的方法對齊它們,并將點云集成到體素圖中。該方法以類似的方式執行SLAM,但不同之處在于,它對輸入點組的投****結果使用了協方差,而不僅僅是平均值。而LiTAMIN是一種point-to-normal分布建圖,該方法將其擴展到distribution-to-normal分布建圖。這是為了通過考慮分布來提高準確性。該方法增加了每個體素的大小,減少了點數,這大大降低了計算成本。此外,它通過考慮分布的形狀而不是點來避免了精度的損失。
圖2 我們的方法概述。右圖的顏色表示通過使用主成分分析分解的正態分布給出的法線方向;顏色類似于圖1中的顏色。
B.應用于對稱KL散度的ICP代價函數
表1顯示了現有方法和所提方法的ICP代價函數。該方法與其他方法的區別在于,代價不僅考慮了點之間的距離,還考慮了分布的形狀。雖然其他的方法,如NDT[15],GICP[18]和LiTAMIN [2],已經考慮了協方差,但在實踐中,它們只通過加權協方差的倒數來評估距離。該方法同時計算第一項的加權距離和第二項的分布形狀差異。例如,如果點之間的距離很小,但分布的形狀不匹配,則代價函數被設計為很大。這個代價來自于兩個高斯分布p和q[25]的KL-散度DKL(p||q)[26]:
KL-散度是對分布之間差異的一種度量,它不僅代表了平均值之間的差異,而且還代表了分布形狀之間的差異。KL-散度的目的是進行一個考慮到分布形狀的魯棒配準。
然而,KL-散度DKL(p||q) ≠DKL(q||p)并不對稱:它通常被認為不是一個距離。由于ICP是一種距離最小化算法,需要更合適的度量,因此使用DSymKL(p||q),本研究引入了以下對稱性:
通過在DSymKL(p||q)中應用歸一化,并引入剛體變換R和t,得到了代價函數,為了進一步解決異常值,ICP誤差EICP和分布形狀誤差ECOV設置如下:
另外,其權重如下:
在表1中,考慮到LiTAMIN的兩個分布的協方差,所提出的方法的第一項可以看作是ICP代價。與LiTAMIN主要區別是第二個代表分布形狀差異的術語。在本研究中,引入這個項,使精度不會降低,即使點的數量因為大的體素大小而大大減少。它可以只計算第一項,即ICP代價。因此,研究了僅是第一項的情況與實驗中第一項和第二項組合的情況之間的差異。
C.實現和參數
本研究利用牛頓方法優化了該方法的代價函數。由于代價函數的第二項不是平方誤差,它需要先求Hessian,并且使用牛頓法,而不是高斯-牛頓方法。這項研究沒有使用LM法[27]的阻尼因數,因為沒有它的計算是穩定的。
σICP和σCov的可接受值分別根據經驗設置為0.5和3。sigmaICP對應于到Cqp的Mahalanobis距離,這意味著低于0.5的對應點是可信任的。σCov對應于ECOV;如果Cq和RCpRT相同,則ECOV = Tr(I)+ Tr(I)-6應該為0。在DSymKL(p||q)中,-2d是使DSymKL的最小值為0的項。將σCov= 3設置為允許在沒有該術語的情況下允許的大約一半的誤差。如在LiTAMIN中一樣,Frobenius歸一化的參數lambda設置為10-6。
LiTAMIN使用權重w的占用概率[28],而所提出的方法使用wICP和wCov代替。對于閉環檢測,使用了建議的ICP代價。其他元素使用與LiTAMIN中相同的參數和實現。除LiTAMIN外,還使用KD樹搜索了ICP的相應點。關于圖的表示,除了LiTAMIN以外,還使用了體素圖。體素貼圖用于減少構成貼圖的正態分布的數量。
4 實驗分析
A.對比
幾種最先進的方法被選擇為使用不同加速算法的競爭對手,特別是LiTAMIN、 SuMa、 LeGO-LOAM、 LOAM、 hdl-graph-slam[3], LO-Net 和 DeepLO。在SuMa項目頁面上提供了一個詳細的評估,因此在研究中提到了這個問題,而計算時間是由運行開源的研究人員獲得的。在接下來的實驗中,我們還利用LeGO-LOAM、LOAM、hdl-graph-slam的開源來獲得軌跡和測量計算速度。關于LO-Net,使用了原論文的結果。
B.評價基準和標準
實驗中使用了KITTI視覺基準測試,它包含了Velodyne HDL-64E S2在多個環境中獲取的點云。因此,它允許評估由任何SLAM方法獲得的軌跡。所提供的點云已經被分解,因此它們被直接輸入到所提出的方法和競爭對手中。
根據以下三個標準評估每種方法的性能:
1) KITTI stats。KITTI Vision Benchmark [1]統計數據,即KITTI統計數據,用于準確性評估。這些標準使得能夠使用相對于地面真實情況的相對關系來評估估計軌跡的質量。在這項研究中,以這種方式針對不同的長度(特別是每100 m至800 m)計算了平移和旋轉誤差,并計算了誤差的平均值?;鶞侍峁┑拇a用于計算KITTI統計信息。
2)Absolute Trajectory Error(ATE):為了評估每種方法的閉環性能,還計算了ATE [29]。ATE是相對于地面真實情況的絕對位置和姿態誤差的指示器。KITTI統計信息是子軌跡誤差的平均值,可能會低估閉環的影響;但是,ATE允許基于絕對誤差評估比較由閉環修改的軌跡的整個形狀。
3)Total time and frame rate:作為計算效率的指標,計算了處理KITTI Vision Benchmark的所有序列(包括閉環)所花費的總時間。還介紹了里程計的幀頻,以評估位置估計的速度,這對于某些實時應用可能很重要。
C. Ablation study
所提出的方法將在每個體素中投****的子點云近似為正態分布。由于體素大小會顯著影響性能,因此針對不同體素大小對提議的方法進行了全面評估,如表2所示。此外,表2顯示了使用體素化處理從原始掃描點開始的平均減少百分比。從KITTI統計數據來看,體素越精細,準確性就越不總是這種情況。請注意,在以下實驗中,體素大小固定為3米,因為使用此值可獲得最佳性能。
D.對比分析
表3顯示了KITTI統計數據的比較。對于SuMa,比較了從作者的項目頁面獲得的軌跡數據集,幀到幀,幀到模型以及帶循環閉合的幀到模型。對于LeGO-LOAM和hdl-graph-slam,實現了閉環,但是由于在我們的實驗中未進行閉環檢測,因此結果未在表3中列出。對于LOAM,考慮了在他們的論文中使用開源的測量結果以及原始論文的結果。原始序列中列出了各個序列的統計信息,但最終的KITTI統計數據未在表3中列出,因為它們未在原始論文中列出。LO-Net未在表3中列出,因為在[22]中提供了各個序列的統計信息,但未提供所有最終誤差值的平均值。
表4表示ATE的比較。除表2外,還對SuMa的結果進行了評估,分析了從作者的項目頁面獲取的軌跡。對于LOAM,將顯示開源軟件的結果。LO-Net被排除在表4中,因為ATE的結果未包含在原始論文中。表5顯示了使用KITTI的每個序列和測距法過程的平均幀速率創建地圖所花費的處理時間。所提出的方法LiTAMIN和SuMa顯示了包括循環閉合在內的處理時間,因為這些方法中的循環閉合對所有序列都是成功的 SuMa結果是在本研究使用的計算機上使用開放源代碼獲得的,因為SuMa原始論文中的計算機規格不同。圖3顯示了每種方法的軌跡比較。左起的第二和第四幅圖顯示了所提出的方法和SuMa的閉環結果,但未顯示其他無法檢測到環路的方法。
總結
在這項研究中,提出了一種使用對稱KL散度的ICP方法來顯著提高LiDAR-SLAM的速度,并將其與其他最新的SLAM方法進行了比較。所提出的方法在里程計幀速率上實現了500 fps至1000 fps的計算速度,并且具有與其他方法相同的準確度,這證實了所提出的方法是從傳統方法向前邁出的一大步。這是因為通過將點云從LiDAR投****到每個體素網格并將投****的子點云近似為一個正態分布,從而大大減少了用于配準的點數。盡管所提出的方法大大減少了點數,但是所提出的對稱KL散度的ICP成本允許在不降低準確性的情況下處理數據。這些結果基于KITTI Vision Benchmark數據集,我們認為我們需要研究當使用環境發生變化時如何確定適當的體素大小。
*博客內容為網友個人發布,僅代表博主個人觀點,如有侵權請聯系工作人員刪除。