博客專欄

        EEPW首頁 > 博客 > 高翔博士:單目SLAM在移動端應用的實現難點有哪些?(2)

        高翔博士:單目SLAM在移動端應用的實現難點有哪些?(2)

        發布人:計算機視覺工坊 時間:2023-06-12 來源:工程師 發布文章
        1. 視覺SLAM的困難

        雙目相機和RGBD相機能夠測量深度數據,于是就不存在初始化和尺度上的問題了。但是,整個視覺SLAM的應用中,存在一些共同的困難,主要包括以下幾條:

        • 相機運動太快
        • 相機視野不夠
        • 計算量太大
        • 遮擋
        • 特征缺失
        • 動態物體或光源干擾

        2.1 運動太快

        運動太快可能導致相機圖像出現運動模糊,成像質量下降。傳統卷簾快門式的相機,在運動較快時將產生明顯的模糊現象。不過現在我們有全局快門的相機了,即使動起來也不會模糊的相機,只是價格貴一些。

        圖片

        (你真以為啥圖都可以用來SLAM嗎?拿衣服啊,圖片來自TUM數據集)

        圖片

        (全局快門相機在拍攝高速運動的物體仍是清晰的,圖片來自網絡)

        運動過快的另一個結果就是兩個圖像的重疊區(Overlap)不夠,導致沒法匹配上特征。所以視覺SLAM中都會選用廣角、魚眼、全景相機,或者干脆多放幾個相機。

        2.2 相機視野不夠

        如前所述,視野不夠可能導致算法易丟失。畢竟特征匹配的前提是圖像間真的存在共有的特征。

        2.3 計算量太大

        基于特征點的SLAM大部分時間會花在特征提取和匹配上,所以把這部分代碼寫得非常高效是很有幫助的。這里就有很多奇技淫巧可以用了,比如選擇一些容易計算的特征/并行化/利用指令集/放到硬件上計算等等,當然最直接的就是減少特征點啦。這部分很需要工程上的測試和經驗。總而言之特征點的計算仍然是主要瓶頸所在。要是哪天相機直接輸出特征點就更好了。

        2.4 遮擋

        相機可能運動到一個墻角,還存在一些邪惡的開發者刻意地用手去擋住你的相機。他們認為你的視覺SLAM即使不靠圖像也能順利地工作。這些觀念是毫無道理的,所以直接無視他們即可。

        2.5 特征缺失、動態光源和人物的干擾

        老實說SLAM應用還沒有走到這一步,這些多數是研究論文關心的話題(比如直接法)。現在AR能夠穩定地在室內運行就已經很了不起了。

        ---------------我是分割線-----------------

        1. 可能的解決思路

        前邊總結了一些單目視覺可能碰到的困難。我們發現大部分問題并不能在當下的視覺方案能夠解決的。你或許可以通過一些工程技巧加速特征匹配的過程,但像尺度、遮擋之類的問題,明顯無法通過設計軟件來解決。

        所以怎么辦呢?——既然視覺解決不了,那就靠別的來解決吧。畢竟一臺設備上又不是只有一塊單目相機。更常見的方案是,用視覺+IMU的方式做SLAM。

        當前廣角單目+IMU被認為是一種很好的解決方案。它價格比較低廉,IMU能在以下幾點很好地幫助視覺SLAM:

        • IMU能幫單目確定尺度
        • IMU能測量快速的運動
        • IMU在相機被遮擋時亦能提供短時間的位姿估計

        所以不管在理論還是應用上,都出現了一些單目+IMU的方案[2,3,4]。眾所周知的Tango和Hololens亦是IMU+單目/多目的定位方式。

        圖片

        (用Tango玩MC,缺點是蓋的房子尺寸和真實世界一樣。蓋二樓你就得真跑到樓上去蓋——這怎么造圓明園?)

        圖片

        (這貨就是靠后邊這魚眼+IMU做跟蹤的)

        (Hololens圖就不上了吧……橫豎也不是自己的)

        [1]. Strasdat, Montiel, A.J.Davison, Scale drift-aware large scale monocular SLAM, RSS 2006.

        [2]. Leutenegger et. al., Keyframe-based visual-inertial odometry using nonlinear optimization, IJRR 2015.

        [3]. Huang Guoquan, Kaess and Leonard, Towards Consistent Visual-Inertial Navigation, ICRA 2014.

        [4]. Li Mingyang and Mourikis, High-precision, consistent EKF-based visual-inertial odometry, IJRR, 2013.


        *博客內容為網友個人發布,僅代表博主個人觀點,如有侵權請聯系工作人員刪除。



        關鍵詞: AI

        相關推薦

        技術專區

        關閉
        主站蜘蛛池模板: 武威市| 烟台市| 东乡| 安康市| 伊川县| 蒲江县| 临潭县| 镇赉县| 射洪县| 潞西市| 高唐县| 彝良县| 开远市| 凉山| 宽城| 隆子县| 轮台县| 昆明市| 金塔县| 汶川县| 独山县| 余江县| 永济市| 桃园县| 贵州省| 新宁县| 安溪县| 庄浪县| 淮北市| 阿拉善右旗| 保山市| 抚州市| 太白县| 宿迁市| 拉萨市| 神池县| 库伦旗| 南丰县| 平乐县| 荆州市| 青铜峡市|