博客專欄

        EEPW首頁 > 博客 > 單目3D目標(biāo)檢測(cè)之入門(2)

        單目3D目標(biāo)檢測(cè)之入門(2)

        發(fā)布人:計(jì)算機(jī)視覺工坊 時(shí)間:2023-08-20 來源:工程師 發(fā)布文章

        3.發(fā)展情況


        Kitti的3D目標(biāo)檢測(cè)排行中,Car類第一的為SFD,Moderate中達(dá)到了84.76%,但是Setting中沒有激光點(diǎn)云的符號(hào)。排第7的BtcDet使用了該符號(hào),所示直接處理點(diǎn)云的方法至少達(dá)到了82%多的AP。


        圖片


        點(diǎn)云和圖像融合的方法,在Car類的Easy和Moderate類中的AP,其實(shí)跟直接處理點(diǎn)云方法的AP差別不是很明顯。


        雙目或者說是立體視覺3D目標(biāo)檢測(cè)的方法的AP大概在53%左右。


        單目3D目標(biāo)檢測(cè)的AP在16%多吧。


        圖片


        (更新時(shí)間,2021年11月12日)


        如果要查找更加詳細(xì)的論文和模型精度、建議直接看KITTI關(guān)于3D目標(biāo)檢測(cè)的榜單:The KITTI Vision Benchmark Suite (cvlibs.net)


        圖片


        這里還有一個(gè)純單目3D目標(biāo)檢測(cè)的榜單(包含代碼和論文):


        圖片


        4. 為什么要做單目的3D目標(biāo)檢測(cè)?


        為何最近單目3D目標(biāo)檢測(cè)也成為了一個(gè)小熱點(diǎn)領(lǐng)域?起因可能是因?yàn)椋?/span>


        • 偽激光雷達(dá)技術(shù)的提出(pseudo-LiDAR),利用圖像模擬出雷達(dá)點(diǎn)云圖像;


        • 單目深度估計(jì)的逐漸發(fā)展;


        • 純點(diǎn)云,圖像2D,多傳感器融合檢測(cè)的研究逐漸成熟,或者說快要達(dá)到天花板了。


        從傳感這個(gè)角度來說,


        主動(dòng)獲取深度信息:如激光雷達(dá)、RGB-D相機(jī)


        • 價(jià)格昂貴,有效的距離小,并且線數(shù)再多的激光雷達(dá)獲取的點(diǎn)云也是稀疏的,缺乏紋理信息的。況且激光雷達(dá)貴,一輛自動(dòng)駕駛汽車裝幾個(gè)激光雷達(dá)、后期怎么維護(hù)保養(yǎng),工業(yè)界最看重的是成本問題!!


        再說說雙目相機(jī):


        • 誤差較大,要求時(shí)間同步,體積較大(基線安裝有要求,如果壞了一個(gè),那就等于報(bào)廢)


        再說說單目相機(jī):


        • 價(jià)格親民


        • 體積小,功耗低;


        • 貼近實(shí)際應(yīng)用需求。


        并且,單目3D目標(biāo)檢測(cè)也不一定只能用于自動(dòng)駕駛呀!只要設(shè)備上有攝像頭,有3D檢測(cè)的任務(wù)。


        這里推薦大家一個(gè)單目深度估計(jì)的小應(yīng)用場(chǎng)景:https://roxanneluo.github.io/Consistent-Video-Depth-Estimation/;單目3D檢測(cè)最重要的一環(huán)就是單目深度估計(jì),而單目深度估計(jì)在AR領(lǐng)域是廣泛應(yīng)用滴。


        比如AR虛擬試衣間,或者京東淘寶上的一些AR試鞋,你拿手機(jī)攝像頭對(duì)著自己腳,鞋自動(dòng)覆蓋到你腳上,這一塊用到的應(yīng)該是目標(biāo)檢測(cè)或者語義分割吧。



        二、應(yīng)用場(chǎng)景


        推薦點(diǎn)擊在線試鞋,體驗(yàn)一下AR技術(shù)吧。


        單目3D目標(biāo)檢測(cè)的具體應(yīng)用。我隨后會(huì)單獨(dú)整理在一篇博客中。



        三、相關(guān)論文


        3D目標(biāo)檢測(cè)綜述:


        • Deep Learning for 3D Point Clouds: A Survey----2020年


        • 3D Object Detection for Autonomous Driving: A Survey—2021年


        更多的文獻(xiàn)可查看知乎上的這篇文章:?jiǎn)文?D視覺目標(biāo)檢測(cè)論文總結(jié) - 知乎 (zhihu.com),總結(jié)了100多篇單目3D目標(biāo)檢測(cè)領(lǐng)域的文章。


        本專欄下,我將會(huì)持續(xù)不斷的更新我讀的一些論文和代碼運(yùn)行工作。


        1. CaDDN:論文閱讀??代碼調(diào)試



        四、相關(guān)數(shù)據(jù)集


        這里只列出比較常用的幾個(gè)數(shù)據(jù)集的名字。數(shù)據(jù)集的詳細(xì)說明在這篇博客中。


        • KITTI Dataset


        • Waymo Open


        • NuScenes Dataset


        • Cityscapes


        • Lyft L5


        • H3D


        • Applloscape


        • Argoverse


        圖片



        五、自動(dòng)駕駛領(lǐng)域的相關(guān)企業(yè)


        百度華為地平線,小鵬蔚來特斯拉。還挺押韻滴!


        國(guó)外:Waymo、Cruise、Nuro、Argo;


        國(guó)內(nèi):百度、華為、AutoX、圖森未來、Pony(小馬智行)、Weride(文遠(yuǎn)知行)、Didi(滴滴)、Momenta、縱目科技、智加科技、小鵬、蔚來、理想、嬴徹科技、魔視智能。


        每個(gè)公司詳細(xì)介紹:


        國(guó)內(nèi):百度、華為、AutoX、圖森未來、Pony(小馬智行)、Weride(文遠(yuǎn)知行)、Didi(滴滴)、Momenta、縱目科技、智加科技、小鵬、蔚來、理想、嬴徹科技、魔視智能。


        每個(gè)公司詳細(xì)介紹,我將單獨(dú)整理在一篇博客中,包括公司的背景、薪資情況、主要發(fā)展方向。


        版權(quán)聲明:本文為CSDN博主「hello689」的原創(chuàng)文章,遵循CC 4.0 BY-SA版權(quán)協(xié)議,轉(zhuǎn)載請(qǐng)附上原文出處鏈接及本聲明。

        原文鏈接:

        https://blog.csdn.net/jiachang98/article/details/121432839


        *博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。



        關(guān)鍵詞: AI

        相關(guān)推薦

        技術(shù)專區(qū)

        關(guān)閉
        主站蜘蛛池模板: 闽清县| 绍兴县| 会理县| 吉水县| 海安县| 若羌县| 永福县| 忻州市| 浪卡子县| 蚌埠市| 安多县| 丽江市| 克山县| 连城县| 句容市| 文成县| 龙岩市| 新绛县| 岳普湖县| 周至县| 淮阳县| 满洲里市| 五家渠市| 双江| 罗定市| 施甸县| 饶阳县| 兴业县| 黔南| 钟祥市| 伽师县| 鸡西市| 兴宁市| 乐东| 永康市| 霍邱县| 定陶县| 广南县| 文山县| 册亨县| 若尔盖县|