博客專欄

        EEPW首頁(yè) > 博客 > 3D實(shí)例分割

        3D實(shí)例分割

        發(fā)布人:SIGAI 時(shí)間:2020-09-27 來(lái)源:工程師 發(fā)布文章

        3D實(shí)例分割

        3D語(yǔ)義分割區(qū)分場(chǎng)景中各類對(duì)象,3D實(shí)例分割區(qū)分場(chǎng)景中各類別中的各種個(gè)體。近兩年來(lái),3D實(shí)例分割的關(guān)注度越來(lái)越高,相應(yīng)的方法也被接連提出。眾多方法的思想主要分為兩類:基于候選區(qū)域的實(shí)例分割(proposal-based)和免候選區(qū)域的實(shí)例分割(proposal-free)。其中,proposal-based先獲取場(chǎng)景中的感興趣的候選區(qū)域,如:3D bounding boxes等,并在候選區(qū)域內(nèi)對(duì)3D數(shù)據(jù)進(jìn)一步預(yù)測(cè)得到實(shí)例標(biāo)簽。考慮到proposal-based 實(shí)例分割通常需要2個(gè)過(guò)程(先得到候選區(qū)域,再實(shí)例分割),分割過(guò)程繁瑣,則proposal-free則摒棄了基于候選區(qū)域的方式,直接通過(guò)數(shù)據(jù)特征或者結(jié)合語(yǔ)義分割結(jié)果,得到實(shí)例分割結(jié)果。下面根據(jù)這兩個(gè)方向總結(jié)現(xiàn)有的實(shí)例分割方法。

        (一)   proposal-based

        [1] GSPN: Generative Shape Proposal Network for 3D Instance Segmentation in Point Cloud _ Li Yi

        1.jpg

        本文思路:

        先通過(guò)GSPN得到目標(biāo)候選區(qū)域(object proposal),在利用R-PointNet 細(xì)化proposal得到實(shí)例分割結(jié)果。

        創(chuàng)新點(diǎn):

        GSP&R-PointNet

        介紹:

        一種得到候選區(qū)域的辦法就是簡(jiǎn)單估計(jì)物體的近似幾何形狀,比如3D bounding boxes,但是bounding boxes不太需要對(duì)底層對(duì)象的幾何結(jié)構(gòu)有很強(qiáng)的的理解,這可能導(dǎo)致boxes中包含了多物體或者單個(gè)物體的部分,本文采用analysis-by-synthesis策略,從含有噪音的場(chǎng)景中重建出外形得到 object proposals。另外,R-PointNet很像2D圖像領(lǐng)域的Mask-RCNN,包含了候選區(qū)域提取和候選區(qū)域分類, R-PointNet能直接處理點(diǎn)云數(shù)據(jù)并給予目標(biāo)候選區(qū)域得到實(shí)例標(biāo)簽。

        [2] SGPN: Similarity Group Proposal Network for 3D Point Cloud Instance Segmentation _ Weiyue Wang

        2.jpg

        本文思路:

        通過(guò)計(jì)算點(diǎn)云的相似矩陣(similarity matrix)和對(duì)應(yīng)的置信值(confidence map)得到候選區(qū)域(group proposals),并結(jié)合語(yǔ)義分割結(jié)果得到實(shí)例標(biāo)簽

        創(chuàng)新點(diǎn):

        新的候選區(qū)域方法(similarity matrix + confidence map)

        介紹:

        本網(wǎng)絡(luò)利用PointNet/PointNet++來(lái)提取點(diǎn)云的特征,然后在這些點(diǎn)云特征上操作分類,后端有三個(gè)模塊:similarity matrix, confidence map 和sematic map,三者的作用不用。其中,similarity matrix 的作用是計(jì)算group proposals 直接獲取精確的實(shí)例分割結(jié)果,confidence map即置信區(qū)間,加入置信值,起到優(yōu)化的作用;semantic map 的作用是充當(dāng)逐點(diǎn)分類器的作用。

        [3] 3D-SIS: 3D Semantic Instance Segmentation of RGB-D Scans _ Ji Hou

        3.jpg

        本文思路:

        先目標(biāo)檢測(cè)得到proposal,再在propoasl中mask prediction得到實(shí)例分割結(jié)果

        創(chuàng)新點(diǎn):

        結(jié)合了2D和3D數(shù)據(jù)的特征,框架新穎。

        介紹:本文思想比較簡(jiǎn)單。通過(guò)神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)RGB和點(diǎn)云特征(這里的點(diǎn)云是通過(guò)RGBD中的深度信息恢復(fù)得到,并不是雷達(dá)點(diǎn)云),將通過(guò)2D卷積網(wǎng)絡(luò)提取得到2D特征,反投影到對(duì)應(yīng)的3D場(chǎng)景網(wǎng)格上,2D和3D特征的融合能夠很大程度上提高proposal 獲取的精度。在proposal中進(jìn)一步預(yù)測(cè)得到實(shí)例標(biāo)簽。

        [4] Learning Object Bounding Boxes for 3D Instance Segmentation on Point Clouds _ Bo Yang

        5.jpg

        本文思路:

        先獲bounding box,再mask prediction

        創(chuàng)新點(diǎn):

        計(jì)算效率高

        介紹:

        本文提出了3D-BoNet網(wǎng)絡(luò),遵循了逐點(diǎn)的多層感知機(jī)的簡(jiǎn)單基本原理,該網(wǎng)絡(luò)對(duì)所有實(shí)例個(gè)體進(jìn)行3D bounding box的回歸, 同時(shí)對(duì)每個(gè)實(shí)例個(gè)體的點(diǎn)云進(jìn)行逐點(diǎn)mask預(yù)測(cè)。本網(wǎng)絡(luò)包括兩個(gè)并行的網(wǎng)絡(luò),1)邊界框回歸和2)點(diǎn)云mask預(yù)測(cè)。亮點(diǎn)就是計(jì)算效率高,不需要任何的后處理過(guò)程。(這個(gè)論文思想就是站在巨人肩膀上,利用現(xiàn)有網(wǎng)絡(luò)得到全局和局部特征,后續(xù)的的proposal和prediction就很簡(jiǎn)單了)

        (二)   proposal-free

        [1] 3D Instance Segmentation via Multi-task Metric Learning_Jean Lahoud

        6.jpg

        本文思路:

        直接獲得數(shù)據(jù)的特征,直接實(shí)例分割

        創(chuàng)新點(diǎn):

        一種可獲取數(shù)據(jù)的兩種主要特征的算法

        介紹: 

        不像傳統(tǒng)的實(shí)例分割方法的思想:用語(yǔ)義標(biāo)簽提升實(shí)例標(biāo)簽。本文的技術(shù)通過(guò)聚類方法專注于實(shí)例標(biāo)簽。本網(wǎng)絡(luò)將語(yǔ)義信息作為局部線索從中獲得便利,另外將3D維度信息和3D聯(lián)系納入其中。本文的亮點(diǎn)在于提出了一種算法,該算法可以直接處理3D網(wǎng)格并學(xué)習(xí)得到兩類主要的特征:針對(duì)每一個(gè)實(shí)例對(duì)象的獨(dú)有的特征描述;指向?qū)嵗龑?duì)象中心的方向。(基于SSCNet這個(gè)網(wǎng)絡(luò)框架改進(jìn)的,大家可以重點(diǎn)關(guān)注一下這個(gè)網(wǎng)路,在ScanNet數(shù)據(jù)集中,SSCNet網(wǎng)路的語(yǔ)義分割結(jié)果評(píng)比第二)

        [2] Associatively Segmenting Instances and Semantics in Point Clouds_xinlong wang

        7.jpg

        本文思路:

        通過(guò)實(shí)例分割和語(yǔ)義分割相互提升分割精度

        創(chuàng)新點(diǎn):

        ASIS

        介紹: 

        實(shí)際情況下,實(shí)例分割和語(yǔ)義分割的目的是不同的,前者在同一類中精確區(qū)分不同的個(gè)體,后者是將它們賦予同一個(gè)標(biāo)簽。然而,兩種任務(wù)之間是可以相互合作共贏的,語(yǔ)義分割將點(diǎn)云按不同類別區(qū)分,這僅僅是實(shí)例分割的一個(gè)目標(biāo)(不同類別的點(diǎn)云一定屬于不同個(gè)體的)。實(shí)例分割對(duì)同一實(shí)例個(gè)體賦予同一標(biāo)簽,這與語(yǔ)義分割是保持一致的(同一個(gè)體的點(diǎn)云一定屬于同一類別)。本文利用這層關(guān)系實(shí)現(xiàn)兩種任務(wù)的共贏。并設(shè)計(jì)了ASIS模塊,實(shí)現(xiàn)精度的相互提升。

        [3] JSIS3D: Joint Semantic-Instance Segmentation of 3D Point Clouds with Multi-Task Pointwise Networks and Multi-Value Conditional Random Fields_Quang Hieu Pham

        8.jpg

        本文思路:

        通過(guò)網(wǎng)絡(luò)獲取語(yǔ)義標(biāo)簽和實(shí)例標(biāo)簽,通過(guò)后續(xù)優(yōu)化融合兩種標(biāo)簽,達(dá)到共贏(和上文的不同在于,一個(gè)在前端融合,一個(gè)在后端融合)

        創(chuàng)新點(diǎn):

        MT-PNet+MV-CRF

        介紹: 

        本文提出了一種多任務(wù)逐點(diǎn)處理的網(wǎng)絡(luò),同時(shí)實(shí)現(xiàn)兩種任務(wù):預(yù)測(cè)點(diǎn)云的語(yǔ)義類別;將點(diǎn)云轉(zhuǎn)換為高維向量,致使相同實(shí)例的點(diǎn)云有著近似的表達(dá)。另外,本文提出了多值條件隨機(jī)場(chǎng)去協(xié)調(diào)語(yǔ)義和實(shí)例標(biāo)簽。(語(yǔ)義分割和實(shí)例分割,這兩個(gè)問(wèn)題通常被單獨(dú)處理,實(shí)例分割是語(yǔ)義分割的后續(xù)處理步驟,然而,兩者之間是相互作用的,對(duì)于實(shí)例分割,實(shí)例的外形和容貌特征提取有助于區(qū)分物體種類,另一方面,不同類別的點(diǎn)云是不可能屬于同一個(gè)實(shí)例的。這篇文章和上面有一篇論文很像。)

        [4] MASC: Multi-scale affinity with Sparse Convolution for 3D Instance Segmentation Technical Report_Chen Liu

        1.png

        本文思路:

        基于語(yǔ)義分割結(jié)果,實(shí)現(xiàn)實(shí)例分割

        創(chuàng)新點(diǎn):

        多尺度的數(shù)據(jù)的關(guān)聯(lián)性預(yù)測(cè)

        介紹: 

        文章利用U-Net和submanifold sparse convolutions卷積處理整個(gè)室內(nèi)場(chǎng)景點(diǎn)云,對(duì)每個(gè)點(diǎn)類別預(yù)測(cè)(語(yǔ)義分割)。另外,對(duì)不同尺度下相鄰體素之間的關(guān)聯(lián)性預(yù)測(cè),結(jié)合語(yǔ)義標(biāo)簽,利用簡(jiǎn)單而有效的聚類算法得到點(diǎn)云的實(shí)例標(biāo)簽。

        [5]3d graph embedding learning with a structure-aware loss function for point cloud semantic instance segmentation_Zhidong Liang

        2.png

        本文思路:

        語(yǔ)義分割和實(shí)例分割結(jié)合

        創(chuàng)新點(diǎn):

        新穎的損失函數(shù)

        介紹:

        利用SSCNet得到語(yǔ)義標(biāo)簽和實(shí)例標(biāo)簽,并在該網(wǎng)絡(luò)后增加GCN網(wǎng)絡(luò),對(duì)實(shí)例分割結(jié)果細(xì)化。

        [6]3D Bird’s-Eye-View Instance Segmentation_Cathrin Elich

        11.jpg

        本文思路:

        語(yǔ)義分割和實(shí)例分割結(jié)合

        創(chuàng)新點(diǎn):

        2D和3D結(jié)合

        介紹: 

        本文的有點(diǎn)在于展現(xiàn)了2D和3D結(jié)合的網(wǎng)絡(luò)框架用于聯(lián)合語(yǔ)義和實(shí)例分割;同時(shí)展現(xiàn)了如何實(shí)現(xiàn)規(guī)則的2D特征和不規(guī)則的3D點(diǎn)云特征的融合。

        注:補(bǔ)充網(wǎng)絡(luò)(來(lái)源于ScanNet)

        Occipital-SCS:

        DPC-instance

        Seg-cluster

        MaskRCNN proj.

        參考文獻(xiàn)

        Proposal-based

        [1] Yi L , Zhao W , Wang H , et al. GSPN: Generative Shape Proposal Network for 3D Instance Segmentation in Point Cloud[J]. 2018.

        [2] Wang W , Yu R , Huang Q , et al. SGPN: Similarity Group Proposal Network for 3D Point Cloud Instance Segmentation[J]. 2017.

        [3] Hou J , Dai A , Nie?ner, Matthias. 3D-SIS: 3D Semantic Instance Segmentation of RGB-D Scans[J]. 2018.

        [4] Yang B , Wang J , Clark R , et al. Learning Object Bounding Boxes for 3D Instance Segmentation on Point Clouds[J]. 2019.

        Proposal-free

        [1] Lahoud J , Ghanem B , Pollefeys M , R.Oswald M. 3D Instance Segmentation via Multi-task Metric Learning[J]. 2019.

        [2] Wang X , Liu S , Shen X , et al. Associatively Segmenting Instances and Semantics in Point Clouds[J]. 2019.

        [3] Pham Q H , Nguyen D T , Hua B S , et al. JSIS3D: Joint Semantic-Instance Segmentation of 3D Point Clouds with Multi-Task Pointwise Networks and Multi-Value Conditional Random Fields[J]. 2019.

        [4] Liu C , Furukawa Y . MASC: Multi-scale Affinity with Sparse Convolution for 3D Instance Segmentation[J]. 2019.

        [5] Liang Z , Yang M , Wang C . 3D Graph Embedding Learning with a Structure-aware Loss Function for Point Cloud Semantic Instance Segmentation[J]. 2019.

        [6] Elich C , Engelmann F , Kontogianni T , Leibe B. 3D-BEVIS: Bird's-Eye-View Instance Segmentation[J]. 2019

        *博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。

        電容的相關(guān)文章:電容屏和電阻屏的區(qū)別




        關(guān)鍵詞:

        相關(guān)推薦

        技術(shù)專區(qū)

        關(guān)閉
        主站蜘蛛池模板: 马山县| 安多县| 综艺| 温州市| 清流县| 建宁县| 阿拉尔市| 夏河县| 竹山县| 平昌县| 天柱县| 吐鲁番市| 新巴尔虎右旗| 长乐市| 闸北区| 济南市| 唐河县| 平度市| 永城市| 宿迁市| 方正县| 阿瓦提县| 重庆市| 咸丰县| 宁波市| 盐池县| 湘乡市| 十堰市| 涞源县| 通海县| 长子县| 清涧县| 哈尔滨市| 改则县| 运城市| 上杭县| 利津县| 驻马店市| 南安市| 宜都市| 林州市|