博客專欄

3D實(shí)例分割

發(fā)布人：SIGAI 時(shí)間：2020-09-27 來(lái)源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

3D實(shí)例分割

3D語(yǔ)義分割區(qū)分場(chǎng)景中各類對(duì)象，3D實(shí)例分割區(qū)分場(chǎng)景中各類別中的各種個(gè)體。近兩年來(lái)，3D實(shí)例分割的關(guān)注度越來(lái)越高，相應(yīng)的方法也被接連提出。眾多方法的思想主要分為兩類：基于候選區(qū)域的實(shí)例分割（proposal-based）和免候選區(qū)域的實(shí)例分割（proposal-free）。其中，proposal-based先獲取場(chǎng)景中的感興趣的候選區(qū)域，如：3D bounding boxes等，并在候選區(qū)域內(nèi)對(duì)3D數(shù)據(jù)進(jìn)一步預(yù)測(cè)得到實(shí)例標(biāo)簽。考慮到proposal-based 實(shí)例分割通常需要2個(gè)過(guò)程（先得到候選區(qū)域，再實(shí)例分割），分割過(guò)程繁瑣，則proposal-free則摒棄了基于候選區(qū)域的方式，直接通過(guò)數(shù)據(jù)特征或者結(jié)合語(yǔ)義分割結(jié)果，得到實(shí)例分割結(jié)果。下面根據(jù)這兩個(gè)方向總結(jié)現(xiàn)有的實(shí)例分割方法。

（一） proposal-based

[1] GSPN: Generative Shape Proposal Network for 3D Instance Segmentation in Point Cloud _ Li Yi

本文思路：

先通過(guò)GSPN得到目標(biāo)候選區(qū)域（object proposal），在利用R-PointNet 細(xì)化proposal得到實(shí)例分割結(jié)果。

創(chuàng)新點(diǎn)：

GSP&R-PointNet

介紹：

一種得到候選區(qū)域的辦法就是簡(jiǎn)單估計(jì)物體的近似幾何形狀，比如3D bounding boxes，但是bounding boxes不太需要對(duì)底層對(duì)象的幾何結(jié)構(gòu)有很強(qiáng)的的理解，這可能導(dǎo)致boxes中包含了多物體或者單個(gè)物體的部分，本文采用analysis-by-synthesis策略，從含有噪音的場(chǎng)景中重建出外形得到 object proposals。另外，R-PointNet很像2D圖像領(lǐng)域的Mask-RCNN，包含了候選區(qū)域提取和候選區(qū)域分類， R-PointNet能直接處理點(diǎn)云數(shù)據(jù)并給予目標(biāo)候選區(qū)域得到實(shí)例標(biāo)簽。

[2] SGPN: Similarity Group Proposal Network for 3D Point Cloud Instance Segmentation _ Weiyue Wang

本文思路：

通過(guò)計(jì)算點(diǎn)云的相似矩陣（similarity matrix）和對(duì)應(yīng)的置信值（confidence map）得到候選區(qū)域（group proposals），并結(jié)合語(yǔ)義分割結(jié)果得到實(shí)例標(biāo)簽

創(chuàng)新點(diǎn)：

新的候選區(qū)域方法（similarity matrix + confidence map）

介紹：

本網(wǎng)絡(luò)利用PointNet/PointNet++來(lái)提取點(diǎn)云的特征，然后在這些點(diǎn)云特征上操作分類，后端有三個(gè)模塊：similarity matrix， confidence map 和sematic map，三者的作用不用。其中，similarity matrix 的作用是計(jì)算group proposals 直接獲取精確的實(shí)例分割結(jié)果，confidence map即置信區(qū)間，加入置信值，起到優(yōu)化的作用；semantic map 的作用是充當(dāng)逐點(diǎn)分類器的作用。

[3] 3D-SIS: 3D Semantic Instance Segmentation of RGB-D Scans _ Ji Hou

本文思路：

先目標(biāo)檢測(cè)得到proposal，再在propoasl中mask prediction得到實(shí)例分割結(jié)果

創(chuàng)新點(diǎn)：

結(jié)合了2D和3D數(shù)據(jù)的特征，框架新穎。

介紹：本文思想比較簡(jiǎn)單。通過(guò)神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)RGB和點(diǎn)云特征（這里的點(diǎn)云是通過(guò)RGBD中的深度信息恢復(fù)得到，并不是雷達(dá)點(diǎn)云），將通過(guò)2D卷積網(wǎng)絡(luò)提取得到2D特征，反投影到對(duì)應(yīng)的3D場(chǎng)景網(wǎng)格上，2D和3D特征的融合能夠很大程度上提高proposal 獲取的精度。在proposal中進(jìn)一步預(yù)測(cè)得到實(shí)例標(biāo)簽。

[4] Learning Object Bounding Boxes for 3D Instance Segmentation on Point Clouds _ Bo Yang

本文思路：

先獲bounding box，再mask prediction

創(chuàng)新點(diǎn)：

計(jì)算效率高

介紹:

本文提出了3D-BoNet網(wǎng)絡(luò)，遵循了逐點(diǎn)的多層感知機(jī)的簡(jiǎn)單基本原理，該網(wǎng)絡(luò)對(duì)所有實(shí)例個(gè)體進(jìn)行3D bounding box的回歸，同時(shí)對(duì)每個(gè)實(shí)例個(gè)體的點(diǎn)云進(jìn)行逐點(diǎn)mask預(yù)測(cè)。本網(wǎng)絡(luò)包括兩個(gè)并行的網(wǎng)絡(luò)，1）邊界框回歸和2）點(diǎn)云mask預(yù)測(cè)。亮點(diǎn)就是計(jì)算效率高，不需要任何的后處理過(guò)程。（這個(gè)論文思想就是站在巨人肩膀上，利用現(xiàn)有網(wǎng)絡(luò)得到全局和局部特征，后續(xù)的的proposal和prediction就很簡(jiǎn)單了）

（二） proposal-free

[1] 3D Instance Segmentation via Multi-task Metric Learning_Jean Lahoud

本文思路：

直接獲得數(shù)據(jù)的特征，直接實(shí)例分割

創(chuàng)新點(diǎn)：

一種可獲取數(shù)據(jù)的兩種主要特征的算法

介紹:

不像傳統(tǒng)的實(shí)例分割方法的思想：用語(yǔ)義標(biāo)簽提升實(shí)例標(biāo)簽。本文的技術(shù)通過(guò)聚類方法專注于實(shí)例標(biāo)簽。本網(wǎng)絡(luò)將語(yǔ)義信息作為局部線索從中獲得便利，另外將3D維度信息和3D聯(lián)系納入其中。本文的亮點(diǎn)在于提出了一種算法，該算法可以直接處理3D網(wǎng)格并學(xué)習(xí)得到兩類主要的特征：針對(duì)每一個(gè)實(shí)例對(duì)象的獨(dú)有的特征描述；指向?qū)嵗龑?duì)象中心的方向。（基于SSCNet這個(gè)網(wǎng)絡(luò)框架改進(jìn)的，大家可以重點(diǎn)關(guān)注一下這個(gè)網(wǎng)路，在ScanNet數(shù)據(jù)集中，SSCNet網(wǎng)路的語(yǔ)義分割結(jié)果評(píng)比第二）

[2] Associatively Segmenting Instances and Semantics in Point Clouds_xinlong wang

本文思路：

通過(guò)實(shí)例分割和語(yǔ)義分割相互提升分割精度

創(chuàng)新點(diǎn)：

ASIS

介紹:

實(shí)際情況下，實(shí)例分割和語(yǔ)義分割的目的是不同的，前者在同一類中精確區(qū)分不同的個(gè)體，后者是將它們賦予同一個(gè)標(biāo)簽。然而，兩種任務(wù)之間是可以相互合作共贏的，語(yǔ)義分割將點(diǎn)云按不同類別區(qū)分，這僅僅是實(shí)例分割的一個(gè)目標(biāo)（不同類別的點(diǎn)云一定屬于不同個(gè)體的）。實(shí)例分割對(duì)同一實(shí)例個(gè)體賦予同一標(biāo)簽，這與語(yǔ)義分割是保持一致的（同一個(gè)體的點(diǎn)云一定屬于同一類別）。本文利用這層關(guān)系實(shí)現(xiàn)兩種任務(wù)的共贏。并設(shè)計(jì)了ASIS模塊，實(shí)現(xiàn)精度的相互提升。

[3] JSIS3D: Joint Semantic-Instance Segmentation of 3D Point Clouds with Multi-Task Pointwise Networks and Multi-Value Conditional Random Fields_Quang Hieu Pham

本文思路：

通過(guò)網(wǎng)絡(luò)獲取語(yǔ)義標(biāo)簽和實(shí)例標(biāo)簽，通過(guò)后續(xù)優(yōu)化融合兩種標(biāo)簽，達(dá)到共贏（和上文的不同在于，一個(gè)在前端融合，一個(gè)在后端融合）

創(chuàng)新點(diǎn)：

MT-PNet+MV-CRF

介紹:

本文提出了一種多任務(wù)逐點(diǎn)處理的網(wǎng)絡(luò)，同時(shí)實(shí)現(xiàn)兩種任務(wù)：預(yù)測(cè)點(diǎn)云的語(yǔ)義類別；將點(diǎn)云轉(zhuǎn)換為高維向量，致使相同實(shí)例的點(diǎn)云有著近似的表達(dá)。另外，本文提出了多值條件隨機(jī)場(chǎng)去協(xié)調(diào)語(yǔ)義和實(shí)例標(biāo)簽。（語(yǔ)義分割和實(shí)例分割，這兩個(gè)問(wèn)題通常被單獨(dú)處理，實(shí)例分割是語(yǔ)義分割的后續(xù)處理步驟，然而，兩者之間是相互作用的，對(duì)于實(shí)例分割，實(shí)例的外形和容貌特征提取有助于區(qū)分物體種類，另一方面，不同類別的點(diǎn)云是不可能屬于同一個(gè)實(shí)例的。這篇文章和上面有一篇論文很像。）

[4] MASC: Multi-scale affinity with Sparse Convolution for 3D Instance Segmentation Technical Report_Chen Liu

本文思路：

基于語(yǔ)義分割結(jié)果，實(shí)現(xiàn)實(shí)例分割

創(chuàng)新點(diǎn)：

多尺度的數(shù)據(jù)的關(guān)聯(lián)性預(yù)測(cè)

介紹:

文章利用U-Net和submanifold sparse convolutions卷積處理整個(gè)室內(nèi)場(chǎng)景點(diǎn)云，對(duì)每個(gè)點(diǎn)類別預(yù)測(cè)（語(yǔ)義分割）。另外，對(duì)不同尺度下相鄰體素之間的關(guān)聯(lián)性預(yù)測(cè)，結(jié)合語(yǔ)義標(biāo)簽，利用簡(jiǎn)單而有效的聚類算法得到點(diǎn)云的實(shí)例標(biāo)簽。

[5]3d graph embedding learning with a structure-aware loss function for point cloud semantic instance segmentation_Zhidong Liang

本文思路：

語(yǔ)義分割和實(shí)例分割結(jié)合

創(chuàng)新點(diǎn)：

新穎的損失函數(shù)

介紹:

利用SSCNet得到語(yǔ)義標(biāo)簽和實(shí)例標(biāo)簽，并在該網(wǎng)絡(luò)后增加GCN網(wǎng)絡(luò)，對(duì)實(shí)例分割結(jié)果細(xì)化。

[6]3D Bird’s-Eye-View Instance Segmentation_Cathrin Elich

本文思路：

語(yǔ)義分割和實(shí)例分割結(jié)合

創(chuàng)新點(diǎn)：

2D和3D結(jié)合

介紹:

本文的有點(diǎn)在于展現(xiàn)了2D和3D結(jié)合的網(wǎng)絡(luò)框架用于聯(lián)合語(yǔ)義和實(shí)例分割；同時(shí)展現(xiàn)了如何實(shí)現(xiàn)規(guī)則的2D特征和不規(guī)則的3D點(diǎn)云特征的融合。

注：補(bǔ)充網(wǎng)絡(luò)（來(lái)源于ScanNet）

Occipital-SCS:

DPC-instance

Seg-cluster

MaskRCNN proj.

參考文獻(xiàn)

Proposal-based

[1] Yi L , Zhao W , Wang H , et al. GSPN: Generative Shape Proposal Network for 3D Instance Segmentation in Point Cloud[J]. 2018.

[2] Wang W , Yu R , Huang Q , et al. SGPN: Similarity Group Proposal Network for 3D Point Cloud Instance Segmentation[J]. 2017.

[3] Hou J , Dai A , Nie?ner, Matthias. 3D-SIS: 3D Semantic Instance Segmentation of RGB-D Scans[J]. 2018.

[4] Yang B , Wang J , Clark R , et al. Learning Object Bounding Boxes for 3D Instance Segmentation on Point Clouds[J]. 2019.

Proposal-free

[1] Lahoud J , Ghanem B , Pollefeys M , R.Oswald M. 3D Instance Segmentation via Multi-task Metric Learning[J]. 2019.

[2] Wang X , Liu S , Shen X , et al. Associatively Segmenting Instances and Semantics in Point Clouds[J]. 2019.

[3] Pham Q H , Nguyen D T , Hua B S , et al. JSIS3D: Joint Semantic-Instance Segmentation of 3D Point Clouds with Multi-Task Pointwise Networks and Multi-Value Conditional Random Fields[J]. 2019.

[4] Liu C , Furukawa Y . MASC: Multi-scale Affinity with Sparse Convolution for 3D Instance Segmentation[J]. 2019.

[5] Liang Z , Yang M , Wang C . 3D Graph Embedding Learning with a Structure-aware Loss Function for Point Cloud Semantic Instance Segmentation[J]. 2019.

[6] Elich C , Engelmann F , Kontogianni T , Leibe B. 3D-BEVIS: Bird's-Eye-View Instance Segmentation[J]. 2019

*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布，僅代表博主個(gè)人觀點(diǎn)，如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。

電容的相關(guān)文章:電容屏和電阻屏的區(qū)別

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞：

焦點(diǎn)

更多>>

技術(shù)專區(qū)

關(guān)閉

博客專欄

3D實(shí)例分割

相關(guān)推薦

技術(shù)專區(qū)