博客專欄

        EEPW首頁 > 博客 > 大年初一也不忘檢測新框架!CBNetV2:復合主干網絡的目標檢測

        大年初一也不忘檢測新框架!CBNetV2:復合主干網絡的目標檢測

        發布人:CV研究院 時間:2022-02-10 來源:工程師 發布文章

        現代性能最佳的目標檢測器在很大程度上依賴于主干網絡,其進步通過探索更有效的網絡結構帶來一致的性能提升。然而,設計或搜索新的主干并在ImageNet上對其進行預訓練可能需要大量的計算資源,這使得獲得更好的檢測性能成本很高。

        微信圖片_20220210173602.png

        論文:

        https://arxiv.org/pdf/2107.00420.pdf

        1 簡要

        現代性能最佳的目標檢測器在很大程度上依賴于主干網絡,其進步通過探索更有效的網絡結構帶來一致的性能提升。然而,設計或搜索新的主干并在ImageNet上對其進行預訓練可能需要大量的計算資源,這使得獲得更好的檢測性能成本很高。

        微信圖片_20220210173604.png

        今天分享中,研究者通過構建現有開源預訓練主干的組合,提出了一種新的主干網絡,即 CBNetV2。特別是,CBNetV2 架構將多個相同的主干分組,這些主干通過復合連接連接。研究者還為基于CBNet的檢測器提出了一個更好的訓練策略與輔助監督。無需額外的預訓練,CBNetV2可以集成到主流檢測器中,包括一級和兩級檢測器,以及基于Anchor和Anchor Free的檢測器,并在COCO的基線上顯著提高其性能3.0%以上。此外,實驗提供了強有力的證據,表明復合主干比預訓練的更廣泛和更深的網絡更高效和資源友好,包括基于手動和基于NAS的網絡,以及基于CNN和基于Transformer。

        2背景

        微信圖片_20220210173605.png

        如上圖所示,研究者的解決方案名為Composite Backbone Network V2 (CBNetV2),將多個相同的主干網絡組合在一起。具體而言,并行主干網絡(稱為輔助主干和引導主干)通過復合連接連接。在上圖中從左到右,輔助主干中每個階段的輸出流向其后續主干的并行和較低級別的階段。最后,將主干的特征饋送到neck和檢測頭,用于邊界框回歸和分類。與簡單的網絡深化或拓寬相反,CBNetV2 整合了多個主干網絡的高低層特征,逐漸擴大感受野以更高效地進行目標檢測。

        3 新框架

        微信圖片_20220210173607.png

        Same Level Composition (SLC)

        一種直觀而簡單的復合風格是融合來自主干同一階段的輸出特征。

        Adjacent Higher-Level Composition (AHLC)

        受特征金字塔網絡的啟發,自上而下的pathway引入了空間上更粗糙但語義上更強大的高級特征,以增強自下而上pathway中的低級特征。在之前的CBNet中,研究者進行了相鄰的高級組合(AHLC),將前一個主干的相鄰更高級別階段的輸出饋送到后續的主干。

        Adjacent Lower-Level Composition (ALLC)

        與AHLC不同,研究者引入了一種自下而上的pathway,將前一個主干的相鄰低級階段的輸出提供給后續主干。

        Dense Higher-Level Composition (DHLC)

        在DenseNet中,每一層都連接到所有后續層以構建綜合特征。受此啟發,研究者在CBNet架構中利用密集復合連接。

        Full-connected Composition (FCC)

        與DHLC不同,研究者將輔助主干網絡的所有階段的特征組合起來,并將它們饋送到主干中的每個階段。如上圖e所示,在比較DHLC的情況下,在低層次的情況下添加連接。

        微信圖片_20220210173608.png

        新提出的CBNet架構(K = 2)與RCNN的展開架構之間的比較。

        微信圖片_20220210173609.png

        CBNetV2的一個例子如上圖b所示。除了使用主干特征訓練檢測頭1的原始損失外,另一個檢測頭2將輔助主干特征作為輸入來產生輔助監督。請注意,檢測頭1和檢測頭2是權重共享。輔助監督有助于優化學習過程,而開始的主干原始損失承擔了最多的責任。 研究者增加權重來平衡助理監督,其中總損失表示為:

        微信圖片_20220210173611.png

        4 實驗

        微信圖片_20220210173612.png

        新提出的方法與最先進的檢測器在COCO目標檢測和實例分割方面的比較結果。


        Visualization of class activation APping, using ResNet50 and Dual-ResNet50 as backbone. The baseline detector is Faster R-CNN ResNet50 with 800 × 500 input size. For each backbone, we visualize the stage 2 viewed in color.

        微信圖片_20220210173615.png

        *博客內容為網友個人發布,僅代表博主個人觀點,如有侵權請聯系工作人員刪除。



        關鍵詞: AI

        相關推薦

        技術專區

        關閉
        主站蜘蛛池模板: 铜山县| 武汉市| 葫芦岛市| 遂溪县| 邵阳市| 象山县| 小金县| 延寿县| 栾川县| 赫章县| 马公市| 泉州市| 揭东县| 开平市| 岳池县| 古丈县| 尼玛县| 柳州市| 南溪县| 广水市| 靖西县| 邵东县| 三明市| 南通市| 平凉市| 垫江县| 沂水县| 富川| 云安县| 鸡泽县| 双流县| 双辽市| 镇远县| 邢台市| 沁阳市| 拉萨市| 云梦县| 龙门县| 会宁县| 论坛| 车险|