博客專欄

        EEPW首頁 > 博客 > 雙尺度殘差檢測器:無先驗檢測框進行目標檢測

        雙尺度殘差檢測器:無先驗檢測框進行目標檢測

        發布人:CV研究院 時間:2021-11-10 來源:工程師 發布文章

        論文地址:https://arxiv.org/pdf/1904.06883.pdf

        1.png

        Dubox增強了啟發式引導的能力,進一步使第一尺度探測器能夠最大限度地檢測小目標,第二尺度探測器能夠檢測第一尺度探測器無法識別的目標。今天給大家分享的文章可能會優點舊,但是我覺得整體是一個不錯的ideal!

        一、背景

        長期以來,目標檢測一直是計算機視覺領域的一個具有挑戰性的問題。隨著深度神經網絡(DNN)的發展,近年來在目標檢測方面取得了重大進展。它是各種工業應用的先決條件,例如自動駕駛和面部分析。由于深度卷積神經網絡和標注良好的數據集的進步,目標檢測器的性能得到了顯著提高。

        2.png

        現實世界中的圖像包含不同比例的對象。尺度變化已成為目標檢測領域的一個具有挑戰性的問題。為了實現尺度不變性,最先進的方法通常結合多個層次的特征來構建特征金字塔或多層特征塔。同時,為了提高檢測性能,多尺度方法在不同尺度上并行使用多個檢測器。例如,RetinaNet有五個尺度檢測器(p3-p7),它們在特征金字塔結構上并行檢測。YOLOv5在主網上運行了三個檢測器。

        3.png

        此外,prior box被認為是處理尺度不變性的有效手段。它是許多檢測器的基礎,例如Faster RCNN和YOLOv2中的錨點,SSD中的默認框。先驗框是一堆具有預定義大小和縱橫比的框,它們以滑動窗口的方式平鋪特征圖,作為檢測候選。先驗框離散化可能的輸出邊界框形狀的空間,DNN基于特定的先驗框利用先驗信息對邊界框進行回歸。多尺度檢測和先驗框的混合是最先進的檢測器中的常見做法,它利用了多尺度特征和預先計算的邊界框統計數據。

        二、前言

        傳統的目標檢測方法使用多尺度特征,允許多個檢測器獨立并行地執行檢測任務。同時,通過對prior box的處理,增強了算法處理尺度不變性的能力。然而,太多的先驗框和獨立的檢測器會增加檢測算法的計算冗余。

        4.png

        Some comparisons with the precision and speed to clas- sical algorithms on VOC07, ▽ is two-stage method,    ? denote the one-stage algorithm, □is Dubox.

        今天這項研究中,研究者介紹了Dubox,這是一種新的單階段方法,可以在沒有先驗框的情況下檢測目標。使用多尺度特征,設計的雙尺度殘差單元使雙尺度檢測器不再獨立運行。第二個尺度檢測器學習第一個的殘差。Dubox增強了啟發式引導的能力,可以進一步使第一尺度檢測器能夠最大限度地檢測小目標,第二尺度檢測器能夠檢測第一個無法識別的對象。此外,對于每個尺度檢測器,新的classification-regression progressive strap loss(CRPS)使整個的過程不再基于先驗框。整合這些策略,新提出的檢測算法在速度和準確性方面取得了出色的表現。在VOC、COCO目標檢測基準上的大量實驗證實了該算法的有效性。

        三、新框架

        5.png

        No-prior Box Detection

        Dubox是一個單一的神經網絡,統一了目標檢測的所有必要組件。檢測器設計支持端到端訓練和實時推理,同時保持高平均精度。

        新的網絡將整個圖像作為輸入,并以s倍的下采樣級別預測結果特征圖。假設輸出map大小為(h,w),將輸出中的位置(i,j)定義為hook,其中i∈[0,w)和j∈[0,h)。Dubox在輸出特征的每個hook處預測每個邊界框及其所有類別的置信度,如下圖所示。

        6.png

        如上圖所示是正樣本和負樣本GT設置,DuBox使用固定鉤(i,j)將bbox的預測和分類結合起來。藍色的點是positive的hook,其他的是negative。不再像DenseBox那樣直接在中心點畫圓框了,而是根據以下公式進行正樣本的定義:

        7.png8.png

        P是用于調整范圍的預定義值。

        Residual Dual Scale Detectors

        雙尺度殘差單元是基于共享特征提取主干的子結構。殘差雙尺度檢測器通過共享 VGG-16、ResNet等特征提取網絡來組合不同級別檢測器的特征。殘差單元的結構包含兩個檢測器,其中高級檢測器將學習在低級檢測器中找到的回歸框的殘差。詳細結構如下圖所示。

        9.png

        雙尺度的冗余策略:

        Differentiate positive range:設計檢測器1中的p為10,檢測器2中的p為9。同時,向檢測器1的正范圍添加一個約束 => r=arg min(r, 3)。該方法確保了大目標正樣本掛鉤的數量受到限制,并且提高了低級別檢測小目標的性能。

        Differentiate scale weight:物體的目標邊界框在原始圖像中占據的區域大于0.3,則檢測器1的回歸將忽略該目標對象。(讓大目標給檢測器2來檢測,檢測器1只負責檢測小目標)

        Bbox Bridge Module

        Bbox(邊界框)橋模塊將低級檢測器和高級檢測器的回歸連接起來,從而使高級別回歸基于低級殘差。

        10.png

        Classification-Regression Progressive Strapped Loss

        在基于錨的方法中,借助先驗框,檢測器具有框形狀的先驗知識。它通過調整預定義的錨形狀來執行其預測,從而提高它們對周圍錨的擬合能力。Dubox沒有任何先前的盒子形狀,研究者必須設計一個更強的分類和回歸策略,主要是損失函數。

        11.png12.png

        基于這一觀察,研究者通過IoU重建classification loss progressive strap :

        13.png14.png

        四、實驗

        15.png

        The performance of dual branch on VOC2007 dataset (512 × 512)

        16.png

        Comparison with state-of-the-art detectors on VOC 2007 and 2012

        17.png

        Comparison with state-of-the-art detectors on MS COCO test-dev

        18.png

        *博客內容為網友個人發布,僅代表博主個人觀點,如有侵權請聯系工作人員刪除。



        關鍵詞: 深度學習

        相關推薦

        技術專區

        關閉
        主站蜘蛛池模板: 沐川县| 翁牛特旗| 罗源县| 玉门市| 邵东县| 锡林浩特市| 湖南省| 永德县| 贡嘎县| 顺义区| 体育| 沛县| 奎屯市| 民丰县| 武隆县| 庆云县| 北辰区| 潞西市| 大姚县| 新郑市| 盘山县| 景东| 将乐县| 兰坪| 睢宁县| 绿春县| 阳高县| SHOW| 东宁县| 益阳市| 固安县| 兰西县| 老河口市| 蓬安县| 达拉特旗| 确山县| 富顺县| 婺源县| 新余市| 平潭县| 朝阳县|