博客專欄

        EEPW首頁 > 博客 > 海康研究院出品:具有場景自適應(yīng)概念學(xué)習(xí)的無監(jiān)督目標檢測

        海康研究院出品:具有場景自適應(yīng)概念學(xué)習(xí)的無監(jiān)督目標檢測

        發(fā)布人:CV研究院 時間:2022-06-17 來源:工程師 發(fā)布文章

        圖片


        論文地址:http://www.jzus.zju.edu.cn/article.php?doi=10.1631/FITEE.2000567

        計算機視覺研究院專欄

        作者:Edison_G

        今天看了一篇自己研究院出品的文章,雖然21年中的paper,但是技術(shù)還是挺有趣,今天我就拿出來分享說一說。


        01

        技術(shù)簡要


        目標檢測是計算機視覺領(lǐng)域最熱門的研究方向之一,已經(jīng)在學(xué)術(shù)界取得了令人矚目的進展,并在業(yè)界有許多有價值的應(yīng)用。但是,主流的檢測方法仍然存在兩個缺點:

        • 即使使用大量數(shù)據(jù)訓(xùn)練好的模型仍然不能普遍用于不同類型的場景;

        • 一旦部署模型,它就不能隨著積累的未標記場景數(shù)據(jù)自主進化。

        為了解決這些問題,在視覺知識理論的啟發(fā)下,研究者提出了一種新穎的場景自適應(yīng)進化無監(jiān)督視頻目標檢測算法,可以通過目標組的概念減少場景變化的影響。

        圖片

        首先通過預(yù)訓(xùn)練的檢測模型從未標記的數(shù)據(jù)中提取大量候選目標。其次,通過對候選進行聚類來構(gòu)建目標概念的視覺知識字典,其中每個聚類中心代表一個目標原型。第三,研究者們研究了不同簇之間的關(guān)系和不同組的目標信息,并提出了一種基于圖的組信息傳播策略來確定目標概念的類別,可以有效區(qū)分正負樣本。使用這些偽標簽,就可以輕松地微調(diào)預(yù)訓(xùn)練模型。

        最終通過不同的實驗驗證了所提方法的有效性,取得了顯著的改進!


        02

        背景簡述


        最先進的圖像目標檢測方法主要分為兩組:兩階段方法和一階段方法。典型的兩階段算法有R-CNN、fast R-CNN、faster RCNN、R-FCN、FPN和Libra R-CNN,它們由區(qū)域候選、區(qū)域識別和位置組成。一階段方法將檢測轉(zhuǎn)換為回歸問題。SSD、YOLO、RetinaNet、CornerNet和FreeAnchor直接預(yù)測對象和對象類的位置或角點。


        在這項研究中,YOLO-v2作為基礎(chǔ)檢測器。視頻目標檢測類似于圖像目標檢測。唯一的區(qū)別是目標檢測任務(wù)中使用了時間信息。現(xiàn)有的方法可以根據(jù)它們對時間信息的應(yīng)用分為兩類:特征級學(xué)習(xí)和后處理策略。


        大多數(shù)視頻檢測方法不能直接檢測新場景中的目標。這些檢測器應(yīng)該使用新的數(shù)據(jù)集進行重新訓(xùn)練。在這種情況下,一些研究人員提出了無監(jiān)督視頻檢測算法。這些方法的主要策略是無監(jiān)督特征學(xué)習(xí)、目標挖掘、匹配、跟蹤和域適應(yīng)。例如,Croitoru等人提出了一種基于視頻主成分分析(PCA)的無監(jiān)督目標挖掘策略,以生成軟掩碼來訓(xùn)練檢測器。提出了一種跟蹤策略以獲得偽標簽,用于在視頻流中訓(xùn)練基于CNN的目標檢測器。還有研究者結(jié)合自定進度的域適應(yīng)和分數(shù)軌跡跟蹤策略來自動挖掘目標域樣本以進行無監(jiān)督視頻目標檢測。今天說的新方法是一種場景自適應(yīng)進化無監(jiān)督視頻目標檢測算法

        03

        新框架分析


        圖片

        所提出方法的框架如上圖所示。它由PDG、G-GIP和檢測組成。 

        首先,原始數(shù)據(jù)用于訓(xùn)練初始檢測模型;其次,利用新的場景數(shù)據(jù)通過PDG策略建立目標的視覺知識表示。每一幀新的場景數(shù)據(jù)被發(fā)送到初始檢測模型,用于提取目標候選和相應(yīng)的特征。所有提取的特征與框尺度信息相結(jié)合,通過k-means算法進行聚類,以構(gòu)建目標原型字典。每個原型都是相應(yīng)目標組的中心;第三,提出了基于圖的組信息傳播模型,創(chuàng)建正樣本類別,然后從新的場景數(shù)據(jù)集中挖掘具有偽標簽的新訓(xùn)練樣本;最后,挖掘的數(shù)據(jù)集用于微調(diào)檢測模型以進行新場景檢測。

        圖片

        上圖:目標候選的組內(nèi)置信度傳播和組間信息傳播

        每個object proposal的置信度可以通過初始檢測模型得到。置信度值越大,目標候選越有可能是正樣本。計算每組的平均值和標準偏差以供進一步分析。置信度分布如下圖所示。

        圖片

        如上圖所示,右上角組的置信度均值較大,標準差較小,說明該組包含大量正樣本。在這種情況下,提出組內(nèi)置信傳播來選擇初始正樣本組。首先,應(yīng)用每個目標的置信度平均值來表示每個組。然后,將高置信度組定義為初始正樣本組。

        圖片

        Framework of the graph network (NN is the modification subnet)


        04

        實驗及可視化


        圖片

        Residential-K dataset的檢測結(jié)果

        圖片

        圖片


        *博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權(quán)請聯(lián)系工作人員刪除。



        關(guān)鍵詞: AI

        相關(guān)推薦

        技術(shù)專區(qū)

        關(guān)閉
        主站蜘蛛池模板: 平谷区| 葫芦岛市| 于都县| 宾川县| 施甸县| 平潭县| 合山市| 大同市| 恭城| 涟水县| 象山县| 安远县| 太和县| 海安县| 同心县| 皋兰县| 岳阳市| 镇平县| 淅川县| 康保县| 循化| 常山县| 桃园县| 嘉黎县| 大余县| 商南县| 新巴尔虎左旗| 吉木萨尔县| 巴青县| 临猗县| 垫江县| 读书| 新安县| 苗栗市| 三河市| 铁岭市| 上思县| 顺义区| 定西市| 河间市| 互助|