YOffleNet | YOLO V4 基于嵌入式設備的輕量化改進設計
以下文章來源于集智書童 ,作者ChaucerG
1簡介
最新的基于CNN的目標檢測模型相當精確,但需要高性能GPU實時運行。對于內存空間有限的嵌入式系統來說,它們在內存大小和速度方面依舊不是很好。
由于目標檢測是在嵌入式處理器上進行的,因此在保證檢測精度的同時,最好盡可能地壓縮檢測網絡。有幾個流行的輕量級檢測模型,但它們的準確性太低。因此,本文提出了一種新的目標檢測模型 YOffleNet,該模型在壓縮率高的同時,將精度損失降到最小,可用于自動駕駛系統上的實時安全駕駛應用。該模型的Backbone架構是基于YOLOv4實現,但是可以用ShuffleNet的輕量級模塊代替CSP的高計算負荷的DenseNet,從而大大壓縮網絡。
在KITTI數據集上的實驗表明,提出的YOffleNet比YOLOv4-s壓縮了4.7倍,在嵌入式GPU系統(NVIDIA Jetson AGX Xavier)上可以達到46FPS的速度。與高壓縮比相比,精度略有降低,為85.8% mAP,僅比YOLOv4-s低2.6%。因此,提出的網絡具有很高的潛力部署在嵌入式系統。
2YOLO V4簡述
在YOLOv4的主干網絡CSPDarknet-53中,CSP將特征卷積一定次數后復制使用與前一層特征cat起來,然后利用DenseNet模塊。
在Neck中,輸入特征圖有3種大小。SPP最大池化后concat技術提高了各種尺寸輸入的準確性。此外,它通過自底向上的路徑增強技術平滑特征。
YOLOv4引入PANet以促進信息流和它彌補了權重帶來的精度損失問題。
YOLO v4的Head依舊采用YOLOv3的物體檢測方法。
3YOLO V4輕量化設計
YOffleNet
YOLOv4中使用的主要模塊是下圖中的CSP DenseNet;此外為了防止初始特征圖中的信息丟失的問題,作者還設計了PANet結構,其是通過自下而上的路徑增強特征表達的。它促進信息的流動的同時也增加了特征圖中的通道數、增加參數的數量,這也是YOffleNet模型為它改進了上述YOLOv4模型的缺點。
CSP DenseNet
改進點 1
主干層CSP DenseNet是一種隨著深度增加而不可避免地增加計算量的結構。在本研究中,主干網絡層被配置為ShuffleNet模塊。
ShuffleNet模塊
改進點 2
YOLOv4網絡中使用的SPP+PANet結構簡化和減輕模型的大小。現有YOLOv4模型的PANet從主干網絡分為3層作為輸入的。然而,常見對象檢測情況與自動駕駛環境不同,有限類別中的物體檢測(汽車、行人等,更小的目標也就少了)。
基于這個原因,改進PANet可以接收來自backbone網絡的只有2層的輸入。Upsample, Downsample層的位置和數量變少了。計算量相對也就減少了。
4實驗
沒啥好評價的,確實變快了,但是這個改進確實有點。。。。你懂的!!!
5參考
[1].Developing a Compressed Object Detection Model based on YOLOv4 for Deployment on Embedded GPU Platform of Autonomous System
*博客內容為網友個人發布,僅代表博主個人觀點,如有侵權請聯系工作人員刪除。
電能表相關文章:電能表原理