博客專欄

        EEPW首頁 > 博客 > 推理速度快YOLOV4五倍的YOLObile:通過壓縮編譯在移動端實時檢測

        推理速度快YOLOV4五倍的YOLObile:通過壓縮編譯在移動端實時檢測

        發布人:CV研究院 時間:2020-09-17 來源:工程師 發布文章

        目標檢測技術的迅速發展和廣泛應用,引起了人們對目標檢測器的精度和速度的關注。然而,目前最先進的目標檢測工作要么是精度導向使用大模型,但導致高延遲,要么是速度導向使用輕量級模型,但犧牲精度。在這項工作中,作者提出了YOLObile框架,通過壓縮編譯協同設計在移動設備上實時檢測對象。提出了一種適用于任意核大小的塊穿孔剪枝方案。為提高移動設備上的計算效率,采用GPU-CPU協同方案,并輔以高級編譯器輔助優化。實驗結果表明,新提出的剪枝方案在49.0 mAP的情況下,可以實現YOLOv4的14倍壓縮率。在YOLObile框架下,使用三星Galaxy S20的GPU實現了17 FPS的推理速度。通過加入新提出的GPU-CPU協同方案,推理速度提高到19.1幀/秒,比原來的YOLOv4加速5倍。

        1600324641897521.jpg1600324648676000.jpg1600324655190990.jpg1600324662767613.jpg1600324668848482.jpg1600324674976884.jpg1600324684101686.jpg1600324691514593.jpg1600324699931958.jpg1600324705917468.jpg1600324711948565.jpg

        總結

        在本次工作中,提出了一個基于壓縮編譯協同設計的移動設備實時目標檢測框架YOLObile。此外,還提出了一種新的剪枝方案——區塊剪枝,該方案適用于任意核大小的卷積層和全連接層。為了提高移動設備上DNNs的計算效率,除了新提出的編譯器優化之外,提出的YOLObile還提供了一個GPU-CPU協同計算方案。經過實驗證明,新提出的YOLObile框架展現出了高準確性、高效率,并同時實現了高硬件并行性!


        *博客內容為網友個人發布,僅代表博主個人觀點,如有侵權請聯系工作人員刪除。

        電路圖符號相關文章:電路圖符號大全


        電容傳感器相關文章:電容傳感器原理


        關鍵詞:

        相關推薦

        技術專區

        關閉
        主站蜘蛛池模板: 上犹县| 夏津县| 巴彦淖尔市| 成都市| 石台县| 理塘县| 洱源县| 博罗县| 阿合奇县| 齐齐哈尔市| 洪洞县| 桃园县| 重庆市| 陇川县| 兖州市| 固阳县| 外汇| 兴宁市| 全椒县| 定兴县| 峨眉山市| 乐清市| 大竹县| 西城区| 景德镇市| 安塞县| 逊克县| 璧山县| 龙井市| 广丰县| 通许县| 奇台县| 嘉义市| 卢龙县| 海原县| 沧州市| 绥阳县| 武鸣县| 洞口县| 南京市| 昌黎县|