新聞中心

EEPW首頁 > 測試測量 > 設計應用 > R-Car DNN模擬器的介紹

R-Car DNN模擬器的介紹

作者：時間：2023-02-20 來源：瑞薩電子

加入技術交流群
- 掃碼加入
  和技術大咖面對面交流
  海量資料庫查詢

本篇文章我們將介紹瑞薩為R-Car V4H提供的三種類型的DNN開發模擬器，以及它們的使用情況和特點。

本文引用地址：http://www.104case.com/article/202302/443468.htm

背景

用于汽車SoC實時處理的深度學習的模型轉換

深度學習是使用底層軟件（深度學習框架）開發的，如TensorFlow和PyTorch。

僅僅通過移植在深度學習框架中學習到的模型，不可能在R-Car這樣的車載SoC上進行實時處理，因為深度學習的推斷過程需要大量的計算和內存使用。因此，有必要對所學模型進行非等價的模型壓縮，如量化和剪枝，以及使用深度學習編譯器進行性能優化。

首先，讓我們討論一下模型壓縮。在量化中，通常以浮點計算的推斷過程被轉換為近似的整數運算，如8位。通過將對識別結果貢獻較小的權重設置為零并跳過對這些權重的計算，修剪減少了計算和內存的使用。這兩種轉換都是對原始推斷過程的非等效的算法轉換，因此很可能會降低識別的準確性。

在性能優化方面，深度學習編譯器可以對訓練過的模型的推斷過程進行程序轉換，以便在深度學習加速器上進行更快的處理，或者應用內存可以進行優化，例如將分配給一個層的輸出數據的快速小型SRAM重新用于另一個層的輸出數據。

應用這種轉換可以在車載SoC上進行實時處理。

在R-Car中使用瑞薩工具和軟件的推斷流程

瑞薩的R-Car中的H/W加速器CNN-IP，出于計算效率的考慮，可以使用整數值進行推斷操作。由于這個原因，用戶必須使用瑞薩公司提供的R-Car CNN工具來進行量化，這是上述模型轉換中的一種。

首先，在實際執行量化之前，必須進行校準，以計算量化參數（刻度和零點），用于將浮動數轉換為整數。為此，一個外部工具（如TFMOT、ONNX runtime），根據網絡模型的格式，從大量的輸入圖像中找到每一層的最大/最小輸出值。從這些最大/最小值中，可以計算出比例/零點等量化參數；R-Car CNN工具使用這些量化參數來量化每一層的參數。

R-Car CNN工具然后從網絡模型和每層的量化參數中創建一個命令列表。命令列表是二進制數據，用于指示CNN-IP執行哪些命令和設置哪些參數（每個量化層的參數）。通過向CNN-IP提供該命令列表并運行它，可以進行推斷。

命令列表是由網絡模型和量化參數唯一確定的，因此它只需要事先創建一次。上述命令列表可以對每個圖像執行，以便在實際設備上進行推斷。

使用瑞薩工具和軟件對R-Car V4H進行推斷的框圖見圖1。

圖1 使用瑞薩工具和軟件進行推斷的方框圖

關于每個模擬器

每個模擬器的概述和特點

瑞薩電子準備了模擬器來解決以下兩個用戶挑戰：

A）在開發一個應用程序之前，用戶希望檢查由于量化而導致的精度變化

B）想在不使用實際設備的情況下使用命令列表檢查和調試用戶應用程序

瑞薩的模擬器有三種類型，每種類型解決不同的任務，具有不同的功能。各自的特點見表1。每一種都在準確性和處理速度上有所不同。對于每一種情況，都會參照框圖介紹其特點和使用情況的細節。

表1 各模擬器的概述和特點

（*1）命令列表是使用R-Car CNN工具創建的，基于網絡模型和量化參數，使用與上述實際機器上的推斷相同的程序。

（*2）Accurate Simulator在R-Car CNN工具中運行。用戶向R-Car CNN工具提供網絡模型和量化參數，該工具會自動計算每一層的量化參數，然后將其輸入到Accurate Simulator。

ISS

該模擬器旨在使用與實際設備盡可能相同的軟件配置和輸入數據（命令列表，主要是寄存器設置）來調試輸出結果。它不能重現計時，也不打算用于計時驗證。

結果與實際設備完全相同，速度比Accurate Simulator慢，因為它以指令為基礎重現輸出。

圖2 使用ISS的系統方框圖

精確的模擬器

該模擬器將網絡模型作為輸入，用于精度驗證，無需使用實際設備。對于每一層，都要實現一種算法，使其輸出與設備的計算算法完全匹配。由于執行速度比ISS快10倍左右，所以在只驗證精度的情況下，它是很有用的。

圖3 使用Accurate Simulator的系統框圖

快速仿真器

該模擬器用于檢查大量圖像的定量誤差。

Fast Simulator擴展了深度學習框架（R-Car V4H中的Tensor Flow），在每層推斷操作后都有一個偽量化功能，并帶有浮點數字。偽量子化是一種重現浮點數的偽量子化誤差的方法，在浮點數仍然是浮點數的情況下，加入與量子化導致的精度下降相同的誤差。

可以只在Tensor Flow中添加一個偽量化功能，其運行速度與Tensor Flow相似，但速度更快。

另外，由于輸入/輸出接口與深度學習框架是通用的，所以用戶在切換到深度學習框架時很容易檢查出量化錯誤。

然而，由于每層的推斷操作和偽量化都會產生一個小的浮點算術誤差，所以結果與實際的機器結果并不完全匹配。

圖4 使用快速仿真器的系統框圖

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關鍵詞： 瑞薩電子 DNN模擬器

焦點

更多>>

技術專區

關閉

新聞中心

R-Car DNN模擬器的介紹

評論

相關推薦

技術專區