<abbr id="kc8ii"><menu id="kc8ii"></menu></abbr>
  • <input id="kc8ii"><tbody id="kc8ii"></tbody></input><table id="kc8ii"><source id="kc8ii"></source></table><kbd id="kc8ii"></kbd>
    <center id="kc8ii"><table id="kc8ii"></table></center>
  • <input id="kc8ii"></input>
    <abbr id="kc8ii"></abbr>
  • <abbr id="kc8ii"></abbr>
  • <center id="kc8ii"><table id="kc8ii"></table></center>
    <abbr id="kc8ii"></abbr>
    你的位置:首頁 > 測試測量 > 正文

    R-Car DNN模擬器的介紹

    發布時間:2023-02-20 來源:瑞薩電子 責任編輯:wenwei

    【導讀】本篇文章我們將介紹瑞薩為R-Car V4H提供的三種類型的DNN開發模擬器,以及它們的使用情況和特點。


    背景


    用于汽車SoC實時處理的深度學習的模型轉換


    深度學習是使用底層軟件(深度學習框架)開發的,如TensorFlow和PyTorch。


    僅僅通過移植在深度學習框架中學習到的模型,不可能在R-Car這樣的車載SoC上進行實時處理,因為深度學習的推斷過程需要大量的計算和內存使用。因此,有必要對所學模型進行非等價的模型壓縮,如量化和剪枝,以及使用深度學習編譯器進行性能優化。


    首先,讓我們討論一下模型壓縮。在量化中,通常以浮點計算的推斷過程被轉換為近似的整數運算,如8位。通過將對識別結果貢獻較小的權重設置為零并跳過對這些權重的計算,修剪減少了計算和內存的使用。這兩種轉換都是對原始推斷過程的非等效的算法轉換,因此很可能會降低識別的準確性。


    在性能優化方面,深度學習編譯器可以對訓練過的模型的推斷過程進行程序轉換,以便在深度學習加速器上進行更快的處理,或者應用內存可以進行優化,例如將分配給一個層的輸出數據的快速小型SRAM重新用于另一個層的輸出數據。


    應用這種轉換可以在車載SoC上進行實時處理。


    在R-Car中使用瑞薩工具和軟件的推斷流程


    瑞薩的R-Car中的H/W加速器CNN-IP,出于計算效率的考慮,可以使用整數值進行推斷操作。由于這個原因,用戶必須使用瑞薩公司提供的R-Car CNN工具來進行量化,這是上述模型轉換中的一種。


    首先,在實際執行量化之前,必須進行校準,以計算量化參數(刻度和零點),用于將浮動數轉換為整數。為此,一個外部工具(如TFMOT、ONNX runtime),根據網絡模型的格式,從大量的輸入圖像中找到每一層的最大/最小輸出值。從這些最大/最小值中,可以計算出比例/零點等量化參數;R-Car CNN工具使用這些量化參數來量化每一層的參數。


    R-Car CNN工具然后從網絡模型和每層的量化參數中創建一個命令列表。命令列表是二進制數據,用于指示CNN-IP執行哪些命令和設置哪些參數(每個量化層的參數)。通過向CNN-IP提供該命令列表并運行它,可以進行推斷。


    命令列表是由網絡模型和量化參數唯一確定的,因此它只需要事先創建一次。上述命令列表可以對每個圖像執行,以便在實際設備上進行推斷。


    使用瑞薩工具和軟件對R-Car V4H進行推斷的框圖見圖1。


    1675077425288677.png

    圖1 使用瑞薩工具和軟件進行推斷的方框圖


    關于每個模擬器


    每個模擬器的概述和特點


    瑞薩電子準備了模擬器來解決以下兩個用戶挑戰:


    A)在開發一個應用程序之前,用戶希望檢查由于量化而導致的精度變化


    B)想在不使用實際設備的情況下使用命令列表檢查和調試用戶應用程序


    瑞薩的模擬器有三種類型,每種類型解決不同的任務,具有不同的功能。各自的特點見表1。每一種都在準確性和處理速度上有所不同。對于每一種情況,都會參照框圖介紹其特點和使用情況的細節。


    1675077410627836.png

    表1 各模擬器的概述和特點


    (*1)命令列表是使用R-Car CNN工具創建的,基于網絡模型和量化參數,使用與上述實際機器上的推斷相同的程序。


    (*2)Accurate Simulator在R-Car CNN工具中運行。用戶向R-Car CNN工具提供網絡模型和量化參數,該工具會自動計算每一層的量化參數,然后將其輸入到Accurate Simulator。


    ISS


    該模擬器旨在使用與實際設備盡可能相同的軟件配置和輸入數據(命令列表,主要是寄存器設置)來調試輸出結果。它不能重現計時,也不打算用于計時驗證。


    結果與實際設備完全相同,速度比Accurate Simulator慢,因為它以指令為基礎重現輸出。


    1675077393286545.png

    圖2 使用ISS的系統方框圖


    精確的模擬器


    該模擬器將網絡模型作為輸入,用于精度驗證,無需使用實際設備。對于每一層,都要實現一種算法,使其輸出與設備的計算算法完全匹配。由于執行速度比ISS快10倍左右,所以在只驗證精度的情況下,它是很有用的。


    1675077377506028.png

    圖3 使用Accurate Simulator的系統框圖


    快速仿真器


    該模擬器用于檢查大量圖像的定量誤差。


    Fast Simulator擴展了深度學習框架(R-Car V4H中的Tensor Flow),在每層推斷操作后都有一個偽量化功能,并帶有浮點數字。偽量子化是一種重現浮點數的偽量子化誤差的方法,在浮點數仍然是浮點數的情況下,加入與量子化導致的精度下降相同的誤差。


    可以只在Tensor Flow中添加一個偽量化功能,其運行速度與Tensor Flow相似,但速度更快。


    另外,由于輸入/輸出接口與深度學習框架是通用的,所以用戶在切換到深度學習框架時很容易檢查出量化錯誤。


    然而,由于每層的推斷操作和偽量化都會產生一個小的浮點算術誤差,所以結果與實際的機器結果并不完全匹配。


    1675077281522670.png

    圖4 使用快速仿真器的系統框圖



    免責聲明:本文為轉載文章,轉載此文目的在于傳遞更多信息,版權歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權問題,請聯系小編進行處理。


    推薦閱讀:


    為什么逆導型IGBT可以用于大功率CCM模式 PFC電路

    一文了解控制系統及DC-DC轉換器控制環路設計推薦

    芯片溫度檢測,什么方法最有效?

    三款產品,看國巨集團如何定義優秀的電子元件!

    醫療電子領域電感器應用指南

    特別推薦
    技術文章更多>>
    技術白皮書下載更多>>
    熱門搜索
    ?

    關閉

    ?

    關閉

    狠狠躁夜夜躁无码中文字幕| 美丽姑娘免费观看在线观看中文版 | 亚洲欧美日韩中文字幕一区二区三区 | 午夜无码中文字幕在线播放| 色AV永久无码影院AV| 中文字幕人妻无码系列第三区| 亚洲大尺度无码无码专区| 亚洲伊人成无码综合网| 亚洲精品成人无码中文毛片不卡| 中文字幕人成人乱码亚洲电影| 亚洲AV无码乱码在线观看富二代| 日本妇人成熟免费中文字幕| 亚洲精品无码乱码成人| 日韩高清在线中文字带字幕| 久久国产精品无码HDAV| 中文字幕精品一区| 国产成人一区二区三中文| 无码国内精品人妻少妇| 少妇中文无码高清| 综合国产在线观看无码| 国模GOGO无码人体啪啪| 国产成人无码免费看视频软件| 无码专区一va亚洲v专区在线| 无码精品人妻一区二区三区中| 中文字幕视频在线| 中文字幕人妻无码一区二区三区| 69久久精品无码一区二区| 亚洲∧v久久久无码精品| 中文字幕精品无码一区二区| 狠狠躁天天躁无码中文字幕| 亚洲午夜无码AV毛片久久| 久久精品aⅴ无码中文字字幕重口| 国产aⅴ激情无码久久| 无码中文字幕av免费放dvd| 天堂无码在线观看| 本免费AV无码专区一区| 亚洲AV永久无码精品水牛影视| 国产成人无码区免费内射一片色欲| 最近中文字幕高清中文字幕无 | 无码国产精品一区二区免费 | 人妻中文字幕无码专区|