邊緣視覺 AI 的理想平臺
Kria K26 SOM 旨在讓數百萬開發者在他們最擅長的環境下,用開箱即用的低成本開發套件入門,以更快的速度部署他們的智能視覺應用。
本文引用地址:http://www.104case.com/article/202106/426416.htm概要
隨著人工智能 (AI) 和機器學習 (ML) 算法取得一系列新的進展,眾多高計算強度的應用現在正在被部署到邊緣設備上。因此我們需要一種高效率的硬件,既能高效率地執行復雜算法,又能適應這種技術的快速演進。賽靈思 Kria? K26 SOM 的設計初衷,是用于滿足在邊緣設備上高效率執行 ML 應用的需求。本白皮書對各種 ML 模型和實時應用的性能開展研究并與英偉達 Jetson Nano 和英偉達 Jetson TX2 進行對比。賽靈思的研究結果表明,K26 SOM 提供了比英偉達 Jetson Nano高出大約 3 倍的性能。此外,它的單位功耗性能比英偉達 Jetson TX2 提升 2 倍。對于 SSD MobileNet-v1 這樣的網絡,K26 SOM 的低時延高性能深度學習處理單元 (DPU)提供了比 Nano 高出 4 倍,甚至更高的性能,這使得 Kria SOM 成為ML 邊緣應用開發的理想選擇。
計算視覺的發展
在過去十年,人工智能和機器學習算法有了長足發展。這些發展主要體現在視覺相關的應用上。2012 年,AlexNet(Krizhevsky 等[參考資料 1])從 ImageNet 大規模視覺識別挑戰賽勝出 (ILSVRC),成為首個使用反向傳播算法完成訓練的深度神經網絡。與傳統的淺網絡相比,性能發生了前所未有的近 10% 的飛躍, 預測精度躋身前 5 位。這個重大發展是一個轉折點。從那時起,深度神經網絡在性能和精度兩個方面不斷迎來巨大進展。2015 年 ResNet(Kaiming 等[參考資料 2])超越了單個人類的分類能力。參見圖1。就各種目的和用途而言,今天的神經網絡的錯誤率已經可以與貝葉斯錯誤率相媲美,可以視為已經解決了計算機視覺應用中的圖像分類問題。
圖1 前5位預測精度
鑒于如此令人振奮的結果,半導體制造商爭相開發器件,支持深度學習部署的高度復雜的計算需求。在未來十年,推斷功能的商業化,特別是用深度學習實現的計算機視覺的商業化,將繼續高速增長。計算機視覺市場規模預計將以 30% 的年均復合增長率 (CAGR) 增長,到 2025 年將達到 262 億美元 [參考資料 3]。用深度學習實現的計算機視覺可以廣泛地應用到各類行業市場,包括零售分析、智慧城市、執法、邊境安全、機器人、醫療成像、作物收獲優化、符號語言識別等。在不遠的未來,AI 將成為日常生活的內在組成部分。而且有部分人認為如今這樣的未來近在咫尺。
隨著新穎的網絡、層和量化技術被開發出來,采用固定存儲器架構的硬化Tensor 加速器,不再能夠滿足未來的需求。這種狀況已經在 MobileNets(Howard 等)的發展中表露無遺[參考資料 4]。在 MobileNet 骨干網絡中使用深度卷積能大幅降低計算-存儲器比。這對于通用 CPU 這樣的器件來說非常理想。CPU 一般受計算約束,但在若因架構受存儲器所限而導致效率有限,在某種程度上等于浪費了寶貴的計算周期,
就像數據中心中的空閑服務器消耗能量一樣。這種計算-存儲器比影響著部署網絡[參考資料 5]時具體 Tensor 加速器架構的總效率。不幸的是,ASIC 和 ASSP Tensor 加速器架構一般在器件流片前至少一年就已凍結。但在使用賽靈思推斷技術時則不會發生這種情況。賽靈思技術能隨時間推移進行調整和優化,以支持神經網絡架構的快速演進發展,從而確保低功耗、高效率。
本白皮書介紹了賽靈思產品組合中的最新成員 Kria? K26 SOM,及其在嵌入式視覺應用中的的主要優勢。
評論