技術革命!主流芯片架構正在發生重大變化?
更多計算,更少移動
本文引用地址:http://www.104case.com/article/201808/391400.htm使問題變得更加復雜的是,邊緣設備以各種頻率和速度產生了多種不同類型的數據。為了使數據在各種處理單元之間流暢地移動,必須比過去更加有效地管理它。
“有四種主要配置 - 多對多、內存子系統、低功耗IO以及網狀和環形拓撲,”Arteris IP董事長兼首席執行官Charlie Janac說。 “你可以將所有這四個要素放在單個芯片中,現在的決策型IoT芯片就是這么做的。或者您可以添加具有高吞吐能力的HBM子系統。但是由于其中一些工作負荷是面向特定行業需求,而且每個芯片都需要面對多個工作負荷,具有多個引腳,所以問題依然很復雜。你看其中一些物聯網芯片,它們會收集大量的數據。些工作負載非常具體,每個芯片有多個工作負載和引腳。 如果你看一些物聯網芯片,它們會收集大量的數據。像汽車中的雷達和LiDAR這樣的東西尤其如此。如果沒有某種先進的互連技術,它們的存在毫無意義。”
挑戰在于如何盡量減少數據移動,以及在需要時最大程度提高數據傳輸速度,并以某種方式在不消耗太多功率的情況下取得本地處理和集中處理的平衡。
“一方面是帶寬問題,”NetSpeed Systems產品營銷經理Rajesh Ramanujam說。 “如果可能的話,您希望盡量不要移動數據,因此您可以將數據放得離處理器更近。但是,如果您必須移動數據,則需要盡可能地壓縮數據。但是,現實情況往往更加復雜,你必須從系統級別查看這種可能性。每一步都需要考慮多個因素,確定您是以傳統的讀寫方式使用內存還是利用新的內存技術。在某些情況下,您可能希望更改數據本身的存儲方式。如果您想要更快的性能,通常意味著更大的芯片尺寸,這會影響功耗。現在你還要考慮功能安全,因此不得不擔心數據過載。”
這就是為什么人們把那么多的注意力放在加強邊緣處理能力和增加各種處理單元之間的傳輸吞吐能力上。現在,隨著架構的演化和完善,處理的實現方式和位置都發生了很大變化。
比如,Marvell推出了一款內置AI能力的SSD控制器,它可以在邊緣節點上處理更大的計算負荷。其中的AI引擎可用于固態存儲本身的分析。
“你可以直接將模型加載到硬件中,并在SSD控制器上進行硬件處理,”Marvell的首席工程師Ned Varnica說。 “今天,云端主機就是這樣做的。但是,如果每個SSD都要將數據發送到云端,那將會產生巨大的網絡流量。最好在邊緣就地處理,主機只需要發出元數據形式的命令。 這樣一來,您擁有的存儲設備越多,處理能力就越強。降低網絡傳輸的好處非常大。”
這種方法有一點特別值得注意,即它強調數據根據應用類型而移動的靈活性。主機可以生成一個任務,將它發送到存儲設備上進行處理,然后只需要返回元數據或者計算結果。在另外一種場景中,存儲設備可以存儲數據,對數據進行預處理并從生成元數據、標簽和索引,主機需要進行進一步分析時再讀回它們。
這只是其中一種方案,還有其它的選擇。三星的Rupley強調了亂序處理和融合習語,它們可以解碼兩條指令并將它們融合在單個操作中。
AI監督和優化
在所有這些之上是人工智能,它是芯片架構領域的新技術。它不管操作系統和中間件如何管理功能,而是在系統級別上監督芯片以及芯片之間的行為。在某些情況下,AI可以體現為芯片內的神經網絡。
eSilicon市場營銷副總裁Mike Gianfagna表示,“AI的作用并不是將更多東西包裝在一起,多到足夠改變傳統的處理方式。通過AI和機器學習,你可以在系統周圍部署人工智能,以獲得更高效和預測性的處理。它有時可以是在系統內獨立運行的單獨芯片。”
Arm正在開發首款機器學習芯片,它計劃于今年晚些時候推出,面向多個細分市場和垂直市場。“這是一種新型處理器,”Arm的杰出工程師Ian Bratt說。 “它包括一個基本塊,其中帶有一個計算引擎、一個MAC引擎和一個帶有控制單元和廣播網絡的DMA引擎。該芯片共有16個計算引擎,使用7nm制造工藝,在1GHz主頻下可達到4 teraOps的計算能力。”

Arm機器學習處理器架構
由于Arm生態系統面向多個合作伙伴,因此該芯片比其它AI/ML芯片更加通用,配置能力更強。它沒有搭建一個包羅萬物的單片架構,而是根據功能劃分不同處理單元,因此每個計算引擎都是面向不同的功能特征。Bratt表示,AI芯片的四個關鍵要素是靜態調度、高效卷積、帶寬減少機制以及面向未來設計的可編程性。
英偉達則采取了不同的策略,它選擇在GPU旁邊構建專用的深度學習引擎,以優化圖片和視頻處理的數據傳輸。
結論
芯片制造商表示,通過實行部分或全部這些方法,他們可以每隔幾年就將性能提高一倍,以跟上數據爆炸性增長的步伐,同時滿足功耗的嚴格限制。這些方法不僅是提供更多計算機,還正在改變芯片設計和系統工程化的起點,它們更多考慮數據的不斷增長,而不是硬件和軟件的限制。
Synopsys公司董事長兼聯席首席執行官Aart de Geus說:“當最初一代計算機開始進入公司時,很多人都認為世界的發展速度將會加快很多。沒有計算機時,他們用一堆紙質的會計賬簿進行會計處理。自那以后,各種公司事務的處理速度發生了指數級的變化,現在,這種變化再一次來到了我們面前。這種快速的變化就像突然可以把會計賬簿打印出來了一樣。就像在農業領域里,你只需要在某一天溫度上升的時候灌溉適當的水和某種肥料,就可以等待豐收一樣,機器學習也是這種之前并不明顯的優化。”
西門子子公司Mentor的總裁兼首席執行官Wally Rhines也認可這種觀點。“新架構將被人們接納,人們將在新架構下設計芯片,在許多甚至大多數場景下執行機器學習,就像您的大腦有能力從經驗中學習一樣。我拜訪了20多家正在做自己的專用AI處理器的公司,它們都有自己的特色。你會越來越多地在各種特定應用中看到它們,它們對傳統的馮諾伊曼架構形成了有效補充。神經形態計算將成為處理,它將幫助我們提高計算效率、降低成本,在移動和聯接性的環境中完成工作,現在我們還必須在大型服務器集群中完成這些工作。”
評論