大數據量進一步推動集中式計算
作者/Achronix市場營銷副總裁 Steve Mensor
本文引用地址:http://www.104case.com/article/201801/374299.htm近10年來,大家看到集中式計算已實現了大幅的增長,大量數據都流向云端以利用其在專用數據中心中低成本處理的優勢。這是一種似乎與計算領域總趨勢不一致的趨勢,總的趨勢是始于大型機卻逐漸移向周邊包圍型智能和物聯網(IoT)。隨著我們進入2018年,這種集中化將達到它的極限。驅動下一波應用所需的數據量正在開始推動發展方向上的改變。
當前在企業生成數據中,僅有10%是在集中式數據中心之外被生成和被處理的。行業分析機構Gartner預測這個數字將在2022年達到50%。這是一種必然的反轉,其推動因素是業界向超級連通信息物理系統的轉變。這一反轉將隨著諸如5G無線通信等技術的到來和新一波面向應用的計算硬件浪潮的興起而實現。
物聯網的第一波浪潮就產出了眾多小型個體性數據項目,它們共同在大型數據中心中以最有效的方式被聚合和處理。但是隨著物聯網設備和越來越多的信息物理系統開始依賴于解讀更大量數據流的能力,重心就需要向邊緣轉移。
汽車行業提供了這種轉變的一個縮影,而我們將隨之在眾多行業中看到這種轉變。舉例來說,將來自于多輛汽車的GPS數據聚集在一起,就實現了交通堵塞的信息采集。再反送回車載單元,就可以引導駕駛員去駕行暢通的路線。數周的重復數據采集已經顯現出更長期的效益。運行于數據中心的系統已經從成千上萬車輛的通行狀況中獲知,在哪些高速的方式運轉。結果是更加精確、生動的數字地圖:所有功能都實現了,而且無需派遣大量的調查車輛。
在集中式服務器中維護數據只能走到這么遠。現在,汽車制造商正快速轉向在他們的車輛中構建更高等級的自動能力。讓計算機來控制駕駛的能力可以減少擁堵并縮短出行時間。如今,自動化駕駛員輔助系統(ADAS)大部分都包含智能化功能,由車載攝像頭和雷達系統所采集的場景信息完全在車輛內進行處理,這些數據中的很小一部分會轉發至汽車制造商的服務器。轉發的數據可以用于更新維護數據庫以幫助實現預測性維護,以及收集ADAS軟件運行情況的統計數據。
還有更多可以使用的數據,但是帶寬和處理能力的限制阻礙了其使用,裝備ADAS系統的車輛每行駛1英里將產生大約10GB數據。這些信息會馬上被處理,然后會被快速遺棄;這些數據所包含的內在信息可能對很多系統都有價值。數據太過密集,所以很難傳送至集中式云服務器。但是,更接近車輛的系統可以使用高速、高性價比的無線網絡,例如專為V2X通信設計的IEEE 802.11p協議,以獲取這些數據并基于它們做出有依據的決定。
隨著自主駕駛變得越來越普遍,路邊的信標和智能交通信號燈將與行駛的車輛配合以優化道路使用。在一個簡單的場景中,通行車輛上的傳輸裝置會使用車聯網(V2X)將它們遇到的路面情況的數據傳遞給路邊信標。信標本身可以是孤立的,僅以低速方式連接至云端。信標可以使用其自身的計算能力來了解路面情況,并將信息傳送給另一個方向的通行車輛,而不必為了將數據傳送至云端進行處理而遺棄大量的數據。
相似地,智能交通信號燈將采集來自于車輛的數據和圖像,以有助于確定行人、其他弱勢道路使用者和車輛本身的位置。這將幫助它們的軟件就“它們應該在何時變燈以實現最佳交通流量”這一問題做出智能的決策。路邊的信標和車輛也將開始互相配合以提供“一目了然”功能,從而通過確定最安全的操作時點來輔助超車和變道等駕駛行為。
隨著自主駕駛等級的提升,對于低延遲、實時響應的需求變得更加至關重要。當車輛高速通行時,數毫秒都很重要。當今的無線網絡可能會有大約數百毫秒級的雙向延遲,而第五代移動通信(5G)已經被重新架構,以在僅僅1毫秒之內對消息做出響應。但是這種引人矚目的延遲改進需要與數據移向云端時所發生的延遲進行比較。
邊緣計算
為了支持毫秒級的響應時間,計算資源需要被放置在更接近傳送點的位置,即位于網絡邊緣的“微云”上。微云所執行的處理將包括大量的數據分析,這通常基于機器學習技術。這種將人工智能(AI)技術推向網絡邊緣的趨勢,已經隨著諸如亞馬遜云計算服務中的Greengrass(Amazon Web Services’ Greengrass)這樣的創新項目而發生了。這種服務原本被開發用來應對物聯網服務發送數據到云時,可能出現的無論服務器資源是否可用都需要AI支持這一情況。
首先,這些機器學習算法的訓練將發生在核心云中,同時邊緣計算系統提供了能夠處理一些推理的任務,這樣也可以減輕云的能量需求。另外,連訓練過程也很可能移向邊緣,也還是因為數據的重心所致。即使有高比例數據壓縮,上傳足夠的數據以實現良好的訓練往往被證明是不現實的。
本地訓練也能使系統為它們所看到的情況、而非一個國家或者全球的平均值來修正自己的行為。智能交通信號燈可以學習本地的堵塞模式,或利用通行車輛的燃油效率追蹤來基于本地條件去優化它們周邊的交通流量。
為了合理地服務這些多樣化的、需要快速響應的應用,微云或者邊緣計算機不能簡單地只是一個云服務器的規模縮小版。高性能是必需的,但是它要以一種緊湊、可靠、節能的形式來提供,這些系統很可能緊鄰像路邊的機柜一樣小的通信設備。即使是那些被部署在校園中的系統,將無法獲得與核心數據中心中的刀片服務器同等級的支持。
為了實現計算效率最大化,硬件加速技術將在邊緣計算機和微云中起到關鍵作用。在處理諸如實時機器學習等任務時,多核處理器本身會很慢且能耗很高。一種加速選擇可以是用一個通用圖形處理單元(GPGPU)或視覺處單元(VPU)來增強多核CPU。GPGPU和VPU被用于一些嵌入式系統中,來運行機器學習和數據分析算法,因為它們擁有高度并行化的浮點運算單元,可以為很多并行的神經元集合多輸入,而且這種做法比CPU的集群要快得多;即便是高端CPU供應商,也已經在整合其大規模并行單指令多數據(SIMD)單元(如Intel的AVX512 和ARM的NEON)來彌補這種差距。
強調GPGPU中浮點運算的峰值性能,使得這種架構不適合具有能量約束性系統,因為GPGPU通常需要將能耗等級維持在150W以上。甚至在機器學習中,使用GPGPU和VPU還會有一些缺點,這類器件的首要設計目的是加速涉及諸如卷積等操作的2D和3D圖形以及圖像應用。它們將自己用于深度神經網絡的卷積層,但是其他類型的操作會引起存儲訪問方面的麻煩。最高池化和全連接層將重點放在虛擬神經元之間的數據傳輸上,使用了并不適合其存儲結構的訪問模式。更進一步的問題是,它們將重點放在了浮點和矩陣運算上,使得GPGPU和VPU很難適合那些在邊緣計算機中需要加速的其他應用。基于可編程硬件而非處理器的解決方案則提供了自由度,可以優化虛擬神經元之間的數據傳輸。可編程硬件還提供了自由度以適應范圍更廣的、要求邊緣計算機去執行的任務。
產品及技術方向
Achronix多年以來一直在為可編程邏輯領域提供創新,在性能、功耗和成本領先性方面樹立了行業標準。
2013年,Achronix發布了Speedster22i FPGA系列產品,從而推出了業內最先進的FPGA產品,該系列帶有用于高性能有限應用的嵌入式系統級知識產權(IP)產品。Speedster22i系列產品是首款特定應用型FPGA芯片,支持了全新的、具有創新性的高性能可編程設計。
2016年10月,Achronix宣布其可集成至客戶SoC中的Speedcore嵌入式FPGA(eFPGA)IP產品開始供貨;在發布此消息時,Achronix已經向多家客戶交付了Speedcore IP。從那時起,對Speedcore IP的需求空前高漲。Speedcore eFPGA IP是專為人工智能/機器學習(AI/ML)、高性能計算、汽車、5G無線通信和網絡等應用設計的。它和Speedster22i FPGA基于同一種高性能架構。
Achronix的所有產品都得到了我們自己強健的、經過驗證的ACE設計工具的支持。ACE是一款功能強大的EDA工具,可以支持邏輯綜合、布局和布線,還可提供時序收斂和調試工具。ACE工具可免費用于評估。
Achronix最近宣布已完成一款在16nm工藝上驗證了 Speedcore的測試芯片,該芯片采用臺積電(TSMC)的16FFplus-GL工藝制造,擁有11層金屬疊層;其中的一個高性能Speedcore eFPGA內核包含40,000個查找表、48個大小為20Kbit的RAM單元塊和72個DSP64單元塊。Achronix正在積極開發其7nm產品,并計劃也將于近期將該產品推向市場。
中國市場策略
2017年是Achronix取得突破性發展的一年,公司成為了全球增長速度最快的半導體公司之一。公司在2017年實現了巨大的增長,營業收入比上年增長7倍且超過1億美元。我們的所有產品都可為中國市場供貨,包括Speedcore、Speedster22i等等,中國是Achronix最重要的市場之一。
Achronix面向全球客戶提供產品和服務,在中國設有專門的銷售和應用工程支持機構。Achronix的客戶橫跨數個目標市場,從人工智能和機器學習到自動駕駛、高性能計算和5G無線通信均有所覆蓋。憑借特定領域的專業知識和客戶在這些目標應用上取得的成功,以及強大的工程支持團隊,Achronix已經完全做好準備來用自己基于FPGA的硬件加速技術和產品為中國半導體行業的快速增長提供鼎力支持。
評論