架構與ISA:移動處理器的真正關鍵
我最近參加了the Linley Tech Mobile Conference (Linley Tech移動技術研討會),這是每年在硅谷連續舉辦兩天的技術研討會,聚焦于移動處理議題。參與的廠商包括Synopsys、英特爾、GLOBALFOUNDRIES、高通(容我補充,這些都是Imagination日益壯大的生態系統伙伴)以及其他許多公司。
本文引用地址:http://www.104case.com/article/201610/307487.htm今年,在圣塔克拉拉熟悉的景色和Hyatt Regency酒店中,這場盛會再度登場。這是讓媒體、分析師、資深工程師和經理人等眾多科技產業從業人員齊聚一堂的好地方。
我的簡報是排在第三個議程,主題為移動CPU。我解釋了為什么盡管所有的趨勢都朝高端軟件開發和抽象級發展,而不重視底層的CPU與GPU指令集架構(ISA)。但是當設計CPU、GPU和移動裝置用的其他處理器時,利用從一開始就為可擴展性建構的高效處理架構還是會帶來顯著的差異。
功率和日益縮短的產品開發周期 ─ 移動處理器的競爭態勢
移動產品開發目前面臨著兩個非常不同的挑戰,這些挑戰限制了運算技術進展的腳步,并又返過來直接影響到移動應用處理本身。
一方面,功率是每一家主要處理器IP和芯片供應商試圖主導市場的終極戰場。因此,系統設計人員必須謹慎在高效能和低功耗間取得平衡,這也影響著每個SoC設計的重大決定。此議題已經主導了28納米設計,并將會繼續影響20納米以下的SoC設計。但更重要的是,散熱議題已成為超越移動應用領域,從嵌入式運算和移動運算擴大到網絡、M2M和物聯網等各種市場的關鍵考慮方面。
我們遭遇的另一個重大挑戰是產品開發周期越來越短。過去,18~24個月的開發周期是常態,但現在我們看到有些客戶將時間縮短到每6~12個月就推出新款芯片。這需要投入龐大的設計工作,而且當產品要滿足不同層級市場的需求時,耗費的研發精力會更大。
融合趨勢使得一些傳統以來不會快速推出新產品的市場也大幅加速了設計周期,像是智能電視、便攜式游戲機或連網汽車都需要采用最新科技,才能獲得已習慣于使用口袋卡片個人計算器的消費者青睞。
不管是針對重復使用或是能夠更妥善地在單一芯片上分配不同的運算資源,程序代碼可移植性都是解決低功耗與縮短開發周期挑戰的解決方案。這是異構處理革命的基礎,也是能將這一愿景變成現實的技術,同時可避免程序代碼對低端硬件的依賴性。今天的CPU會執行許多通用軟件,但是,現有SoC各功能方塊的利用率必須提升,才能適應未來效能增加的需求。LLVM便是一個很好的例子,它免除了程序對底層ISA的依賴,并能實現程序代碼橫跨不同裝置與架構的可移植性目標。
PowerVR GPU推升異構處理效率
Imagination的PowerVR ‘Rogue’ 架構 可為移動裝置提供約1 TFLOPS的效能。定義系統效能和特性的一個重要部分F已與繪圖和這些高度平行處理器的運算潛能有關。
傳統以來,繪圖效能主要是用來推動裝置的顯示功能。

但由于繪圖處理具備了足虻墓δ埽所以提升SoC的效率將取決于發揮GPU的潛力。這可通過新的和增強的API、可擴充軟件解決方案和統一的編程環境來實現。
重新認識RISC架構概念
盡管此趨勢已逐漸興起,CPU仍然是系統中主要且最常用的通用可編程單元。Imagination的MIPS架構發展可追溯到30年前John Hennessy和他的團隊將編譯程序理論的專業知識帶到單純的RISC架構構建中,推動了優化編譯程序的進展。
30年之后,這樣的想法剛好與業界期望在運行期間采用JIT/動態編譯程序技術,以向程序代碼可移植轉移的趨勢相同。MIPS ISA的特性包括每指令單一運算、簡易尋址模式、非預測執行或非整數條件位等,可為現實世界帶來實際效益,以協助系統設計人員實現更高的效能,開發出高頻執行的高端、超標量、亂序CPU,并同時保持低功耗特性。
也就是說,盡管這些技術能讓業界脫離底層ISA的歷史包袱,但固有的架構特性對動態編譯效能、如何有效地將架構構建在芯片中,以及支持開放標準與操作系統來說,仍然非常重要。
proAptiv CPU是Imagination無須妥協的MIPS架構如何能帶來高效能、低功耗CPU的最好例子。舉例來說,架構中缺乏預測性指令可簡化分支預測方法的建構,這是proAptiv CPU具備領先的同級預測效能的主要原因。

進一步提升的架構效率與微架構設計選擇,使得此核心在推出時便能提供同類產品的最高CoreMark/MHz CPU分數,與競爭性CPU方案相比,面積更是縮小了約60%。
移動CPU ─ 不僅是應用處理器
但應用處理器不僅是移動SoC中的CPU。其他的功能,像基帶中的通信處理,它與移動裝置的網絡功能有關,也非常重要,而且也能受益于其它的架構特性。多線程處理器能以與單核心CPU相近的面積與功耗提供更高效能。
這能通過內置的硬件調度器和輸出限定器(yield qualifier)?,來實現更佳的實時/確定性處理需求和服務質量(QoS)。運用我們的多線程和多核解決方案,客戶能用我們和合作伙伴共同開發的優化LTE基帶堆棧和多家供應商提供的多線程RTOS來建立優異的基帶解決方案。與采用單線程的內核相比,利用此技術能為LTE流量提升37~53%的數據處理量。

總之,異構運算的基本技術已開始用來推動移動運算的發展。Imagination提供廣泛的IP產品組合,以擁抱可擴展、可移植、高度開放和標準導向的未來。我們相信,架構(CPU、GPU或其他)應根據它們的真實效能來相互競爭,產業將不再像過去一樣受限于單一ISA架構,而會有更快速的發展。
評論