詳解人工智能芯片 CPU/GPU/FPGA有何差異?
4.GPU行業的佼佼者:Nvidia
本文引用地址:http://www.104case.com/article/201704/346122.htm目前全球GPU行業的市場份額有超過70%被英偉達公司占據,而應用在人工智能領域的可進行通用計算的GPU市場則基本被英偉達公司壟斷。
2016年三季度英偉達營收為20.04億美元,較上年同期的13.05億美元增長54%;凈利潤為5.42億美元,較上年同期的2.46億美元增長120%,營收的超預期增長推動其盤后股價大幅上漲約16%。以面向的市場平臺來劃分,游戲業務營收12.4億美元,同比增長63%,是創造利潤的核心部門;數據中心業務營收2.4億美元,同比增長193%,成為增長最快的部門;自動駕駛業務營收1.27億美元,同比增長61%,正在逐步打開市場。

這樣的業績創下了英偉達的歷史最好季度收入,但這并非是其股票暴漲的理由,事實上,在過去的六年里,英偉達的業績基本一直呈現上升趨勢。從2012年財年至2016財年,英偉達的營業收入實現了從40億美元到50億美元的跨越,而其凈利潤也從2012財年的5.8億美元逐步上升到了2016財年的6.14億美元。但在此期間,英偉達的股價并未出現翻番式的增長。
真正促成英偉達股價飆升的是人工智能的新市場。在剛剛過去的2016年,英偉達的股價上漲了228%,過去的5年內累計上漲500%。500億美元的市值將會持續給英偉達帶來40倍的市場收入,這幾乎是業內擁有最高收益的公司。
5.Nvidia的市場定位:人工智能計算公司
自1999年發布第一款GPU以來,GPU就成為了英偉達最為核心的產品,占到了英偉達總營業收入的八成,而英偉達也以顯卡廠商的身份進入人們的視線。這些芯片最初是以板卡的形式出售給游戲玩家的,游戲玩家需要自己動手將芯片裝到PC主板上,從而擁有更快的3D圖形處理速度。他們的產品命名也很有講究,用“GeForce”這樣具有超能力的字眼來開辟市場。
今日的英偉達,已經不再是一家單純的顯卡技術廠商,他現在很趕時髦地稱自己為“人工智能計算公司”。據英偉達官網數據顯示,2016年,有近兩萬家機構將英偉達產品用于深度學習加速計算,相比2014年翻了13倍。醫療、生命科學、教育、能源、金融、汽車、制造業以及娛樂業等諸多行業均將得益于海量數據的分析。
谷歌、微軟、Facebook 和亞馬遜等技術巨頭大量購買英偉達的芯片來擴充自己數據中心的處理能力;Massachusetts General Hospital等醫療研究機構用英偉達的芯片來標記CT掃描圖片上的病變點;特斯拉將在所有的汽車上安裝英偉達的芯片來實現無人駕駛; June等家電公司用英偉達的芯片制造人工智能驅動的家用電器。在人工智能到來之前,英偉達從來都沒有處于一個如此巨大的市場的中心,這也充分表明了一個事實,那就是英偉達在GPU的計算處理技術上無人能及。
同時,英偉達還在投資不同領域里新興的、需要借助深度學習來構建業務的公司,使這些公司能夠更好地借助其提供的人工智能平臺起步,這類似于以前一些初創公司通過微軟Windows來構建服務以及最近通過iTunes來發布應用。

6.Nvidia的核心產品:Pascal家族
英偉達的傳統強項是桌面和移動終端的GPU,但是堅定地向著人工智能大步邁進的英偉達顯然已經不滿足于僅僅在單一領域做提高GPU性能的事了。相比于傳統的計算密集型GPU產品來說,英偉達努力的方向是使得GPU芯片不僅僅只針對訓練算法這一項起到作用,更是能處理人工智能服務的推理工作負載,從而加速整個人工智能的開發流程。目前該公司的核心產品包括基于Pascal架構的TeslaP4與Tesla P40深度學習芯片,這兩款芯片均已于2016年第四季度開始投入量產。
Tesla P4為資料中心帶來最高的能源效率
其小尺寸及最小50瓦特的低功率設計可安裝于任何服務器內,讓生產作業負載推論的能源效率達CPU的40倍。在進行視頻推論作業負載時,單一服務器裡安裝單顆Tesla P4即可取代13臺僅采用CPU的服務器,而包含服務器及用電量的總持有成本則能節省達8倍。
Tesla P40為深度學習作業負載帶來最大的處理量
一臺搭載8顆Tesla P40加速器的服務器擁有每秒47兆次運算的推論性能及INT8指令,可取代140臺以上的CPU服務器的性能。若以每臺CPU服務器約5,000美元計算,可節省65萬美元以上的服務器采購成本。
基于上述兩種人工智能芯片,英偉達為資料中心提供唯一的端對端深度學習平臺,并能夠將訓練時間從數天大幅縮短至數小時,從而實現資料的立即解析與服務的及時回應。
7.Nvidia的應用布局:自動駕駛
不僅僅是底層架構,英偉達在應用層面上也有非常明確的布局,其中最看重也最有領先優勢的就是自動駕駛。早在2014年1月,英偉達就發布了為移動平臺設計的第一代Tegra系列處理器,適用于智能手機、平板電腦和自動駕駛汽車,四個月后,DRIVE PX自動駕駛計算平臺發布,可實現包括高速公路自動駕駛與高清制圖在內的自動巡航功能。同年10月,搭載了Tegra K1處理器并應用了DRIVEPX計算平臺的特斯拉新款Model S開始量產,英偉達成為第一個享受到自動駕駛紅利的廠商。
2016年英偉達在自動駕駛領域并沒有什么重大突破,基本只是從技術升級及廠商合作兩個方面入手,除了特斯拉這個老朋友外,百度、沃爾沃也跟英偉達達成了合作,他們都將生產搭載DRIVE PX 2的智能駕駛汽車。恰逢此時,AI概念變得更加火熱,智能駕駛也逐漸成熟,這些客觀因素讓英偉達收割了更多的紅利,也讓公司站在了聚光燈之下。
從整個自動駕駛行業來看,Google、蘋果、微軟等科技公司都在建立自己的汽車生態體系,不過智能汽車對于他們來說都不是核心業務,更為重要的是,他們并沒有真正進入汽車供應鏈體系。與之相反,英偉達的Drive PX系列自動駕駛解決方案,已經進入了汽車的上游供應鏈中,并創造了利潤,這也意味著英偉達將在汽車芯片市場與英特爾、高通、恩智浦、瑞薩電子等做CPU的公司正面碰撞,自動駕駛的風口讓英偉達在汽車市場從“邊緣人”變成了挑戰者。
隨著特斯拉Model S等備受矚目的車型更加智能化與多媒體化,英偉達有了彎道超車的機會,并有望在汽車產業的上游供應鏈占據更有優勢的地位。最新款的Tegra系列處理器功耗只有10瓦,幾乎與同等級的FPGA產品功耗持平甚至更低,這對于車載移動芯片來說是巨大的優勢。
但同樣的,單移動處理器的架構和極低的功耗必然無法支撐起超大規模的運算,目前英偉達計算平臺的功能定位僅聚焦于高速公路上的自動巡航,而CPU的應用可以拓展至車機娛樂信息系統層面。未來自動駕駛的發展方向必然是整車的控制中心,從目前英偉達基于Tesla架構的主流芯片來看,低功耗、極速運算與邏輯控制是可以同時實現的,英偉達公司在自動駕駛領域的優勢非常明顯。
8.Nvidia的產業優勢:完善的生態系統
與其它芯片公司相比,帶有CUDA的重點軟件生態系統是英偉達占領人工智能市場的關鍵促成因素。從2006年開始,英偉達發布了一個名叫CUDA的編程工具包,該工具包讓開發者可以輕松編程屏幕上的每一個像素。在CUDA發布之前,給GPU編程對程序員來說是一件極其痛苦的事,因為這涉及到編寫大量低層面的機器碼以實現渲染每一個不同像素的目標,而這樣的微型計算操作通常有上萬個。CUDA在經過了英偉達的多年開發之后,成功將Java或C++這樣的高級語言開放給了GPU編程,從而讓GPU編程變得更加輕松簡單,研究者也可以更快更便宜地開發他們的深度學習模型。
四、未來市場:半定制芯片FPGA
技術世界正在邁向一個全新的軌道,我們對于人工智能的想象已經不再局限于圖片識別與聲音處理,機器,將在更多領域完成新的探索。不同領域對計算的需求是差異的,這就要求深度學習的訓練愈發專業化與區別化。芯片的發展趨勢必將是在每一個細分領域都可以更加符合我們的專業需求,但是考慮到硬件產品一旦成型便不可再更改這個特點,我們不禁開始想,是不是可以生產一種芯片,讓它硬件可編程。
也就是說,這一刻我們需要一個更適合圖像處理的硬件系統,下一刻我們需要一個更適合科學計算的硬件系統,但是我們又不希望焊兩塊板子,我們希望一塊板子便可以實現針對每一個應用領域的不同需求。這塊板子便是半定制芯片FPGA,便是未來人工智能硬件市場的發展方向。
評論