新聞中心

        EEPW首頁 > 智能計算 > 業界動態 > 國內AI芯片百家爭鳴,何以抗衡全球技術寡頭

        國內AI芯片百家爭鳴,何以抗衡全球技術寡頭

        作者: 時間:2018-04-04 來源:中科院自動化所集成中心 收藏
        編者按:在人工智能芯片領域,國外芯片巨頭占據了絕大部分市場份額,不論是在人才聚集還是公司合并等方面,都具有絕對的領先優勢。而國內人工智能初創公司則又呈現百家爭鳴、各自為政的紛亂局面。

          國外:技術寡頭,優勢明顯

        本文引用地址:http://www.104case.com/article/201804/377915.htm

          由于具有得天獨厚的技術和應用優勢,英偉達和谷歌幾乎占據了人工智能處理領域 80% 的市場份額,而且在谷歌宣布其 Cloud TPU 開放服務和英偉達推出自動駕駛處理器 Xavier 之后,這一份額占比在 2018 年有望進一步擴大。其他廠商,如英特爾、特斯拉、ARM、IBM 以及 Cadence 等,也在人工智能處理器領域占有一席之地。


        blob.png


          當然,上述這些公司的專注領域卻不盡相同。比如英偉達主要專注于 GPU 和無人駕駛領域,而谷歌則主要針對云端市場,英特爾則主要面向計算機視覺,Cadence 則以提供加速計算相關 IP 為主。如果說前述這些公司還主要偏向處理器設計等硬件領域,那么ARM 公司則主要偏向軟件,致力于針對機器學習和人工智能提供高效算法庫。


        blob.png

          注:上述表格中所給為截止到 2017 年各研制單位公開可查的最新數據。

          獨占鰲頭——英偉達

          在人工智能領域,英偉達可以說是目前涉及面最廣、市場份額最大的公司,旗下產品線遍布自動駕駛汽車、高性能計算、機器人、醫療保健、云計算、游戲視頻等眾多領域。其針對自動駕駛汽車領域的全新人工智能超級計算機Xavier,用 NVIDIA 首席執行官黃仁勛的話來說就是 “這是我所知道的 SoC 領域非常了不起的嘗試,我們長期以來一直致力于開發芯片。”

        blob.png


          Xavier是一款完整的片上系統 (SoC),集成了被稱為 Volta 的全新 GPU 架構、定制 8 核 CPU 架構以及新的計算機視覺加速器。該處理器提供 20 TOPS(萬億次運算 / 秒)的高性能,而功耗僅為 20 瓦。單個 Xavier 人工智能處理器包含 70 億個晶體管,采用最前沿的 16nm FinFET 加工技術進行制造,能夠取代目前配置了兩個移動 SoC 和兩個獨立 GPU 的 DRIVE PX 2,而功耗僅僅是它的一小部分。

          而在 2018 年拉斯維加斯 CES 展會上,NVIDIA 又推出了三款基于 Xavier 的人工智能處理器,包括一款專注于將增強現實(AR)技術應用于汽車的產品、一款進一步簡化車內人工智能助手構建和部署的 DRIVE IX 和一款對其現有自主出租車大腦——Pegasus 的修改,進一步擴大自己的優勢。

          產學研的集大成者——谷歌

          如果你只是知道谷歌的 AlphaGo、無人駕駛和 TPU 等這些人工智能相關的產品,那么你還應該知道這些產品背后的技術大牛們:谷歌傳奇芯片工程師 Jeff Dean、谷歌云計算團隊首席科學家、斯坦福大學 實驗室主管李飛飛、Alphabet 董事長 John Hennessy 和谷歌杰出工程師 David Patterson。

          時至今日,摩爾定律遇到了技術和經濟上的雙重瓶頸,處理器性能的增長速度越來越慢,然而社會對于計算能力的需求增速卻并未減緩,甚至在移動應用、大數據、人工智能等新的應用興起后,對于計算能力、計算功耗和計算成本等提出了新的要求。與完全依賴于通用 CPU 及其編程模型的傳統軟件編寫模式不同,異構計算的整個系統包含了多種基于特定領域架構(Domain-Specific Architecture, DSA)設計的處理單元,每一個 DSA 處理單元都有負責的獨特領域并針對該領域做優化,當計算機系統遇到相關計算時便由相應的 DSA 處理器去負責。而谷歌就是異構計算的踐行者,TPU 就是異構計算在人工智能應用的一個很好例子。

        國內AI芯片百家爭鳴,何以抗衡全球技術寡頭

          2017 年發布的第二代 TPU 芯片,不僅加深了人工智能在學習和推理方面的能力,而且谷歌是認真地要將它推向市場。根據谷歌的內部測試,第二代芯片針對機器學習的訓練速度能比現在市場上的圖形芯片(GPU)節省一半時間;第二代 TPU 包括了四個芯片,每秒可處理 180 萬億次浮點運算;如果將 64 個 TPU 組合到一起,升級為所謂的 TPU Pods,則可提供大約 11500 萬億次浮點運算能力。



        關鍵詞: AI 神經網絡

        評論


        相關推薦

        技術專區

        關閉
        主站蜘蛛池模板: 花莲县| 威宁| 韶山市| 湖南省| 静安区| 韩城市| 来宾市| 仁布县| 吉首市| 内乡县| 龙口市| 鱼台县| 东明县| 霍山县| 阿巴嘎旗| 江山市| 温泉县| 三亚市| 万载县| 桦甸市| 剑阁县| 运城市| 莒南县| 日喀则市| 汕尾市| 永嘉县| 自贡市| 忻州市| 中方县| 仁怀市| 凤山市| 抚宁县| 神池县| 沧州市| 临猗县| 昌江| 宽城| 昭通市| 万宁市| 内乡县| 兴城市|