將門沈強:智能芯片是人工智能算力創新的基石
“今天是一個半導體行業的盛會,正好將人工智能的軟件要素、硬件要素交融在一起。”將門CTO、將門創投創始合伙人沈強在集微半導體峰會上從算法、算力和數據的角度談了人工智能的不同創新模式。
本文引用地址:http://www.104case.com/article/201709/364721.htm2017年9月15日,由集微網、手機中國聯盟主辦,廈門半導體投資集團公司承辦的“集微半導體峰會”在廈門海滄舉行。此次峰會以“‘芯’聯產業,積微成著 ”為主題,同期舉辦的人工智能論壇專場,來自將門創投、碼隆科技、偉景智能、悅享趨勢科技和元鼎音訊的企業高層、人工智能產業界的優秀人才等圍繞當前熱點話題、核心技術以及大家共同關注的市場動向,重塑熱點話題,解析趨勢變化,洞悉行業變革。
沈強作為此次人工智能論壇的主持,開場介紹將門這家專注于發掘、加速及投資技術驅動型創業公司的創業服務和投資機構,其旗下還設有將門企業用戶對接、將門技術社群以及將門投資基金。
據悉,將門投資基金專注于投資通過技術創新激活商業場景,實現商業價值的初創企業。關注領域包括機器智能、物聯網、自然人機交互、企業計算。在一年時間里,將門投資基金已經投資了包括量化派、碼隆科技、偉景智能、禾賽科技等超過10家具有高成長潛力的技術型創業公司。
據沈強介紹,將門聚焦在“MINE”四個主要領域,其中M是機器智能,I是物聯網相關,從物聯網通訊、傳感器、數據處理、物聯網應用。N是自然人機交互,E網是企業計算,包括云計算,企業應用,信息安全等。
Gartner數據顯示,未來兩年到三年的時間內,人工智能將會進入一個泛應用的時間點。沈強進一步指出,從人工智能的技術成熟度的曲線來看,現在這個時間點剛剛好。目前,人工智能主要是數據驅動型的方式,深度學習在里面起了很關鍵的作用。然而,從創新角度來講,可以從人工智能的三要素,算法、算力和數據三個角度出發,尋找合適的應用場景落地,再將其轉化成商業價值。場景的創新等于商業價值的創新,算力的創新可以理解為硬件創新,算法的創新理解為軟件創新,結合起來從是軟硬結合的方式共創人工智能的新精彩。
從創新場景來看,除了規模宏大的交通、運輸等方面,人工智能的商業價值無處不在,需要我們去深挖。沈強通過一個消費實例來告訴現場的嘉賓,即使一個微小的應用場景,當結合上人工智能的時候,便能夠激活一個創新的場景,實現商業價值。他講道,有一段時間經常在外面出差,家里的貓無人照料,便選用了一款自動喂貓的機器,每天定時喂養家里的貓,這是一個極其細分極其細小的市場。在使用過程中遇到一些問題,便聯系到做寵物喂養、自動喂食器公司的老總聊了一下,詢問未來在這一領域想做的創新,發現其實跟人工智能有很大的關系。在喂食器上面添加一個攝像頭,既可以給主人做遠程監控使用,還能夠做貓臉識別,為不同年齡階段的貓、不同健康狀況的貓做個性化的喂養服務。“這對我來說是一個教育,如此微小的市場,通過與人工智能的結合便能夠激活一個創新的應用場景。”
從算法來看,人工智能的發展離不開深度學習模型,而深度神經網絡更是其中最重要的一部分。過去十幾年來,從2012年DiagonalLineNode開始,神經網絡的結構一直在持續的發展中。2015年其實是一個關鍵節點,微軟研究院提出的深度高達152層的神經網絡,視覺計算組的系統錯誤率已經低至3.57%,首次實現了對人類視覺能力的突破,這意味著在商業可行性上,它可以在某些特定場景下取代人發揮作用。神經網絡的層數逐漸增多,由此帶來了巨大問題,軟件方面的改進對硬件也提出了需求。如此復雜的網絡,無論在服務器端還是設備端,都對其計算能力提出了更高的要求,如此才能夠讓高精度的識別能力重現。
一直以來,深度學習的算法都用來處理圖像、識別聲音,集中在識別圖片中的一只貓或者一個只狗,再進一步分類+定位,標注出其在圖中的區域和位置。隨著深度學習算法與自然語言的 結合處理,可以用于對象的檢測,把多只貓、多只狗、多個人分開,進一步做實際分割,逐步應用在安防、機器人應用。沈強表示,其實在固體識別的檢測方面,過去用R-CNN算法可以達到53.3%,而現在用FasterR-CNN可以達到83.8%。從圖像分割延伸至視頻處理,目前越來越多的深度學習算法可以很好的做視頻分割操作,以識別出視頻中哪一幀哪一個像素屬于哪一個對象,可以用于人臉識別、刷臉識別等應用。
深度學習的發展方向就是算法的創新,沈強指出從監督學習到半監督學習/無監督學習的演化過程,從依賴于大數據到只需要小數據,One-Shot Learning。我們知道,監督學習是依賴于標簽過的數據,今天我們講說那些人臉識別精度達到多少,以及我們在ImageNet里面,這個紅線上展示的都是標簽過的數據,它使我們了解到從數據挖掘智能、挖掘知識的年代。但站在我們的角度來看,這并不應該成為固守的一個方向。為什么呢?大量的數據都未標簽過,這都是成本,而成本將阻礙進一步創新,擁有數據的大型企業在人工智能的發展過程中會占據有利地勢,我們怎么樣讓那些創新的想法更快的涌現出來呢?
如果說人工智能的下一步是算法,能夠不依賴于大量數據或者不依賴于標簽過的數據,可以用廣泛的無標簽的這些數據,這將大大降低我們數據處理的成本,本質上使人工智能變得更加民主,無論大企業或小企業都能自主的參與到這一競爭中。為什么ImageNet今年之后將成為絕唱?沈強表示,因為他們的組織者認為在標簽法數據的學習上面已經獲得一定成績,如果再往下做探索的話,會比現階段更有意義的途徑。我們要相對成熟的看問題,往前跳一步去解決那些無標簽的數據,WebVISION競賽就應運而生,它取代了ImageNet的競賽,其主要特點便是采用的數據都是無人工標注的。可喜的是無論ImageNet或是WebVISION,中國參賽者都獲得了世界領先的成績,其中碼隆科技便在WebVISION獲得第一名的傲人成績。
當深度無監督的學習被應用起來時,通過不同的算法計算出不同的內容,根據條件生成的自動網絡,或是對抗式的神經網絡。我們不必在意兩種算法的區別,因為都會指出一條道路,人工智能不僅可以用于認知事情,還可以創新更有意義的內容。從波音公司利用對抗式神經網絡設計機翼,利用算法以解決生活中的具體問題;從視頻預測利用對抗式神經網絡觀察未來發展,預測危險的可能性,預防更多危險的情況發生;Deepmind通過算法的創新強化學習的創新,以尋找規律、建立模型,這種通用人工智能的創新對半導體產業的發展非常有意義。“算法的創新提供無限的可能性,這將為未來更多的應用場景落地提供槍支彈藥。”沈強補充道。
在算力方面,智能芯片是人工智能的基石,機器學習很大程度上依賴于一個強大計算的基礎設施。沈強指出,深度學習的計算量太大,目前有兩種類型的計算,基于訓練或基于推理的。訓練可以讓系統學習數據、獲得模式,而推理是以訓練好的模型或意境學到的知識,去應用判斷未來的過程。這也是為什么Nvidia股票去年漲了四倍,巨大的計算量催生對更高速的計算架構的需求。包括微軟、亞馬遜等公司都已開始構建相應的云服務,華為與寒武紀在麒麟970在終端上的合作,提供深度計算加速的設施,英特爾耗費100多億美元去購買人工智能的企業,實際上就是其背后所提供的計算架構更適合人工智能對算力的需求。
從CPU、到GPU、FPGA深知專用電路應用于不同的場景,我們可以看到演進還在持續不斷的發生,適合于不同的應用場景下面,甚至于最夸張的,像Google Brain項目利用超并行的方法,在一個芯片上有16000多個核,16個芯片作為一個組,再裝載到機器里面,所以它一臺服務器里面有256萬個內核。沈強表示,類似這樣的創新,包括GoogleTPU的創新,我們在行業里面也看到很多不停的涌現出來,包括專門做視覺的,也有一些不是通用的,而是做一些專用領域的。從蘋果iPhone X,這個每秒6500億次計算的小的超小型計算機,到華為Mate 10,這一高達1.92萬億次的計算能力的計算機,未來要處理的場景還需要無數的模型加載,需要更多深層設施,有不同的神經網絡在里面,以滿足各種各樣的應用場景對巨大計算量的需求。
最后沈強總結道,從場景創新、軟件創新和硬件創新,越來越多的創新技術出現,人工智能逐步走入包括消費電子、健康、金融、零售等的各行各業。人工智能正滲透到行業,成為重塑每一個行業的關鍵力量。如何將創新技術轉換成商業價值,人工智能的業務價值將從2B、2C的方面體現出現,無論哪一層的實現都離不開軟硬的結合。無論是安防、無人機、甚至未來數萬億市場的自動駕駛,以及由亞馬遜Echo所引領的智能語音交互,都需要硬件上的感知執行系統,軟件上優異的用戶服務體現,背后更需要先進的人工智能技術、相應的算法和基礎設置,正是需要技術的相互結合,為人工智能行業和半導體行業的結合提供很好的合作契機。
評論