Google大腦工程師詳解:深度學習技術能帶來哪些新產品?
這種技術還帶來一些其他可能:
本文引用地址:http://www.104case.com/article/201702/344219.htm· 離線仍保持某些功能可用的虛擬助手;
· 告訴你植物、蘑菇等是否有毒能不能吃的荒野求生應用;
· 自帶TPU(Google的Tensor Processing Unit)芯片[11]、能實現簡單避障、導航功能的小型無人機。
人機交互
深度神經網絡是第一種能真正看見、聽見我們的世界,并且健壯性達到可接受水平的模型,這開啟了很多人機交互的可能性。
現在,我們可以利用攝像頭來識別手語、讀書給人類聽。實際上,深度神經網絡已經可以用完整的句子來描述它們所見。百度的盲人助手小明(DuLight)項目就是一個能把畫面轉換成語音的耳機。
我們的人機交互不局限在視覺相關的領域,深度學習也可以用于校正腦電(EEG)接口,讓截癱人士能更快地與計算機交流,也能為類似手勢識別工具Soli的項目提供更精確的解碼技術。
游戲
在計算上,游戲是非常具有挑戰性的,因為它同時實時運行著物理模擬、AI邏輯、渲染、多玩家互動。這其中很多部件的復雜度都達到了至少O(N^2),因此,我們現有的算法已經觸碰到了摩爾定律的天花板。
深度學習在幾個不同方面推進了游戲能力的邊界。
顯然,有一個方面是游戲AI。在現在的電子游戲中,AI為非玩家角色(NPC)設計的邏輯無非是一串“如果-則-否則”的表述擰在一起,來模仿智能行為。對于高級玩家來說,這種AI不夠智能,導致單人模式下的角色互動在某種程度上缺乏挑戰性,即使在多人游戲中,最聰明的也通常是人類玩家。
深度學習會改變這一狀況。Google旗下DeepMind的AlphaGo向我們展示了深度神經網絡與梯度策略學習結合,可以強大到能在圍棋這樣復雜的游戲中擊敗最強的人類選手。AlphaGo所用的深度學習技術可能很快將用于游戲的NPC上,利用玩家的弱點來提供更吸引人的游戲體驗,其他玩家的游戲數據可以被發往云端供AI學習。
深度學習在游戲中的另一個應用是物理世界的模擬。我們也許可以把非線性動力問題轉換成一個回歸問題,而不用從基本原理出發來模擬流體和粒子。比方說,如果我們訓練一個神經網絡,讓它學習支配流體動力學的基本規律,在游戲中就能快速評價,不需要對N-S方程(Navier-Stokes equations)大規模實時求解。
實際上,Ladicky & Jeong 2015已經這么做了。

對于每秒不能低于90幀的VR應用,這可能是現有硬件限制下的唯一可行方案。
第三,深度生成模型可以用于創建無限豐富的程序性內容,例如動物群、角色對話、動畫、音樂,也許還有游戲的故事線本身。剛剛有游戲開始探索這個領域,例如無人深空(No Man’s Sky)就有潛力成為一款具有無限內容的游戲。

最后,作為蛋糕頂上櫻桃一樣的點綴,深度神經網絡很適合平行小批求值,就是說運行在一塊GPU上的AI邏輯可以同時模擬出128個NPC、32處水流。
藝術助手
由于神經網絡對于圖像、音頻、文本都有著很好的感知能力,我們可以用它來繪畫、作曲、寫小說也就不奇怪了。

多年來,人們一直在嘗試讓計算機作曲、繪畫,不過直到深度學習出現,我們才開始真正生成出“好結果”,現在蘋果的App Store中已經有幾個App為取樂使用了這類算法,但我們可能很快就會看到專業的內容創作軟件中將這類算法用作輔助的生成手段或濾鏡。
非結構化數據挖掘
在從網頁上獲取信息方面,深度學習還沒有達到人類的水平,但是深度神經網絡賦予機器的視覺能力,讓它們足以理解超文本之外的內容。
例如:
· 從掃描的傳單分析事件;
· 識別EBay上哪些商品是相同的;
· 通過攝像頭辨別客戶情緒;
· 不借助RSS從網頁上提取博客內容;
· 將照片信息整合到金融估值工具、保險單、信用評分中。
語音合成
從生成模型的發展水平、數據的豐富程度來看,以摩根·弗里曼或者斯嘉麗約翰遜的聲音讀文章給你聽的應用遲早要出現。我在Vanguard游戲里的密碼就是我的聲音。
其他
自適應操作系統/網絡堆棧調度:在操作系統中安排線程和進程是一個非常難的問題,我們目前還沒有非常令人滿意的解決方案,現代操作系統、文件系統和網絡傳輸協議TCP/IP的調度算法還相當簡單。我們或許可以用小型神經網絡來適應用戶特定的調度模式。
顯微鏡軟件的菌落計數、細胞追蹤(用于生物實驗研究)
“以機器學習替代模擬”的策略已經在藥物設計領域發揮作用,大幅提升了找到哪種化合物有幫助、哪種有毒性的效率。
評論