盤點之人工智能四巨頭
在圖像識別方面,谷歌在8月份收購了一家圖片分析公司Jetpac。Google研究院也發表了一篇文章,表明未來Google的圖形識別引擎不僅僅能夠識別出照片的對象,還能夠對整個場景進行簡短而準確的描述。除此之外,谷歌一直在積極吸引圖像識別和計算機視覺方面的專家參與到谷歌的項目研究中來,比如說向研究計算機視覺和模式識別的助理教授Devi Parikh授予了谷歌內部研究獎項Faculty Research Awards和 9萬美元的無限制基金,并允許她直接同谷歌的其他研究者和工程師進行合作。
根據德勤發布的一份報告顯示,Google在2014年將語音識別的精準度從2012年的84%提升到如今的98%,移動端Android系統的語音識別準確性提高了25%;計算機視覺技術也取得了突飛猛進的發展。如果以計算機視覺技術研究者設置的技術標準來看,自2010年到2014年,圖像分類識別的精準度提高了4倍。
5)總結
總體看來,谷歌在人工智能的布局依然符合它“將全世界的信息聯系起來并給出最佳處理結果”的使命,在這一目標下,谷歌的行為可以大致分成兩個路徑,第一是覆蓋更多的用戶使用場景,從谷歌傳統業務覆蓋的互聯網、移動互聯網延伸到智能家居、自動駕駛、機器人(2013年收購了8家機器人公司)等領域,從而抓取到更多信息,這可以看做是信息積累和輸入的過程。第二個方面是不知疲倦的做好底層人工智能技術的積累,研發更加高級的深度學習算法,增強圖形識別和語音識別能力,從而能對第一階段收集到的信息進行更好的處理和反饋,這可以看做是信息的處理和用戶服務的輸出過程。在這兩個過程下,谷歌就將人工智能滲透到了其各種產品的方方面面,從而為用戶帶來更多的使用場景和更加智能的功能。
百度
中國的搜索巨頭百度公司與谷歌有些類似,都是以互聯網搜索為基礎,都是技術導向型公司,而且在人工智能領域的布局也是走在互聯網行業的前列。我在文章《搜索引擎到人工智能的終極演進》中提到了目前的搜索引擎看以看作是未來人工智能的雛形,依托于搜索本身積累的用戶和數據,再加上云服務、深度學習等技術,很有可能實現從傳統的互聯網搜索服務向人工智能高級形態的進化。而百度的Andrew Ng也在演講中提到了人工智能的正循環——擁有深度學習算法之后,將不再懼怕海量數據,反而會因為數據的增長而取得更好的效果,而這些效果將直接體現在圖像搜索、語音識別等具體的互聯網服務中,從而為用戶提供更好服務并吸引更多用戶,這又會產生更多數據。因此,百度在人工智能領域的布局既表現出了其作為技術公司的敏感性和前瞻性,同時也可以看做是百度走向未來的必由之路。
1)引進Andrew Ng及組建北美研究院
2014年5月,深度學習專家Andrew Ng(吳恩達)加盟百度,并負責同期成立的北美研究中心。由于相對于傳統互聯業務,人工智能的技術門檻相對較高,而對于相關技術人才的引起也就顯得尤為重要。在谷歌和Facebook相繼聘用了Geoffrey Hinton和Yann LeCun之后,百度將另一位人工智能大師Andrew Ng引入,這體現出百度與美國互聯網巨頭谷歌和Facebook在人工智能領域展開競爭的勇氣和實力,而北美研究中心的建立也表明百度將繼續與硅谷的互聯網巨頭爭奪人工智能領域的人才。而Andrew Ng與余凱、張潼、AdamCoates、徐偉等組成的頂尖團隊將會成為百度發展人工智能堅強后盾。
2)大數據積累和平臺開放
大數據是人工智能的基礎,而作為天然的大數據企業,百度擁有強大的數據獲取能力和數據挖掘能力,百度副總裁王勁更是將百度技術布局描繪為一張劍形圖,人工智能、大數據等技術化作劍鋒。百度除了做好數據積累和挖掘以外,還加快了大數據平臺的開放步伐,于2014年4月發布了大數據引擎,向外界提供大數據存儲、分析和挖掘技術,而且在醫療、交通和金融領域有了具體應用。
2014年7月14日,百度憑借自身的大數據技術14場世界杯比賽的結果預測中取得全中的成績,擊敗了微軟和高盛。2014年9月,百度正式發布整合了大數據、百度地圖LBS的智慧商業平臺,旨在更好在移動互聯網時代為各行業提供大數據解決方案。
3)語音識別和圖像識別
2014年12月,美國《福布斯》發布文章稱,吳恩達及研究團隊發明了一種新的語音識別方法,這款基于深度學習的名為“Deep Speech”語音識別系統可以在嘈雜環境下實現將近 81% 的辨識準確率。卡耐基梅隆大學工程學助理研究教授Ian Lane對其的評價是“百度研究院最近的工作有可能顛覆語音識別在未來的應用效果。” 吳恩達表示,該語音識別系統采用深度學習算法取代了原來的模型,在遞歸神經網絡或者模擬神經元陣列中進行訓練,讓語音識別系統更加簡單。同時這套系統還使用了Nvidia等芯片制造商出品的多枚圖形處理器(GPU),這些處理器通過并行連接,能夠用比普通計算機處理器更快的速度訓練語音識別模型,從而提高工作效率。
在圖像識別方面,余凱稱攝像頭成為連接人和世界信息的重要入口之一。而百度也一直在利用深度學習技術來提高圖像識別的精度。2014年9月,百度云結合百度深度學習研究院提供的人臉識別及檢索技術,推出云端圖像識別功能。11月,百度發布了基于模擬神經網絡的“智能讀圖”,可以使用類似人腦思維的方式去識別、搜索圖片中的物體和其他內容。
4)人工智能算法和云計算
百度大腦既需要人工智能算法,也需要云計算中心提供硬件支持。百度大腦通過深度學習來模擬人類大腦的神經元,參數規模達到百億級別,構建了世界上最大規模的深度神經網絡。
百度在國內擁有十幾座云計算中心,為滿足人工智能在計算和存儲上的高要求,還投入使用了4萬兆交換機,并在探索10萬兆交換機。百度還是全球首家將GPU用于人工智能和深度學習領域、并規模化商用ARM服務器的公司。百度將這些整合在一起,就形成強大的存儲計算能力,從而可以進行多樣的并行計算,支持生成、配置針對不同應用和場景網絡結構,從而為人工智能提供有力的硬件支持。
5)自動駕駛項目
2014年9,百度宣布已經與寶馬正式簽署合作協議,共同研發自動化駕駛技術。其中,百度的三維地圖及相關數據服務也將被融入寶馬的車輛導航系統中,為自動駕駛汽車提供技術支撐。雙方計劃在接下來三年時間內,合作研究高度自動化駕駛在中國道路環境下面臨的技術挑戰,通過智能技術加強道路行駛安全性,減少交通事故及人員傷亡。
6)總結
百度在人工智能領域的布局可以總結為三點,第一,具有戰略眼光,與世界科技巨頭保持同步;第二,自身技術基因又使其非常注重技術人才的引進和人工智能底層技術的積累;第三,互聯網入口的地位和豐富的產品線使得人工智能技術能夠迅速落地,轉化成具體的產品和服務。也正因如此,2014年11月首屆百度技術節才會以“奇點臨近 技術引領未來”為主題,展望如何通過人工智能來改變世界。
評論