新聞中心

        EEPW首頁 > 消費電子 > 業界動態 > 百度的人工智能終于來了,但還差了點意思

        百度的人工智能終于來了,但還差了點意思

        作者: 時間:2017-02-21 來源:DoNews 收藏

          2017/2/16有兩條關于的消息很有意思:一條是收購渡鴉團隊,一條是把度秘團隊升級為度秘事業部,兩邊都向陸奇匯報工作。這種軟硬融合的戰略選擇是極其正確的。這并不是馬后炮,我在2016年10月發的《雖然很投入,但李彥宏可能正在錯過》里核心觀點之一就是:是國內對投入力度最大的公司,但其不碰硬件的戰略很可能導致它最終錯過里對它最關鍵的部分。雖然大方向正確,但如果互聯網公司真想學亞馬遜,就還差了那么一點東西。

        本文引用地址:http://www.104case.com/article/201702/344218.htm

          語音賽道的AI到底需要解決什么問題

          國內絕不缺和Echo類似的產品,但此前的命運都是折戟沉沙,這里的關鍵在于對什么是這類產品上要解決的核心問題認知不清。自由交流,喚醒詞,速度,方言,內容,習慣等每個似乎都可以成為要解決的核心問題,但實際上所有這個賽道上玩家最核心的問題是:

          在語義、方言這些剛性約束不突破的條件下打造出速度、精度、內容相匹配的產品。

          智能語音也就是說要解決的并非寬適配問題,而是要在面對主流人群真在技術上下功夫,把體驗做好。語音交互上糊弄的空間極小,兩句話就能感受出體驗咋樣。

          這里面最受關注的是語義的問題,因為人們總是向往自由的交流,語義肯定是交互的一個瓶頸,但我們可以把語音交互根據語義的技術進展分解為兩個階段:

          第一階段是語義并沒有核心突破,也就是說最理想狀態也就達到75分。這時候打造產品的根本出發點是不指望自由語言交流,而讓語音交互偏命令控制,但也打造出極為優秀的用戶體驗。Echo大的定位就是這樣一種產品。這時候產品的核心瓶頸是前端的聲學(麥克風陣列+聲學算法),這是眼下的問題,不解決產品體驗不可能好。基于這判斷我在2015年末開始使了很大力氣為公司尋找公司,最終這也是我2016年投資聲智科技的核心原因,當時邏輯很簡單:這個問題顯然中科院聲學所更擅長解決,而聲智科技幾乎是聲學所人員所創辦的唯一的一家AI企業。

          第二階段是語義真的取得突破,這無疑會更大的擴展語音交互的應用范圍,一旦這個點得以突破,語音交互會變的無處不在,但我們必須承認什么時候語義能夠徹底解決仍然不確定,這是屬于未來的事情。

          這種時間軸上的錯亂是很可怕的,那樣就會在現有產品上挑戰不可能解決的問題,比如不用喚醒詞,指望Echo這類產品什么都能干等。

          總結來看我們可以這樣講:如果真想做出Echo那樣的產品,聲學(麥克風陣列+算法),語音識別,語義三層里面眼下的瓶頸是聲學,未來的瓶頸是語義,前者影響現在產品賣不賣的出去,后者影響適用范圍的大小。但即使只是前者這也是一個足以對標Pad的新品類。

          差的那么一點點

          真走軟硬融合的道路,顯然的關鍵要素是:良好的產品定義,足夠成熟的技術要素,系統整合產品的能力(其實還有通暢的銷售渠道)。系統整合一項要求一個公司整合軟硬團隊,否則不同利益訴求會導致軟硬團隊很難高度配合,而在產業初期,不同層次間接口標準化很差,容易導致產品夭折。產品定義則高度依賴于個人,就看當事人的能力,對公司而言需要一點運氣。

          這樣一來唯一欠缺的是足夠成熟的技術要素。

          這是非常麻煩的一點,對于互聯網公司尤其艱難,因為真往這條路上走欠缺的并非是計算機算法上的認識,也還牽扯物理,這對于互聯網公司是個大大的盲點。

          從這個視角正好可以理解蘋果和Google的差別,蘋果是要高度關注物理層面的東西的,比如材料、電池、屏幕、傳感器等,Google顯然會更關注算法。所以蘋果的云端技術始終不好,而Google做產品就也總是一般。喬布斯萬眾矚目所以大家看到的是他的偏執、癲狂乃至藝術氣息,但實際上他背后是有一坨人在幫他解決物理上的麻煩事的,現在的庫克就是其中之一。

          這并不只是一個公司的問題,而是新時代趨勢對互聯網公司的一種系統型挑戰。我在之前的文章中曾經提到過,一個行業的興起事實上是三個大的階段:

          第一階段是Enabling技術的成熟,類比的話就是手機上的高通和MTK,在語音產業鏈上聲智科技扮演類似的角色。

          第二階段是硬件產品的成熟,類比的話就是Apple II或者iPhone 1代,在語音產業鏈上就是Echo。需要注意Echo是起點而不是終點,是剛跨過可用線的一款產品。

          第三階段才是新硬件平臺上軟件應用的成熟,比如PC上就是Office,手機上就是微信。在語音產業鏈上這點還沒展開。

          互聯網縮短了第一階段和第二階段間的過渡過程,相當于兩者在同步發生,也正因此才需要軟硬融合。但互聯網公司獨自解決第一個問題能力會偏弱,這就是欠缺的那一點點。

          硝煙會從今日起

          也許是為了提振股價,百度十分高調的公布了這件事情。這也很有意思,因為百度這樣做很可能會引起連鎖反應。在這之前,大家基本都處于觀望狀態,當其中一個真的下注后,別的人就會開始系統考慮這件事情別人做成了對我會有什么樣的影響。

          這事一旦開始推敲,騰訊、阿里就會認識到這是自己輸不起的戰爭。

          這點我在之前的文章里提到過,但很有必要在百度采取行動的時候再次重述:

          我們先做個基本的假設,那就是Alexa獲得了巨大成功(Echo、智能音箱、Alexa有關聯,但其實是不同的東西,這點在之前文章中有說,這里不再重復),滲透到各種設備之中,包圍了人們的生活,人們有50%的時間在通過語音和設備打交道,并且日活逼近Android。

          那這時候一定會衍生這樣的需求,用戶會說:Alexa,幫我通知下馬化騰,明天我不見他了。這時候就需要有一種通訊的IM來實現這種需求。這時候亞馬遜就有兩個選擇:第一它接入一種已有IM,比如Whatsapp,或者Skype。第二種是自己做一個嵌在Alexa里面。亞馬遜至少有一半的幾率會選擇后者,而不是把這種基礎設施開放給別人,因為前兩種要么屬于Facebook,要么屬于微軟。如果在中國是阿里巴巴做成了Alexa,那估計百分百不會選擇對接微信。這樣一來配合一個語音交互的核心特征,顛覆性的事情就出現了:

          語音交互背后隱藏的各種應用具有唯一性。

          我們很難想象這種語音交互方式:Alexa幫我用Whatsapp給馬化騰留個消息,明天我不見他了。在語音交互中WhatsApp這類應用的標識很可能會被優化掉。如果Alexa還只是百萬級、千萬級DAU的應用時那這個特性還不關鍵,但如果它是10億DAU的系統,那這個特性的影響就會被無限放大,也就說搜索、IM、電商很可能都只有一家,而不是像現在雖然少,但還有個1,2,3名。

          小結

          今天幾乎已經沒人再懷疑語音交互的成立了,有意思的事情是這種變化只發生在過去不到半年的時間里。現在看2017年的熱鬧很可能在這里發生,這是件牽連極廣的事情:它會牽涉人工智能(聲學、語音語義公司),它會升級智能硬件公司,原本的智能硬件其實已經被鄙視了,但Echo顯然不是什么萬物互聯賽道而是人工智能賽道。

          好吧,想做的要盡快進來,不想做這個行業的,可以搬個板凳看熱鬧了。



        關鍵詞: 百度 人工智能

        評論


        相關推薦

        技術專區

        關閉
        主站蜘蛛池模板: 南丹县| 清水县| 台江县| 梁平县| 临沂市| 扬州市| 绥中县| 葵青区| 驻马店市| 竹溪县| 台安县| 湛江市| 通榆县| 镇雄县| 逊克县| 广宁县| 文山县| 永和县| 镇坪县| 磐石市| 资溪县| 建德市| 邵武市| 卢湾区| 南宫市| 富宁县| 荔波县| 昭平县| 太仓市| 西吉县| 潮州市| 南京市| 香格里拉县| 健康| 离岛区| 滨州市| 新竹市| 利川市| 新平| 嘉兴市| 城口县|