新聞中心

        EEPW首頁 > 消費電子 > 業界動態 > 國內外語音識別行業現狀

        國內外語音識別行業現狀

        作者: 時間:2016-08-23 來源:C114 收藏
        編者按:隨著高速發展之后,智能手機和它所帶動的相關產業都陷入了發展瓶頸,機器學習和人工智能被認為是下一個科技熱潮,而語音識別也會趁著這個風口飛起來,國內語音行業也可謂是百花齊放,尤其是最近幾年,不僅涌現了很多國內外的小公司,而且巨頭們也開始加速語音識別行業的布局。

          3、國內外巨頭布局的策略差異

        本文引用地址:http://www.104case.com/article/201608/295872.htm

          上面歷數了國內外各個巨頭陸續建立引擎的過程和優勢技術,有一點我們還是要特別留意一下:國外巨頭欲進入行業,首先想到的就是收購初創的團隊,這些團隊大都也在5-20人之間,掌握著一定的優勢技術。顯然收購一家初創團隊很難滿足其戰略發展,因此一旦技術與公司業務融合以后,這些巨頭都會頻繁出手再次收購以補齊短板,逐漸建立起適合自己公司發展的語音識別優勢。

          對于技術相對重要而且技術點又比較分散的科技型公司,國外巨頭一般不會采取收購商業模式公司的那種大手筆來收購,這也是導致Nuance最終無人問津的重要因素。想想也是,巨頭自然不會用別人家引擎以免將來掣肘,何況收購技術類的大型公司無疑也是給自己找了個麻煩。

          國內的語音識別發展脈路沒有那么清晰,剛開始各個巨頭也都是采用專用公司比如、中科信利、云知聲等公司的引擎。后來醒悟過來,紛紛謀求自建,但是除了百度不斷砸入重金后獲得了一定的效果外,其他自建的各大公司沒有啥實質性進展。這一點從他們試圖低薪聘請語音識別相關人才的策略上,也可知道其戰略上沒什么可發展的。語音識別行業屬于聲學和計算機的交叉技術,本來培養的人才就很稀缺,而從上述分析可以看出,國內外的技術源頭實際上大概集中,無非就是業界相關的研究機構和擁有研發實力的巨頭公司。

         4、語音識別行業平衡之下的技術發展趨勢

          語音識別行業現在似乎維持著最大的平衡,因為國內外各家的引擎識別率都基本在同一個水平線上,差不多達到了當前語音識別技術的極限,彼此之間差距不是那么明顯。本來蘋果發布Siri被寄予厚望,這是將語音技術進行大眾推廣的絕佳良機,但是Siri的表現卻與預期相差甚遠。即便國內非常火熱的微信,其中又有幾人使用,甚至知道其中的語音識別技術呢?倒是同樣源自聲學技術的微信搖一搖功能非常火熱。

          這個技術相對語音識別來說,簡直就是小巫見大巫,但是應用場景契合的很好。因此,傳統的語音識別行業公司都在謀求轉型發展,比如Nuance、等,轉型失敗或者技術儲備不足的,或許將來就是最早倒下的,而且這幾年也有不少家類似公司倒下了。

          未來的語音識別市場,預計將會有越來越多的公司參與,以后語音識別的性能可能更多的體現在前端技術和語義理解上。機器要與人自然交流,當然就不能重復手機這套語音對話規則,必然就要考慮到用戶說話的環境、周圍環境的噪音、用戶發音不準或者方言等等諸多因素,這就要求前端技術更加精準的模擬人體結構,仿真出機器人聽覺系統,以實現解放雙手自由對話的目的。

          另外,機器能不能與人自由的交流,不僅需要機器能將語音轉換成文字,更需要機器從文字中理解說話人的含義,這一方面是基于大樣本的機器學習需要更進一步,另外一方面也需要小樣本的自主學習,沒有舉一反三的功能,似乎語義理解也無法自主適應陌生的環境。這兩個新興的技術領域,或許又會孕育出幾家獨角獸企業,將真正推動語音從識別走向交互的自然體驗,從而向著人工智能再次邁進一步。


        上一頁 1 2 3 4 5 6 下一頁

        評論


        相關推薦

        技術專區

        關閉
        主站蜘蛛池模板: 深州市| 晋城| 金阳县| 平潭县| 大英县| 怀集县| 石渠县| 瑞安市| 英山县| 普兰县| 如东县| 永兴县| 韶山市| 泸西县| 甘谷县| 上思县| 剑川县| 蒙山县| 云安县| 肥东县| 聊城市| 桦川县| 白沙| 独山县| 古丈县| 肥西县| 习水县| 唐河县| 栾城县| 江孜县| 开封市| 玛沁县| 永丰县| 邳州市| 五指山市| 读书| 增城市| 丰顺县| 万宁市| 曲松县| 杂多县|