新聞中心

EEPW首頁 > 消費(fèi)電子 > 業(yè)界動(dòng)態(tài) > 國(guó)內(nèi)外語音識(shí)別行業(yè)現(xiàn)狀

國(guó)內(nèi)外語音識(shí)別行業(yè)現(xiàn)狀

作者：時(shí)間：2016-08-23 來源：C114

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

編者按：隨著高速發(fā)展之后，智能手機(jī)和它所帶動(dòng)的相關(guān)產(chǎn)業(yè)都陷入了發(fā)展瓶頸，機(jī)器學(xué)習(xí)和人工智能被認(rèn)為是下一個(gè)科技熱潮，而語音識(shí)別也會(huì)趁著這個(gè)風(fēng)口飛起來，國(guó)內(nèi)語音行業(yè)也可謂是百花齊放，尤其是最近幾年，不僅涌現(xiàn)了很多國(guó)內(nèi)外的小公司，而且巨頭們也開始加速語音識(shí)別行業(yè)的布局。

　　3、國(guó)內(nèi)外巨頭布局語音識(shí)別的策略差異

本文引用地址：http://www.104case.com/article/201608/295872.htm

　　上面歷數(shù)了國(guó)內(nèi)外各個(gè)巨頭陸續(xù)建立語音識(shí)別引擎的過程和優(yōu)勢(shì)技術(shù)，有一點(diǎn)我們還是要特別留意一下：國(guó)外巨頭欲進(jìn)入語音識(shí)別行業(yè)，首先想到的就是收購(gòu)初創(chuàng)的團(tuán)隊(duì)，這些團(tuán)隊(duì)大都也在5-20人之間，掌握著一定的優(yōu)勢(shì)技術(shù)。顯然收購(gòu)一家初創(chuàng)團(tuán)隊(duì)很難滿足其戰(zhàn)略發(fā)展，因此一旦技術(shù)與公司業(yè)務(wù)融合以后，這些巨頭都會(huì)頻繁出手再次收購(gòu)以補(bǔ)齊短板，逐漸建立起適合自己公司發(fā)展的語音識(shí)別優(yōu)勢(shì)。

　　對(duì)于技術(shù)相對(duì)重要而且技術(shù)點(diǎn)又比較分散的科技型公司，國(guó)外巨頭一般不會(huì)采取收購(gòu)商業(yè)模式公司的那種大手筆來收購(gòu)，這也是導(dǎo)致Nuance最終無人問津的重要因素。想想也是，巨頭自然不會(huì)用別人家引擎以免將來掣肘，何況收購(gòu)技術(shù)類的大型公司無疑也是給自己找了個(gè)麻煩。

　　國(guó)內(nèi)的語音識(shí)別發(fā)展脈路沒有那么清晰，剛開始各個(gè)巨頭也都是采用專用公司比如科大訊飛、中科信利、云知聲等公司的引擎。后來醒悟過來，紛紛謀求自建，但是除了百度不斷砸入重金后獲得了一定的效果外，其他自建的各大公司沒有啥實(shí)質(zhì)性進(jìn)展。這一點(diǎn)從他們?cè)噲D低薪聘請(qǐng)語音識(shí)別相關(guān)人才的策略上，也可知道其戰(zhàn)略上沒什么可發(fā)展的。語音識(shí)別行業(yè)屬于聲學(xué)和計(jì)算機(jī)的交叉技術(shù)，本來培養(yǎng)的人才就很稀缺，而從上述分析可以看出，國(guó)內(nèi)外的技術(shù)源頭實(shí)際上大概集中，無非就是業(yè)界相關(guān)的研究機(jī)構(gòu)和擁有研發(fā)實(shí)力的巨頭公司。

　4、語音識(shí)別行業(yè)平衡之下的技術(shù)發(fā)展趨勢(shì)

　　語音識(shí)別行業(yè)現(xiàn)在似乎維持著最大的平衡，因?yàn)閲?guó)內(nèi)外各家的引擎識(shí)別率都基本在同一個(gè)水平線上，差不多達(dá)到了當(dāng)前語音識(shí)別技術(shù)的極限，彼此之間差距不是那么明顯。本來蘋果發(fā)布Siri被寄予厚望，這是將語音技術(shù)進(jìn)行大眾推廣的絕佳良機(jī)，但是Siri的表現(xiàn)卻與預(yù)期相差甚遠(yuǎn)。即便國(guó)內(nèi)非常火熱的微信，其中又有幾人使用，甚至知道其中的語音識(shí)別技術(shù)呢?倒是同樣源自聲學(xué)技術(shù)的微信搖一搖功能非常火熱。

　　這個(gè)技術(shù)相對(duì)語音識(shí)別來說，簡(jiǎn)直就是小巫見大巫，但是應(yīng)用場(chǎng)景契合的很好。因此，傳統(tǒng)的語音識(shí)別行業(yè)公司都在謀求轉(zhuǎn)型發(fā)展，比如Nuance、科大訊飛等，轉(zhuǎn)型失敗或者技術(shù)儲(chǔ)備不足的，或許將來就是最早倒下的，而且這幾年也有不少家類似公司倒下了。

　　未來的語音識(shí)別市場(chǎng)，預(yù)計(jì)將會(huì)有越來越多的公司參與，以后語音識(shí)別的性能可能更多的體現(xiàn)在前端技術(shù)和語義理解上。機(jī)器要與人自然交流，當(dāng)然就不能重復(fù)手機(jī)這套語音對(duì)話規(guī)則，必然就要考慮到用戶說話的環(huán)境、周圍環(huán)境的噪音、用戶發(fā)音不準(zhǔn)或者方言等等諸多因素，這就要求前端技術(shù)更加精準(zhǔn)的模擬人體結(jié)構(gòu)，仿真出機(jī)器人聽覺系統(tǒng)，以實(shí)現(xiàn)解放雙手自由對(duì)話的目的。

　　另外，機(jī)器能不能與人自由的交流，不僅需要機(jī)器能將語音轉(zhuǎn)換成文字，更需要機(jī)器從文字中理解說話人的含義，這一方面是基于大樣本的機(jī)器學(xué)習(xí)需要更進(jìn)一步，另外一方面也需要小樣本的自主學(xué)習(xí)，沒有舉一反三的功能，似乎語義理解也無法自主適應(yīng)陌生的環(huán)境。這兩個(gè)新興的技術(shù)領(lǐng)域，或許又會(huì)孕育出幾家獨(dú)角獸企業(yè)，將真正推動(dòng)語音從識(shí)別走向交互的自然體驗(yàn)，從而向著人工智能再次邁進(jìn)一步。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>