新聞中心

EEPW首頁 > 智能計算 > 業界動態 > 智能語音科技簡史（2018版），這場技術革命從哪開始？

智能語音科技簡史（2018版），這場技術革命從哪開始？

作者：時間：2018-04-20 來源：與非網

編者按：我國智能語音市場整體處于啟動期，智能車載，智能家居，智能可穿戴等垂直領域處于爆發前夜。

　　1952年，貝爾實驗室(Bell Labs)制造一臺6英尺高自動數字識別機“Audrey”，它可以識別數字0～9的發音，且準確度高達90%以上。并且它對熟人的精準度高，而對陌生人則偏低。

　　1956年，普林斯頓大學RCA實驗室開發了單音節詞識別系統，能夠識別特定人的十個單音節詞中所包含的不同音節。

　　1959年，MIT的林肯實驗室開發了針對十個元音的非特定人語音識別系統。

　　二十世紀六十年代初，東京無線電實驗室、京都大學和NEC實驗室在語音識別領域取得了開拓性的進展，各自先后制作了能夠進行語音識別的專用硬件。

　　1964年的世界博覽會上，IBM向世人展示了數字語音識別的“shoe box recognizer”。

　　二十世紀七十年代，語音識別的研究取得了突破性的進展，研究重心仍然是孤立詞語語音識別。

　　1971年，美國國防部研究所(Darpa)贊助了五年期限的語音理解研究項目，希望將識別的單詞量提升到1000以上。參與該項目的公司和學術機構包括IBM、卡內基梅隆大學(CMU)、斯坦福研究院。就這樣，Harpy在CMU誕生了。不像之前的識別器，Harpy可以識別整句話。

　　二十世紀八十年代，NEC提出了二階動態規劃算法，Bell實驗室提出了分層構造算法，以及幀同步分層構造算法等。同時，連接詞和大詞匯量連續語音的識別得到了較大發展，統計模型逐步取代模板匹配的方法，隱馬爾科夫模型(HMM)成為語音識別系統的基礎模型。

　　八十年代中期，IBM創造了一個語音控制的打字機—Tangora，能夠處理大約20000單詞。IBM的研究就是基于隱形馬爾科夫鏈模型(hidden Markov model)，在信號處理技術中加入統計信息。這種方法使得在給定音素情況下，很有可能預測下一個因素。

　　1984年，IBM發布的語音識別系統在5000個詞匯量級上達到了95%的識別率。

　　1985年AT&T貝爾實驗室建造了第一個智能麥克風系統，用來研究大室內空間的聲源位置追蹤問題。

　　1987年開始，國家開始執行963計劃后，國家863智能計算機主題專家組為語音識別研究立項，每兩年一次。

　　1987年12月，李開復開發出世界上第一個“非特定人連續語音識別系統”。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關鍵詞： 智能語音

關閉