新聞中心

        EEPW首頁 > 智能計算 > 業界動態 > 智能語音科技簡史(2018版),這場技術革命從哪開始?

        智能語音科技簡史(2018版),這場技術革命從哪開始?

        作者: 時間:2018-04-20 來源:與非網 收藏
        編者按:我國智能語音市場整體處于啟動期,智能車載,智能家居,智能可穿戴等垂直領域處于爆發前夜。

          1952年,貝爾實驗室(Bell Labs)制造一臺6英尺高自動數字識別機“Audrey”,它可以識別數字0~9的發音,且準確度高達90%以上。并且它對熟人的精準度高,而對陌生人則偏低。

        本文引用地址:http://www.104case.com/article/201804/378689.htm


        智能語音科技簡史(2018版),這場技術革命從哪開始?


          1956年,普林斯頓大學RCA實驗室開發了單音節詞識別系統,能夠識別特定人的十個單音節詞中所包含的不同音節。

          1959年,MIT的林肯實驗室開發了針對十個元音的非特定人語音識別系統。


        智能語音科技簡史(2018版),這場技術革命從哪開始?


          二十世紀六十年代初,東京無線電實驗室、京都大學和NEC實驗室在語音識別領域取得了開拓性的進展,各自先后制作了能夠進行語音識別的專用硬件。

          1964年的世界博覽會上,IBM向世人展示了數字語音識別的“shoe box recognizer”。

          二十世紀七十年代,語音識別的研究取得了突破性的進展,研究重心仍然是孤立詞語語音識別。

          1971年,美國國防部研究所(Darpa)贊助了五年期限的語音理解研究項目,希望將識別的單詞量提升到1000以上。參與該項目的公司和學術機構包括IBM、卡內基梅隆大學(CMU)、斯坦福研究院。就這樣,Harpy在CMU誕生了。不像之前的識別器,Harpy可以識別整句話。

          二十世紀八十年代,NEC提出了二階動態規劃算法,Bell實驗室提出了分層構造算法,以及幀同步分層構造算法等。同時,連接詞和大詞匯量連續語音的識別得到了較大發展,統計模型逐步取代模板匹配的方法,隱馬爾科夫模型(HMM)成為語音識別系統的基礎模型。

          八十年代中期,IBM創造了一個語音控制的打字機—Tangora,能夠處理大約20000單詞。IBM的研究就是基于隱形馬爾科夫鏈模型(hidden Markov model),在信號處理技術中加入統計信息。這種方法使得在給定音素情況下,很有可能預測下一個因素。

          1984年,IBM發布的語音識別系統在5000個詞匯量級上達到了95%的識別率。

          1985年AT&T貝爾實驗室建造了第一個智能麥克風系統,用來研究大室內空間的聲源位置追蹤問題。

          1987年開始,國家開始執行963計劃后,國家863智能計算機主題專家組為語音識別研究立項,每兩年一次。

          1987年12月,李開復開發出世界上第一個“非特定人連續語音識別系統”。


        智能語音科技簡史(2018版),這場技術革命從哪開始?

        上一頁 1 2 下一頁

        關鍵詞: 智能語音

        評論


        相關推薦

        技術專區

        關閉
        主站蜘蛛池模板: 扶沟县| 花莲县| 霍林郭勒市| 东阳市| 恭城| 和林格尔县| 和硕县| 泾源县| 陕西省| 达孜县| 湘乡市| 望江县| 饶阳县| 宝丰县| 孟村| 南丹县| 隆林| 南城县| 美姑县| 民权县| 荥经县| 洞头县| 扶绥县| 巴楚县| 上虞市| 丹江口市| 司法| 陈巴尔虎旗| 腾冲县| 白水县| 乌鲁木齐县| 满洲里市| 溧阳市| 休宁县| 闻喜县| 辛集市| 鹤庆县| 保靖县| 新巴尔虎右旗| 洞头县| 民勤县|