Nuance語音識別技術
1.語音識別概述
本文引用地址:http://www.104case.com/article/268339.htm語音識別技術,Automatic Speech Recognition,簡稱ASR,是一種讓機器聽懂人類語言的技術。語言是人類進行信息交流的最主要、最長用、最直接的方式。語音識別技術是實現人機對話的一項重大突破,在國外近年來發展十分迅速,其應用也逐步得到推廣。近幾年逐漸普及的IVR(自動電話應答)處理了不少簡單而又重復的咨詢工作,節省了不少人力,但這種按鍵式的語音自動應答卻讓客戶花費很多時間按指引來完成簡單的查詢,令用戶倍感不便。
語音識別無疑可以解決該方面的問題。語音識別系統的開發成功,充分發揮了計算機技術和網絡技術的優勢,采用先進的人機對話方式,擺脫電話按鍵的束縛,人們只要象平常一樣對著電話簡單的說出所需服務項目,即可輕松獲取自動系統提供的所需信息。

語音識別系統結構
2.語音識別應用
Nuance公司是自然語音接口軟件的佼佼者。使用自然語音接口軟件,人們可以通過電話方便安全地獲取信息、服務并進行交易。每天,千千萬萬的人通過撥打運行Nuance公司語音識別、語言理解和聲紋鑒別軟件的電話,進行出游預訂、股票交易、與其它通訊媒體、企業和互聯網系統進行交往等活動。NUANCE的應用:美國航空、Bell Atlantic、Charles Schwab、家庭購物網絡、Lloyds TSB、Sears、UPS.
3.NUANCE語音識別特點
(1)海量詞匯、獨立于講話者的健壯識別功能
Nuance系統能可靠地對多種語言進行大詞匯量的識別,并可提供識別結果的置信度。該系統對商業上使用的大量詞匯提供最準確的語音識別技術。利用Nuance系統開發的應用程序,在市場上具有最高的準確率。生產中的應用程序經測試,準確性超過96%.
(2)基于主機的客戶/服務機結構
Nuance系統基于開放式客戶/服務機結構,特別為大型應用程序所需的健壯性和可伸縮性而設計。呼叫者的講話由客戶端收集,而識別和鑒別處理的負載被平均分配到網絡上的多個分開的服務器上。
(3)N-Best處理
對于有些應用程序,可能需要識別引擎產生可能的識別結果集,而不是一個最好的結果。Nuance系統的N-best識別處理方法便有這個功能,它提供了可能的識別結果列表,并按可能性從高到低排列。
(4)語法概率
Nuance系統允許對呼叫者所講的特定詞語或短語的在語法中的概率進行指定。當被講的詞語或短語的概率可根據實際使用進行估計時,非常有用。對語法增加概率可提高識別的準確率和速度。
(5)降低噪音
當進來的呼叫包含穩定的背景噪音時,Nuance系統通過一種機制,使識別服務器更準確地進行識別。識別服務器將進來的話語進行增強,以有效地將語氣、嗡嗡聲、哼叫聲、噓噓聲等噪聲過濾。如果相當數量的電話均含有穩定的背景噪聲,比如在汽車上免提打電話時,這個機制效果較理想。
評論