新聞中心

EEPW首頁 > 測試測量 > 設(shè)計(jì)應(yīng)用 > 基于語音識別的IVR系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)

基于語音識別的IVR系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)

作者：時(shí)間：2009-02-20 來源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

1 引言
IVR系統(tǒng)（Interactive Voice Response）,即交互式語音應(yīng)答系統(tǒng)，它被應(yīng)用于呼叫中心(Call Center),以提高呼叫服務(wù)的質(zhì)量、減輕服務(wù)員的工作強(qiáng)度并節(jié)省費(fèi)用，是呼叫中心實(shí)現(xiàn)人機(jī)交互的重要門戶，在傳統(tǒng)的IVR系統(tǒng)中，用戶與系統(tǒng)交互的方式是通過電話的鍵盤。通常，用戶在進(jìn)入IVR系統(tǒng)后，會(huì)聽到相關(guān)的語音提示選單，根據(jù)自己的需要可以按下鍵盤上相關(guān)的按鍵。系統(tǒng)通過DTMF信號傳送用戶按下的鍵，同時(shí)也將用戶的請求傳送給系統(tǒng)，從而觸發(fā)相關(guān)的語音信息。然而，傳統(tǒng)的電話僅能通過DTMF信號，傳送有限的幾個(gè)數(shù)字及符號按鍵。這使得用戶與系統(tǒng)的交互界面受到很大的限制，同時(shí)也就使得IVR系統(tǒng)的信息查詢范圍變得相當(dāng)狹窄，用戶在實(shí)際使用時(shí)會(huì)感到諸多不便。

本文引用地址：http://www.104case.com/article/195963.htm

隨著計(jì)算機(jī)技術(shù)和人工智能總體技術(shù)的發(fā)展，自然語言理解不斷取得進(jìn)展。語音識別系統(tǒng)已成為一個(gè)越來越廣泛的應(yīng)用方向。由于電話網(wǎng)絡(luò)的普及性，自然語言處理系統(tǒng)在電話信道上的應(yīng)用已成為最重要的應(yīng)用之一。而且隨著移動(dòng)通信技術(shù)的發(fā)展和人們對于信息獲取的移動(dòng)性的需求不斷增加，市場對于電話語音識別系統(tǒng)的需求也不斷的增加。因此在新一代呼叫中心的IVR系統(tǒng)中引入了語音識別技術(shù)作為用戶的輸入手段，用戶可以直接用語音與系統(tǒng)進(jìn)行交互，這樣大大提高了工作效率。

2 系統(tǒng)流程及主要模塊
本系統(tǒng)目標(biāo)是支持多用戶并發(fā)查詢車輛違章信息和駕駛證信息。用戶使用自然的語言說出需查詢信息的類別和車牌號碼，系統(tǒng)識別后將識別結(jié)果反饋給用戶，經(jīng)用戶確認(rèn)后，系統(tǒng)把識別結(jié)果作為后臺數(shù)據(jù)庫查詢的關(guān)鍵字進(jìn)行查詢，并將查詢結(jié)果播放給用戶。其流程見圖1。本系統(tǒng)主要包括以下幾個(gè)模塊：

話路處理模塊：以并發(fā)的方式控制和管理各電話話路。

語音識別模塊：負(fù)責(zé)查詢類別和車牌號碼的識別。

后臺數(shù)據(jù)庫查詢模塊：將語音識別的結(jié)果作為數(shù)據(jù)庫查詢的關(guān)鍵字進(jìn)行查詢。

圖1 車輛違章信息和駕駛證信息查詢系統(tǒng)流程圖

3 話路處理模塊的實(shí)現(xiàn)
本系統(tǒng)的硬件部分是由電話語音卡和一臺PC機(jī)組成，語音卡通過其提供的語音處理和信令處理能力，來實(shí)現(xiàn)用戶的接入請求和掛機(jī)信號的檢測，并負(fù)責(zé)錄音和回放語音。本系統(tǒng)采用的是東進(jìn)D161A語音卡。該語音卡可接入16條模擬電話線，提供16路以內(nèi)的話路并行處理能力。其主要功能有：（1）自動(dòng)增益控制及語音信號的壓擴(kuò)變換；（2）采集和播放各種格式的電話語音信號，實(shí)現(xiàn)A律PCM、μ律PCM、ADPCM等算法；（3）辨識和產(chǎn)生DTMF信號；（4）ITU-TSS G3傳真功能。

話路處理的主要任務(wù)是電話振鈴檢測，播放系統(tǒng)提示語音信息，接受用戶的按鍵請求和語音請求，與后臺數(shù)據(jù)庫模塊通訊，檢索結(jié)果的語音合成和播放。整個(gè)模塊有點(diǎn)類似于一個(gè)有限狀態(tài)機(jī)，在程序設(shè)計(jì)時(shí)要跟蹤系統(tǒng)所處的狀態(tài)進(jìn)行相應(yīng)的動(dòng)作，并進(jìn)入下一個(gè)狀態(tài)，其程序流程如圖2所示。

本系統(tǒng)話路處理模塊的關(guān)鍵部分是語音數(shù)據(jù)的實(shí)時(shí)采集。東進(jìn)語音卡在這方面提供了一系列接口函數(shù)，如：StartRecordFile、StartRecordFileNew、VR_StartRecord等。這幾個(gè)函數(shù)都能夠?qū)崿F(xiàn)對通道的錄音，所不同的是前兩個(gè)函數(shù)將語音數(shù)據(jù)保存到磁盤文件，后一個(gè)函數(shù)則將語音數(shù)據(jù)保存到存儲器緩沖區(qū)。由于我們要實(shí)現(xiàn)的是一個(gè)實(shí)時(shí)語音識別系統(tǒng)，因此我們采用后者來采集語音數(shù)據(jù)。在開始錄音之前，我們首先調(diào)用VR_SetEcrMode函數(shù)啟動(dòng)回聲抑制功能，然后每隔一段時(shí)間調(diào)用一次VR_GetRecordData函數(shù)取得錄音數(shù)據(jù)，并將其送入語音識別引擎。當(dāng)語音識別引擎有識別結(jié)果返回時(shí)，停止錄音，并根據(jù)識別結(jié)果轉(zhuǎn)入下一個(gè)狀態(tài)。

圖2 話路處理流程

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： IVR 語音識別 系統(tǒng)

焦點(diǎn)

更多>>

技術(shù)專區(qū)

關(guān)閉

新聞中心

基于語音識別的IVR系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)

評論

相關(guān)推薦

技術(shù)專區(qū)