基于非特定人車載音響語音控制系統的設計與實現

對于語音處理而言,因Q的變化,P(Q,O|λ)取值范圍很大,而P(Q,O|λ)的最大值占了全部P(Q,O|λ)的很大的成分,所以可以用Viterbi算法來計算P(O|λ)。
2.2 控制模塊
控制模塊的主要功能是:在AT89S51查詢到語音詞條信號后,查表獲得詞條編碼,根據編碼判斷對應按鍵是長按或短按,分別進入相應的子程序處理。在子程序中,輸出語音命令所對應的I/O控制信號驅動繼電器吸合模擬按鍵或編碼開關動作,并及時復位I/O口。控制模塊還具有完全兼容手動控制的功能,在語音控制操作的同時也可以進行手動操作,手動的優先級高于語音命令,這樣可以避免語音控制和手動控制之間發生沖突。
控制模塊部分程序代碼如下:

3 系統實測結果
本系統在江淮同悅SL1102C1型車載音響上進行了非特定人語音識別率和模擬開關動作準確率測試。由于汽車音響的語音詞條為2到4個字,語音識別率實驗內容為車載音響常用2字詞條指令18條、3字詞條指令12條、4字詞條指令10條,實驗對象為6人(4男、2女,普通話和方言),實驗環境為實驗室環境。為了提高系統的識別率,系統采用奧林巴斯ME52定向麥克,提高了麥克接收范圍,系統測試結果如表1所示。本文引用地址:http://www.104case.com/article/197388.htm
由表1可知,系統的識別率與語音指令詞條字數、麥克接收距離、說話人方言有關。男聲和女聲的識別率接近。
在系統控制電路實驗中,模擬開關動作達到了較高的準確率,測試結果為98%以上,只要控制程序運行正常,各路繼電器就能按照程序安排執行閉合和斷開模擬手動開關操作。
實現汽車電器的語音控制是未來車載電器的發展趨勢,越來越多的解決方案被提出和驗證。本文設計在SL1102C1型車載音響上使用SDA80D51芯片,實現了車載音響非特定人的語音識別與控制。由于該芯片集成度高,需要外圍模塊少,所以設計的硬件電路簡單,便于調試檢測。該設計得到的樣機,有較高的識別率,工作穩定、可擴展性強,達到預期的設計目標,整個設計方案和實現方法是可行的。由于語音識別率隨著環境、說話人不同而變化,雖然HMM算法在噪聲很小的環境下可以獲得很高的識別率,但當測試語音或者環境中含有不同程度的噪聲污染時,語音識別系統的性能會有所下降。提高系統的抗噪性和魯棒性是語音識別系統走向實用化的關鍵之一。
參考文獻
[1] 楊行峻,遲惠生.語音信號數字處理[M].北京:電子工業出版社,1995.
[2] Inifneon. UniSpeech2V2.0 Functional Specification [Z]. Infineon Technologies AG, 2002.
[3] 韓紀慶,張磊,鄭鐵然.語音信號處理[M].北京:清華大學出版社,2004.
[4] 王海青.基于CDHMM的口令式語音識別系統及其DSP實現[D]. 合肥:中國科學技術大學,2003.
[5] BURCHARD B, ROMER R, FOX O. A single chip phoneme based HMM speech recognition system for consumer applications[J]. Consumer Electronics, IEEE Transactions on, 2000, 46(3): 914-919.
[6] Masao Namiki, Takayuki Hamamoto, Seiichiro Hangai.Spoken word recognition with digital cochlea using 32 DSP-boards, IEEE Trans. on Acoust, Speech, Signal Processing, 2001,2:969-972.
評論