基于HMM的連續小詞量語音識別系統的研究

如果P(O/λZ)和

2.2 HMM模型識別
HMM模型的輸出概率用Viterbi算法計算,因為概率值一般都遠小于1,這里用取對數后的概率作為輸出值:

以上式中δt(i)表示t時刻第i個狀態的累積輸出概率;φt(i)表示t時刻第i個狀態的前續狀態號;

3 實驗結果
系統首先通過語音錄入模塊的麥克風將語音信號輸入UDA1341 TS數字音頻處理芯片,通過S3C2410向UDA1341數字音頻處理芯片發送指令,數字音頻處理芯片由內部A/D對語音信號進行采樣,調用語音壓縮算法對語音信號進行壓縮,并調用語音識別函數API對輸入語音進行基于模式匹配算法的語音識別,最終UDA1341數字音頻處理芯片將識別結果通過I/O傳送到ARM S3C2410,S3C2410接收到識別結果后,根據不同的識別結果再向UDA1341 TS發送不同指令,以此實現語音識別系統的功能。
系統采用三星的S3C2410作為嵌入式CPU,這是一款高性價比、低功耗、高性能、高集成度的CPU,基于ARM9核,主頻為203 MHz,專為網絡通信和手持設備而設計,能滿足語音識別系統中的低成本、低功耗、高性能、小體積的要求。
實驗采用10字中文數碼,分別在室外環境和實驗室環境下測試,結果如表1所示。本文引用地址:http://www.104case.com/article/150493.htm
通過測試表明,在實驗室環境下該系統在UDA1314TS DSP芯片上得到的結果比較令人滿意,具有良好的魯棒性,識別率達到實用要求,但在室外較高噪音條件下的識別率相對實驗室環境下有一定差距,滿足語音識別基本要求。
4 結論
本文系統采用隱馬爾可夫模型的語音識別算法,能夠對小詞量、連續語音進行識別,識別率較高。ARMS3C2410微處理器和UDA1314TS音頻處理芯片的結合應用,能使本語音識別系統具有較強的實時性。體積小,攜帶方便,使用靈活,可移植性強的特點使系統在進一步改進和發展后能夠用于工業語音控制領域中,還可用于聲控玩具、聲控設備等人們的日常生活中。
但由于技術水平和硬件環境的限制,該語音識別系統在算法、硬件方面都需要進一步的研究和完善。該嵌入式語音識別系統的研究為進一步開發和研究實用性嵌入式語音識別系統做出了重要的嘗試和探索工作。
評論