基于Windows CE的語(yǔ)音口令識(shí)別系統(tǒng)的設(shè)計(jì)
圖1 語(yǔ)音口令識(shí)別系統(tǒng)的程序流程圖。
當(dāng)語(yǔ)音口令識(shí)別系統(tǒng)采集到命令語(yǔ)音信號(hào)后,要提取參數(shù),做出比較判斷,調(diào)用相應(yīng)語(yǔ)音口令識(shí)別算法。對(duì)每條語(yǔ)音口令信號(hào),先切除靜音,進(jìn)行預(yù)加重處理,然后通過(guò)Hamming窗分幀,幀長(zhǎng)和幀移分別為20ms和10ms,對(duì)每一幀語(yǔ)音信號(hào)提取16階MFCC和△MFCC一共32維參數(shù)作為特征矢量。
語(yǔ)音口令識(shí)別軟件系統(tǒng)由許多不同的語(yǔ)音信號(hào)預(yù)處理、識(shí)別算法和其它子程序組成,為了實(shí)現(xiàn)參數(shù)的傳遞,每個(gè)程序執(zhí)行后的參數(shù)以文件的形式輸出,而這些程序的調(diào)用先后順序和參數(shù)的輸入輸出文件的位置等都由一個(gè)主程序管理。
在Windows CE中,編寫(xiě)可執(zhí)行程序,需要調(diào)用應(yīng)用程序編程接口API(Application Programming Interface)函數(shù),并且要設(shè)定程序入口點(diǎn)。調(diào)用過(guò)程為:
無(wú)論是進(jìn)行語(yǔ)音口令訓(xùn)練還是語(yǔ)音口令識(shí)別操作,都需要對(duì)語(yǔ)音口令信號(hào)的采集和實(shí)時(shí)處理程序,所以對(duì)語(yǔ)音口令信號(hào)的采集和實(shí)時(shí)處理程序是語(yǔ)音口令識(shí)別系統(tǒng)軟件中的重要部分之一。對(duì)于語(yǔ)音音頻接口的管理是通過(guò)Windows CE 5.0里的API函數(shù)完成的,對(duì)語(yǔ)音口令信號(hào)的采集和實(shí)時(shí)處理程序流程圖如圖2所示。
評(píng)論