基于DSP嵌入式說話人識別系統的設計
1.6 說話人身份識別的結果顯示
說話人的身份顯示通過LED的組合顯示確定。在DSK上有4只LED燈,將每個LED燈看成是一位二進制數。則4個LED燈最大可表示16個人的身份。該系統取前10個組合來表示所識別的說話人的身份。
1.7 自舉的實現
以上程序都是通過PC機與DSP組合實現,要想使系統在DSP上單獨完成,還必須實現自舉。該系統采用ROM方式自舉。在自舉實現過程中,程序的燒寫可以通過CCS自帶的FLASHBorn工具實現。在燒寫過程中應正確的分配FLAH ROM的空間。FLASHROM空間總體分為程序存儲區和數據存儲區,經計算,程序代碼段大小為0x162C0,故在FLASH ROM中劃分127 KB的空間供程序代碼使用,空間中未使用的部分供程序擴展使用。數據存儲區劃分的大小為64 KB的空間,每個說話者模型參數占用空間為4.2 KB左右,最多可存放15個說話人GMM模型參數。該系統訓練者數目為10個,占用空間為42 KB左右。剩余的空間可用來擴展訓練人數,也可用于后期系統的改進。如可以利用語音提示來顯示說話人身份,而提示語音的數據可以存放于此區域。具體的存儲的安排如表1所示。
2 系統的算法與軟件設計
說話人識別系統的實現方案如圖3所示。
輸入的模擬語音先通過預處理,包括預濾波、采樣、量化、加窗、端點檢測、預加重等。語音經過預處理后進行特征提取。在訓練階段,對提取的特征進行相應的處理后就可以獲得參考模型。識別階段,語音通過同樣的通道獲得特征參數,生成測試摸型,之后將測試摸型與參考摸型進行匹配,從而根據判決邏輯獲得判決結果。
linux操作系統文章專題:linux操作系統詳解(linux不再難懂)
評論