新聞中心

        EEPW首頁 > 嵌入式系統 > 設計應用 > DSP嵌入式說話人識別系統的設計與實現

        DSP嵌入式說話人識別系統的設計與實現

        作者: 時間:2009-12-28 來源:網絡 收藏

        1.6 人身份的結果顯示
        人的身份顯示通過LED的組合顯示確定。在DSK上有4只LED燈,將每個LED燈看成是一位二進制數。則4個LED燈最大可表示16個人的身份。該取前10個組合來表示所人的身份。
        1.7 自舉的
        以上程序都是通過PC機與組合,要想使上單獨完成,還必須自舉。該采用ROM方式自舉。在自舉實現過程中,程序的燒寫可以通過CCS自帶的FLASHBorn工具實現。在燒寫過程中應正確的分配FLAH ROM的空間。FLASHROM空間總體分為程序存儲區和數據存儲區,經計算,程序代碼段大小為0x162C0,故在FLASH ROM中劃分127 KB的空間供程序代碼使用,空間中未使用的部分供程序擴展使用。數據存儲區劃分的大小為64 KB的空間,每個說話者模型參數占用空間為4.2 KB左右,最多可存放15個說話人GMM模型參數。該系統訓練者數目為10個,占用空間為42 KB左右。剩余的空間可用來擴展訓練人數,也可用于后期系統的改進。如可以利用語音提示來顯示說話人身份,而提示語音的數據可以存放于此區域。具體的存儲的安排如表1所示。

        本文引用地址:http://www.104case.com/article/152184.htm

        2 系統的算法與軟件
        說話人系統的實現方案如圖3所示。

        輸入的模擬語音先通過預處理,包括預濾波、采樣、量化、加窗、端點檢測、預加重等。語音經過預處理后進行特征提取。在訓練階段,對提取的特征進行相應的處理后就可以獲得參考模型。識別階段,語音通過同樣的通道獲得特征參數,生成測試摸型,之后將測試摸型與參考摸型進行匹配,從而根據判決邏輯獲得判決結果。
        2.1 語音信號的端點檢測
        語音信號的端點檢測目的是去除語音信號中的噪聲段。端點檢測從很大程度上影響到識別率。常用方法有短時能量法,短時過零率法和雙門限法等。本系統選用雙門限法,實驗表明,效果優于前兩種方法。在雙門限方法端點檢測中,閾值的選擇尤為關鍵,該系統的語音采樣頻率設為8 kHz,語音分幀為每幀80個點。經過多次實驗,這里短時能量低閾值通過式(3)的動態方式得到,高閾值設為低閾值的5倍。而過零率的閾值選取應充分考慮到噪聲的影響,通過大量實驗發現系統中噪聲的過零率一般不超過5,所以對過零率的閾值選取為25,取得了很好的效果,準確率達到95%以上。
        ITU=0.03(amp_max-amp_min)+amp_min (3)
        在端點檢測過程中有時會遇到突發性的干擾噪聲,這種噪聲持續時間很短,一般小于5 ms。為了消除這種干擾,這里用檢測后的起止長度判斷它是不是語音。如果所檢測到的語音長度足夠的短,則可以把它當成是噪聲。
        2.2 特征參數的提取
        語音信號的特征提取是說話人身份識別的難點。能否用相對簡單的方法提取出一種最能體現說話人個性信息的特征將成為以后研究的方向。該系統中用的是能體現人耳聽覺特性的Mel倒譜系數(MFCC)。

        linux操作系統文章專題:linux操作系統詳解(linux不再難懂)


        評論


        相關推薦

        技術專區

        關閉
        主站蜘蛛池模板: 越西县| 温宿县| 连平县| 广汉市| 响水县| 广河县| 嘉义市| 宜川县| 新化县| 偃师市| 迁西县| 塔城市| 新泰市| 福清市| 双城市| 吉隆县| 满洲里市| 大理市| 宝山区| 紫云| 滨海县| 恩平市| 区。| 苏尼特右旗| 洞头县| 双牌县| 贞丰县| 金塔县| 兴仁县| 商南县| 稻城县| 工布江达县| 松原市| 肃南| 贡觉县| 兴山县| 铜陵市| 华亭县| 四会市| 枣强县| 贵定县|