新聞中心

        EEPW首頁 > 嵌入式系統 > 設計應用 > ADSP-BF531在嵌入式語音識別系統中的應用

        ADSP-BF531在嵌入式語音識別系統中的應用

        作者: 時間:2012-09-02 來源:網絡 收藏

        3.2.2 矢量量化
        矢量量化(VQ,Vector Quantization)是一種重要的信號壓縮方法,其過程是:將信號波形的K個樣點的每一幀,或在K個參數的每一參數幀,構成K維空間中的一個矢量,然后對矢量進行量化。量化時,將K維無限空間劃分為M個區域邊界,然后將輸入矢量與這些邊界進行比較,并被量化為“距離”最小的區域邊界的中心矢量值。
        一個VO編碼器往往擁有一個或多個由具有代表意義的矢量組成的集合,稱為“碼本”(本中碼本大小為256),其中每個矢量稱為“碼矢量”。在中,訓練用的特征通過聚類的方法形成碼書;時,VO編碼器將待語音的特征矢量與碼書中的每個矢量進行失真測度運算,最小的失真測度所對應的碼字的標號代替輸入矢量。
        3.2.3 HMM模型建立及訓練過程
        選擇尤跨越的從左向有的HMM模型,狀態數取6。訓練過程中利用Baum-Welch算法和Viterbi算法來計算所有觀察序列的輸出概率,然后對其進行累加,得到總輸出慨率,采用前后2次的輸出概率的相對變化小于一定閾值(如:1×10-4)或超過迭代次數作為訓練結束的判據。程序流程圖如圖6所示。

        本文引用地址:http://www.104case.com/article/148467.htm

        g.JPG


        3.2.4 語音識別
        語音識別的過程即是用Viterbi算法將經將輸入的矢量量化后的語音與模型庫中的參考模板進行匹配。
        Viterbi算法是一種前向搜索算法,其可以是在給定相應的觀察序列時,找出從模型λ中找出的最佳狀態序列,即選擇輸出概率最大的模版作為輸出結果。對數形式的Viterbi算法,能夠避免大量的乘法運算,減少計算量,同時還可以保證有很高的動態范圍,不會出現由于過多的連乘而導致溢出問題,其算法如下:
        h.JPG

        4 實驗結果及分析
        選取500字的詞表,詞長不大于5;在進行識別前,對每個待識別的詞進行訓練,參加訓練人數為30,其中男性20人,女性10人。實驗選取30個人,其中參加訓練和未參加訓練的各15人,對簡單語音命令、數字串、字母串進行測試(每人反復測試5次),結果如表1所示。

        i.JPG


        通過以上數據可以看出,該系統的對非特定人(包括參加訓練和未參加訓練)的簡單漢語詞匯、數字串、字母串等的綜合識別率超過了90%,識別時間在0.7 s左右;具有較高的識別率和較好的實時性。從表中可以看出,未參加訓練與參加訓練的識別率相差約10%,可以通過在軟件中增加訓練樣本量以及完善有關算法等來進一步提高其識別率。

        5 結束語
        語音識別系統在以為核心的硬件基礎上,成功運用DHMM算法完成了對非特定人孤立詞的語音識別。該系統運行穩定、可靠,其識別率及實時性均滿足使用要求,同時還具有存儲容量大、運算速度快的特點,為軟件運行留下了充足的裕量,系統后續的完善和升級較容易實現。該系統可于許多特定場合,有很好的市場前景。

        linux操作系統文章專題:linux操作系統詳解(linux不再難懂)

        上一頁 1 2 3 下一頁

        評論


        相關推薦

        技術專區

        關閉
        主站蜘蛛池模板: 措美县| 织金县| 鞍山市| 海口市| 城口县| 青田县| 卢龙县| 扬州市| 蒲城县| 锡林郭勒盟| 长子县| 增城市| 拉萨市| 农安县| 泰州市| 寿光市| 镇远县| 普格县| 怀化市| 万宁市| 习水县| 银川市| 芒康县| 蒙山县| 龙州县| 闸北区| 建阳市| 桦川县| 阿勒泰市| 吴旗县| 汤阴县| 辽宁省| 瓮安县| 卓资县| 府谷县| 中阳县| 新安县| 平阴县| 涪陵区| 南部县| 河曲县|