新聞中心

        EEPW首頁 > 嵌入式系統(tǒng) > 設(shè)計應(yīng)用 > 基于HMM的連續(xù)小詞量語音識別系統(tǒng)的研究

        基于HMM的連續(xù)小詞量語音識別系統(tǒng)的研究

        作者: 時間:2011-07-12 來源:網(wǎng)絡(luò) 收藏

        摘要:為了提高效率及對環(huán)境的依賴性,文章對算法部分和硬件部分做了分析與改進,采用ARMS3C2410微處理器作為主控制模塊,采用UDA1314TS音頻處理芯片作為模塊,利用聲學(xué)模型及Viterbi算法進行模式訓(xùn)練和識別,設(shè)計了一種的、量的語音識別。實驗證明,該語音識別具有較高的識別率和一定程度的魯棒性,實驗室識別率和室外識別率分別達到95.6%,92.3%。
        關(guān)鍵詞:語音識別;嵌入式;Hidden Markov Models;ARM;Viterbi算法

        0 引言
        嵌入式語音識別系統(tǒng)是應(yīng)用各種先進的微處理器在板級或是芯片級用軟件或硬件實現(xiàn)的語音識別。嵌入式技術(shù)與語音識別技術(shù)相結(jié)合,能使人們甩掉鍵盤,通過語音命令對智能化終端進行操作,人與智能化終端之間的這種自然快捷的交互方式有助于提高人機交互的效率,以適應(yīng)嵌入式平臺存儲資源少,實時性要求高的特點,增強人對智能化設(shè)備的控制,同時,在語音識別技術(shù)發(fā)展過程中又以的廣泛應(yīng)用為特點。該算法通過對大量語音數(shù)據(jù)進行數(shù)據(jù)統(tǒng)計,建立識別詞條的統(tǒng)計模型,然后從待識別語音中提取特征,與這些模型匹配,通過比較匹配概率,以獲得識別結(jié)果,通過建立大量的語音數(shù)據(jù)庫,就能獲得一個穩(wěn)健的統(tǒng)計模型,提高在各種實際情況下的識別效率。

        1 Markov鏈及隱馬爾可夫模型()
        語音信號是一個可觀察的序列,在足夠小時間段上特性近似于穩(wěn)定,但其總的過程可看作依次從相對穩(wěn)定的某一特性過渡到另一特性,在整個分析區(qū)間內(nèi)可將許多線性模型串接起來,這就是Markov鏈。Markov鏈是Markov隨機過程的特殊情況,即Markov鏈式狀態(tài)和時間參數(shù)都離散的Markov過程。
        隱馬爾可夫模型是對語音信號的時間序列結(jié)構(gòu)建立統(tǒng)計模型,可將之看作一個數(shù)學(xué)上的雙重隨機過程:一個是用具有有限狀態(tài)數(shù)的Mar-kov鏈來模擬語音信號統(tǒng)計特性變化的隱含的隨機過程,另一個是與Mark-ov鏈的每一個狀態(tài)相關(guān)聯(lián)的觀測序列的隨機過程。前者通過后者表現(xiàn)出來,但前者的具體參數(shù)是不可測的。
        一般來說,一個HMM是一個雙重隨機過程,由下述五個參數(shù)描述:
        a.JPG

        2 HMM的語音識別系統(tǒng)實現(xiàn)
        人的言語過程實際上就是一個雙重隨機過程,語音信號本身是一個可觀測的時變序列,是由大腦根據(jù)語法知識和言語需要(不可觀測的狀態(tài))發(fā)出音素的參數(shù)流。HMM合理地模仿了這一過程,很好地描述了語音信號的整體非平穩(wěn)性和局部平穩(wěn)性,是較為理想的一種語音模型。從整段語音來看,人類語音是一個非平穩(wěn)的隨機過程,但是若把整段語音分割成若干短時語音信號,則可認為這些短時語音信號是平穩(wěn)過程,就可以用線性手段對這些短時語音信號進行分析。若對這些語音信號建立隱馬爾可夫模型,則可以辯識具有不同參數(shù)的短時平穩(wěn)信號段,并可以跟蹤它們之間的轉(zhuǎn)化,從而解決了對語音的發(fā)音速率及聲學(xué)變化建立模型的問題。
        語音識別系統(tǒng)首先通過芯片內(nèi)的A/D轉(zhuǎn)換器將模擬語音信號轉(zhuǎn)化為數(shù)字語音信號,然后對數(shù)字語音信號進行處理(信號加窗、過濾),得到干凈的語音信號,再通過特征提取過程做出特征矢量,提取語音特征,最后由識別過程對說話人語音進行識別,得出識別結(jié)果。總體來說,整個識別過程分為語音信號的預(yù)處理、語音信號的特征提取、語音庫的建立以及語音信號的識別等幾個主要階段,如圖1所示。

        本文引用地址:http://www.104case.com/article/150493.htm

        b.JPG


        語音識別過程分為兩個部分:一是HMM訓(xùn)練過程,得到HMM語音識別模型,即建立基本識別語音庫;二是HMM識別過程,得到語音識別結(jié)果。

        矢量控制相關(guān)文章:矢量控制原理

        上一頁 1 2 3 下一頁

        評論


        相關(guān)推薦

        技術(shù)專區(qū)

        關(guān)閉
        主站蜘蛛池模板: 察哈| 海安县| 涿鹿县| 崇明县| 台北市| 阿坝县| 达拉特旗| 南丹县| 昭苏县| 赞皇县| 定襄县| 灌云县| 木兰县| 耿马| 普兰店市| 眉山市| 偃师市| 兴安县| 嘉定区| 天津市| 云安县| 阜阳市| 克拉玛依市| 新和县| 都匀市| 垣曲县| 通道| 潜山县| 巴青县| 绩溪县| 阿坝县| 和平区| 二连浩特市| 马尔康县| 滨海县| 蒙阴县| 保靖县| 罗田县| 岚皋县| 志丹县| 东丰县|