基于ARM的實時語音識別系統在家庭監護機器人的實現
進入90年代,隨著多媒體時代的來臨,迫切要求語音識別系統從實驗室走向實用。許多發達國家如美國、日本、韓國以及IBM、Apple、ATT、NTT等著名公司都為語音識別系統的實用化開發研究投以巨資。IBM公司于1997年開發出漢語ViaVoice語音識別系統,次年又開發出可以識別上海話、廣東話和四川話等地方口音的語音識別系統ViaVoice’98。目前市場上已經出現了語音識別電話、語音識別記事本等產品,如美國VPTC公司的Voice Organizer和法國的Parrot等。
我國語音識別研究工作開始的較晚,但近年來發展得很快,一直緊跟國際水平,國家也很重視,并把大詞匯量語音識別的研究列入“8 63”計劃,由中科院聲學所、自動化所、清華大學電子工程系及北京大學等單位研究開發,取得了高水平的科研成果,如中科院自動化所研制的非特定人、連續語音聽寫系統和漢語語音人機對話系統,其字準確率或系統響應率可達90%以上。鑒于中國未來龐大的市場,國外也非常重視漢語語音識別的研究。美國、新加坡等地聚集了一批來自大陸、臺灣、香港等地的學者,研究成果已達到相當高水平。
1 系統設計
文中是家庭監護機器人項目中的語音識別系統設計部分,設計目的是設計出一種可以識別語音的、協助監護家庭行動不方便人員的機器人。為實現該語音識別系統,設計了語音識別系統總體結構框圖,如圖1所示。
1.1 硬件設計
文中所研究和設計的功能,都是應用在移動機器人上的。因而系統的研究設計需要考慮到體積小、省電、便于移動的特性,并需具有便于家庭用戶操作的友好顯示界面。對于語音識別部分,需要用到用于語音識別算法處理的處理器、語音采集電路和語音輸出電路,如圖2所示。其中語音識別算法運算的處理器主要負責算法的運算處理,相當于機器人的大腦;語音采集電路負責采集外部的聲音信號,相當于機器人的耳朵;語音輸出電路負責輸出話語聲音,相當于機器人的嘴巴。
1)語音識別算法處理器選擇
根據系統設計功能的要求,目前常用的語音識別芯片種類一般有:單片機(MCU)、DSP和SoC(System on Circuit)。考慮到普通單片機(MCU)資源的緊缺及運行速度較慢的缺點,因而在本系統設計將不考慮使用單片機(MCU)作為語音識別的處理器。DSP包含用作數字信號處理的專用部件,運算能力強、精度高,但目前DSP的價格比較高,同時考慮到本系統的特性,需要選擇一種既有較強的運算能力,合適于語音識別的功能,并且能實現較好的用戶操作界面,并帶有文件系統(用于識別地圖)的功能,因而選擇DSP并不是明智之舉。目前Texas Instruments公司新推出的一款芯片OMAP3530,它具有雙內核ARM CortexTM-A8的內核和TMS320C64+TM DSP內核,屬于高性能的OMAP35x架構系列產品,滿足了系統設計的各種功能特性要求。
c++相關文章:c++教程
評論