新聞中心

        EEPW首頁 > 嵌入式系統 > 設計應用 > 基于AVR單片機的語音識別系統設計

        基于AVR單片機的語音識別系統設計

        作者: 時間:2012-08-08 來源:網絡 收藏

        0 引言
        傳統的人機交互依靠復雜的鍵盤或按鈕來實現,隨著科技的發展,一些新型的人機交互方式也隨之誕生,帶給人們全新的體驗?;谡Z音識別的人機交互方式是目前熱門的技術之一。但是語音識別功能算法復雜、計算量大,一般在計算機上實現,即使是嵌入式方面,多數方案也需要運算能力強的ARM或DSP,并且外擴RAM、FLASH等資源,增加了硬件成本,這些特點無疑限制了語音識別技術的應用,尤其是嵌入式領域。
        本系統采用的主控MCU為Atmel公司的ATMEGA128,語音識別功能則采用ICRoute公司的單芯片。內部集成優化過的語音識別算法,無需外部FLASH,RAM資源,可以很好地完成非特定人的語音識別任務。

        1 整體方案設計
        1.1 語音識別原理
        在計算機系統中,語音信號本身的不確定性、動態性和連續性是語音識別的難點。主流的語音識別技術是基于統計模式識別的基本理論,原理如圖1所示。

        a.JPG

        語音識別通常需要兩個階段完成。第一階段是訓練,主要是提取語音特征,用戶往往需要進行幾次語音訓練,經過預處理和特征提取后獲得相應特征參數。第二階段是識別,識別過程就是將輸入的語音特征參數和模型庫中的參數進行相似性比較,最后輸出匹配度最高的特征參數完成識別過程。

        2 硬件電路設計
        硬件框架如圖2所示,電路主要由主控制器電路和語音識別電路組成。ATMEGA128控制語音識別電路,輸出結果由ATMEGA128處理,然后通過總線來控制不同的設備。

        b.JPG

        2.1 控制器電路
        控制器選用Atmel公司生產的ATMEGA128芯片,采用先進的RISC結構,內置128 KB FLASH,4 KB SRAM,4 KB E2PROM等豐富資源。該芯片
        是業界高性能、低功耗的8位微處理器,并在8位單片機市場有著廣泛應用。
        2.2 LD3320語音識別電路
        LD3320芯片是一款“語音識別”專用芯片。該芯片集成了語音識別處理器和一些外部電路,包括A/D、D/A轉換器、麥克風接口、聲音輸出接口等,而且可以播放MP3。不需要外接任何的輔助芯片如FLASH,RAM等,直接集成到產品中即可以實現語音識別、聲控、人機對話功能。
        圖3為LD3320電路原理圖,與MCU通信采用SPI總線方式,時鐘不能超過1.5MHz。


        上一頁 1 2 3 下一頁

        評論


        相關推薦

        技術專區

        關閉
        主站蜘蛛池模板: 漠河县| 西畴县| 阳谷县| 囊谦县| 会泽县| 镇康县| 屏东县| 普格县| 天峻县| 曲沃县| 涡阳县| 平武县| 临高县| 武强县| 高邮市| 汶上县| 连州市| 东兴市| 田东县| 新泰市| 南昌县| 菏泽市| 涿州市| 西宁市| 日喀则市| 大渡口区| 云安县| 东丰县| 长宁县| 牙克石市| 三台县| 宁国市| 益阳市| 互助| 江西省| 百色市| 渭南市| 喀喇| 涞水县| 阜新市| 崇礼县|