新聞中心

EEPW首頁 > 消費電子 > 設計應用 > 解析設計ARM語音識別系統的步驟

解析設計ARM語音識別系統的步驟

作者：時間：2018-08-06 來源：網絡

加入技術交流群
- 掃碼加入
  和技術大咖面對面交流
  海量資料庫查詢

伴著高新技能在軍事范疇的大范圍利用，武器裝備逐漸向高、精、尖方面開展。傳統的軍事練習因為練習時刻長、練習費用高、練習空間窄，常常不能到達預期的練習作用，已不能滿意現代軍事練習的需求。為解決上述問題，模仿練習應運而生。

本文引用地址：http://www.104case.com/article/201808/385420.htm

為進一步提高練習作用，這篇文章利用智能語音交互芯片規劃了某模仿練習器的示教與回放系統。示教系統為操作人員生動的演示規范操作流程及相應的操作表象，極大地縮短了對操作人員的練習時刻，提高了練習作用。回放系統經過記載操作練習進程中各操作人員的口令、聲響強度、動作、時刻、操作表象等，待操作練習結束后經過重演練習進程，以便操作者及時糾正自個的問題。示教系統也可理解為對規范操作練習進程的回放。該系統不需求虛擬現實技能的撐持，在小型的嵌入式系統上就能夠完結。

1 系統原理

該模仿練習器由一臺測控計算機和多臺從設備構成。如圖1所示。在此僅對一臺從設備進行介紹，其硬件系統主要由測控計算機、Arduino mega2560 操控器、語音辨認單元、聲強檢測單元、語音組成單元、面板操控單元、儀器面板等構成。面板操控單元較為復雜，包含多種操控電路，在模仿練習中擔任該從設備在Arduino mega2560 操控器的操控下完結整個練習進程，在示教與回放系統中完結對方才操作練習操作表象的重演，其詳細電路規劃在此不做介紹。

語音辨認單元擔任辨認操作人員的操作口令;聲強檢測單元擔任檢測聲強巨細并以此作為判別是哪臺從設備操作人員口令的依據;Arduino mega2560操控器擔任監督儀器面板各元件的狀況來辨認操作人員的動作，然后完結對操作練習進程的記載。各儀器的操作表象依據操作動作事前編制無需記載。在操作回放進程中，測控計算機依據所記載的數據，經過操控相應從設備的Arduino mega2560操控器重現所記載的操作進程。

2 單元系統規劃

2.1 語音辨認單元規劃

當時，語音辨認技能的開展十分迅速，依照辨認目標的類型能夠分為特定人和非特定人語音辨認。特定人是指辨認目標為專門的人，非特定人是指辨認目標是針對大多數用戶，通常需求收集多自己的語音進行錄音和練習，經過學習，然后到達較高的辨認率。

這篇文章選用的LD3320語音辨認芯片是一顆依據非特定人語音辨認(Speaker Independent Automatic SpeechRecognition，SI ASR)技能的芯片。該芯片上集成了高精度的A/D 和D/A 接口，不再需求外接輔佐的FLASH 和RAM，即能夠完結語音辨認、聲控、人機對話功用，供給了真實的單芯片語音辨認解決方案。而且，辨認的要害詞語列表是能夠動態編輯的。

語音辨認單元選用ATmega168 作為MCU，擔任操控LD3320完結一切和語音辨認有關的作業，并將辨認成果經過串口上載至Arduino mega2560 操控器。對LD3320芯片的各種操作，都必須經過寄存器的操作來完結，寄存器讀寫操作有2種方法(規范并行方法和串行SPI方法)。在此選用并行方法，將LD3320的數據端口與MCU的I/O口相連。

語音辨認流程選用中止方法作業，其作業流程分為初始化、寫入要害詞、開端辨認和呼應中止等。MCU的程序選用ARDUINO IDE編寫，調試完結后經過串口進行燒錄，操控LD3320完結語音辨認，并將辨認成果上載至Arduino mega2560操控器。

2.2 聲強檢測單元規劃

在進行語音辨認時需求判別是某一臺從設備操作人員的口令，為此規劃聲強檢測單元電路，該電路僅需能夠判別出相對聲強的巨細，無需檢測聲級，對檢測精度需求較低。

電容式MIC聲響傳感器將外部聲響信號變換成電信號，經NE5532擴大電路進行擴大，將輸入的微弱音頻信號變換為具有一定幅值的電壓信號，該電壓信號經AC/DC有效值變換電路進行裝換后進行再次擴大，最終由Arduino mega2560操控器的A/D進行采樣。其間D1 端接Arduinomega2560操控器的A/D，INT1端接Arduino mega2560操控器的外部中止1.當外界聲響信號大于預設的閾值時，三極管導通INT1端由高電平變為低電平發作外部中止，操控器呼應中止并進行A/D 采樣，采樣數據經均值濾波后保留，待測控計算機查詢時上載該聲強數據。

2.3 語音組成單元規劃

TTS(Text To Speech)文本轉語音技能是人機智能對話開展的趨勢。依據TTS技能的語音系統無需事前錄音就能夠隨時依據查詢條件查出并組成語音進行播報，然后大大減少了系統維護的作業量。利用此技能，經過MCU或許PC機就能操控語音芯片發音。

這篇文章選用SYN6658中文語音組成芯片進行語音組成。SYN6658 經過UART 接口或SPI接口通訊方法，接納待組成的文本數據，完結文本到語音(或TTS語音)的變換。操控器和SYN6658 語音組成芯片之間經過UART接口銜接，操控器經過串口通訊向SYN6658語音組成芯片發送操控指令和文本，SYN6658語音組成芯片把接納到的文本組成為語音信號輸出，輸出的信號經LM386 功率擴大器進行擴大后銜接到喇叭進行播映。

SYN6658語音組成電路選用芯片硬件數據手冊供給的典型使用電路進行規劃，在此不做介紹，功率擴大電路選用美國國家半導體出產的音頻功率擴大器LM386進行擴大。

在進行語音組成時首要進行初始化，包含發音人挑選、數字處理策略、語速調理、語調調理、音量調理等。

因為該系統要模仿多人發音，所以不一樣的從設備設置不一樣的發音人及語調與語速以便于區別。初始化后等待測控計算機的語音組成指令，待收到指令后芯片會向上位機發送1字節的狀況回傳，上位機可依據這個回傳來判別芯片當時的作業狀況。

3 系統軟件規劃

示教與回放系統的軟件規劃包含測控計算機的軟件規劃和各從設備Arduino mega260操控器的軟件規劃。

測控計算機是整個系統的操控中心，其軟件選用C#進行編寫，在示教與回放系統中主要是對操作數據的記載以便依據所記載的數據對操作進程進行準確回放，需求記載的數據包含：各從設備操作人員的操作口令，操作動作，口令及動作時刻，各操作對應的操作表象。為簡化記載數據，事前編制好各事情代碼，記載進程只記載代碼，大大提高程序效率。

在操作練習進程中測控計算機每隔50 ms 對下位機進行操控及輪詢，并記載反應數據，在數據記載時以50 ms 為一個單位。選用定時器對時刻進行操控。在回放進程中首要比對當時時刻和所記載的時刻，當所記載的時刻與當時時刻吻合時測控計算機操控下位機履行該事情，完結事情回放。

Arduino mega2560操控器擔任接納測控計算機的操控指令并履行指令，讀取語音辨認成果，對聲強數據收集和處理，操控語音組成單元進行語音組成等。Arduinomega2560 操控器選用串口中止的方法進行指令接納。

只要正確接納到指令才會履行并回傳成果，若測控計算機在限制時刻內未收到回傳成果則標明發作錯誤，測控計算機需從頭發送。

這篇文章利用智能語音芯片規劃了某模仿練習器的示教與回放系統，該系統不需求如今盛行的虛擬現實技能的撐持，僅在MCU的操控下就能夠運轉。該系統也能夠在小型的便攜式設備上完結，具有杰出的使用遠景。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關鍵詞： 計算機

焦點

更多>>

技術專區

關閉

新聞中心

解析設計ARM語音識別系統的步驟

評論

相關推薦

技術專區