新聞中心

        EEPW首頁 > 嵌入式系統 > 設計應用 > 手語識別和翻譯

        手語識別和翻譯

        —— 殘疾人手語交流輔助系統
        作者:陳俊杰,舒劍飛,劉瑞峰 時間:2012-09-21 來源:電子產品世界 收藏

          摘要:為了使聾啞人與更多不懂手語的人自然地交流,本作品將手語翻譯成文字和語音,利用Microsoft 記錄手語手勢的三維坐標,通過機器學習和優化算法,在 Atom平臺上實現了手語翻譯。

        本文引用地址:http://www.104case.com/article/137079.htm

          簡介

          手語是聾啞人士的主要溝通工具,它是利用手部和身體的動作來傳達意義。雖然手語幫助它的使用者之間互相溝通,但聾啞人士與一般人的溝通卻十分困難,這個溝通障礙是源于大部分人不懂得手語。

          另一方面,聾啞小朋友由于很難表達自己,以及中國的聾啞教師數量有限,導致他們的學習出現困難,得不到和普通小朋友同等的學習機會。

          為了解決這個問題,我們設計實現了一個從手語動作翻譯成文字和聲音的翻譯器,令學習手語更有趣、更方便、更容易,以達到這個項目縮少聾啞人士與其他人的溝通障礙的目的。  

         

          工作原理和算法

          特征提取
          深度圖像的分辨率是640x480,意味著每秒鐘的數據有17.6MB,存儲如此大量的數據是不可能的。同時許多沒有用處的數據(例如背景)都包含在原始數據中。因此我們必須從原始數據中提取出有用的信息。骨架是一種可以用來表示手語的有用信息。

          我們利用提取用戶的骨架節點得到XYZ三點的坐標。我們一共提取了6個骨架節點,左手、左手肘、左肩、右手、右手肘、右肩。對于每一幀,我們從這些節點中計算出14個特征向量來表示這一幀的手語動作。經過標準化計算,我們用121幀來表示一個手語詞語,因此每一個詞語有1694個特征。

          原始數據標準化
          我們通過均勻分配和插值使原始數據標準化。通過二次插值法,利用最相近的三個原始數據計算出標準化的數據,使得每一個手語動作都統一用121幀來表示。

          支持向量機
          SVM(支持向量機)是統計學和計算機科學中的概念,簡而言之,給定一組已經分好類別的數據,而且分類依據是未知的,支持向量機訓練算法可以通過計算構建一個模型 ,一組新的數據到來時可以預測出新的數據屬于哪一個類別。

          SVM的模型將所有數據映像到一個高維空間里,并計算出不同類別數據之間的最大化幾何邊緣區,然后把新的數據映射到同一個空間,根據之前計算出的最大化幾何邊緣區來預測新的數據屬于哪一個類別。

          平臺限制與解決方法

          平臺限制
          使用的建議系統需求是CPU有雙核2.66 GHz或以上,內存有2GB或以上,但提供的平臺只有分別1GHz CPU和1G 內存,明顯與系統需求有差異。

          即使我們使用Linux操作系統,處理器使用率依舊滿載,并且幀率只有大約2到4左右,遠少于正常的30幀。在這種條件下,再加上處理器資源已被提取資源的線程占據,所以不可能在處理器里進行資料分析的工作。

          瓶頸
          為了找出瓶頸,我們首先關閉了圖像用戶接口。雖然處理器使用率降至85%,但幀率跟之前的一樣。我們觀察得到其中一個控制的線程依然是占領了整個線程。只是由于所提供的平臺是雙線程的關系,使用率分別被定在50%及35%。


        上一頁 1 2 下一頁

        關鍵詞: Intel Kinect OpenNI 201209

        評論


        相關推薦

        技術專區

        關閉
        主站蜘蛛池模板: 濮阳市| 调兵山市| 民和| 米脂县| 灵武市| 广水市| 阿合奇县| 洪江市| 台南市| 敦化市| 韶关市| 象州县| 屯昌县| 华蓥市| 玛曲县| 泾阳县| 云南省| 枣阳市| 措美县| 永兴县| 常山县| 城步| 温泉县| 溆浦县| 大丰市| 察隅县| 郓城县| 化隆| 高密市| 集贤县| 攀枝花市| 青岛市| 元阳县| 富阳市| 綦江县| 城固县| 通渭县| 万载县| 定安县| 彭水| 巴楚县|