基于ARM和Linux的字符采集與識別系統(tǒng)
2 圖像識別模塊
本文的目的是構建一個通用的字符識別系統(tǒng),圖像采集模塊實現(xiàn)了對掃描件圖像數(shù)據(jù)的獲取。由于系統(tǒng)基于嵌入式Linux,使得后續(xù)的圖像處理與字符識別軟件設計可以脫離硬件系統(tǒng)獨立進行,具有較高的通用性,可以根據(jù)實際應用場合開發(fā)和擴展不同的識別軟件,本文僅探討手寫體數(shù)字識別的應用。
識別算法:
線性判別分析(Linearity Distinction Analysis,LDA)是有效的特征抽取方法之一,廣泛用于人臉識別和字符識別等領域。其基本思想是選擇使Fisher準則函數(shù)達到極值的一組矢量作為最佳投影方向,樣本在該矢量集上投影后,達到最大的類間離散度和最小的類內離散度。為找到投影軸,應最大化類間離散矩陣Sb和類內離散矩陣Sw的比值

其中,c表示為模式的類別數(shù);μj表示為第j類的均值(其概率為Pj);μ0為全部樣本均值;*****為第j類模式i的h維向量;n是第j類的樣本數(shù);N是所有樣本數(shù)。μj和μ0定義為

最優(yōu)化問題可以通過Sb和Sw的特征值的求解而獲得。如果在樣本離散矩陣中非目標樣本占有比重較大,LDA并不能保證找到最優(yōu)子空間。LDA的最優(yōu)分類標準并不一定對分類準確性最優(yōu),有可能使得已經分開的鄰近類引起不必要的重迭。本文采用一種新的加權LDA方法(ILDA),其計算


顯然,如果σ(△)是個常數(shù),在投影方向上,

實驗樣本取自手寫體通用數(shù)據(jù)庫UCI,在Bhattacharyya距離(BD)分類器下對加權線性判別分析與相應的算法進行實驗比較和分析,取得較好的識別性能,證實了該方法提取的特征的有效性。
3 結束語
本文采用嵌入式Linux和ARM處理器軟硬件平臺,利用CIS傳感器配合運動平臺實現(xiàn)了圖像的采集和存儲,為嵌入式字符識別系統(tǒng)構建了一個圖像采集平臺。在字符識別的應用方面,探討了廣泛應用的手寫數(shù)字識別算法,在已有的線性判別分析算法基礎上,提出了一種改進的加權線性判別分析算法,并對該算法進行了實驗驗證,獲得了較好的識別率。本文引用地址:http://www.104case.com/article/151002.htm
評論