基于RBF網絡和貝葉斯分類器融合的人臉識別方法
摘要:提出一種基于徑向基函數(RBF)網絡和貝葉斯分類器的人臉特征分類與識別算法,以提高小樣本人臉識別精度。通過基于聚類方法的RBF神經網絡和貝葉斯分類器融合設計實現人臉圖像的分類識別。實驗數據分析表明,該方法在人臉骨骼特征突出情況下具有較高的識別率。文中提出的分類器融合的識別方法具有良好的學習效率和識別精度品質指標。
關鍵詞:貝葉斯分類器;RBF神經網絡;人臉特征;分類;圖像
引言
本文基于人臉圖像分塊和奇異值壓縮,進行RBF 神經網絡和貝葉斯分類器融合的設計。將人臉圖像本身的灰度分布描述為矩陣,其奇異值特征具有轉置不變性、旋轉不變性、位移不變性、鏡像不變性等諸多重要的性質,進行各種代數和矩陣變換后提取的代數特征是人臉的表征。基于奇異值特征進行人臉識別的方法是由 Hong[1]首先提出來的。在樣本數量很大、維數很高的情況下,利用奇異值分解(SVD)壓縮降維處理,減少算法的時間復雜度,是描述人臉特征一種有效的方法。由于整體圖像的奇異值向量反映的是圖像整體的統計特征,對細節的描述還不夠深入,本文模擬人類識別人臉的模式,在圖像分塊和加權的基礎上,突出待識別人臉的骨骼特征,近似于人類在識別人臉時自動剔除同一人臉的變化部位的差異能力。
人臉識別在本質上是區分兩幅人臉圖像表觀上的差別是類內變化(同一人的不同圖像)還是類間變化(不同人的不同圖像)。因此,如何對類內變化以及類間變化精確的建模和分類成為人臉識別領域的重要研究內容之一。在眾多的建模、分類方法中,統計模型是一種主流方法,其中Moghaddam[8]提出的貝葉斯分類器得到了廣泛的認可。
徑向基函數(RBF)網絡是一種性能良好的前饋型三層神經網絡,具有全局逼近性質和最佳逼近性能,訓練方法快速易行,RBF 函數還具有局部響應的生物合理性。RBF神經網絡隱含層結點使用了非線性傳輸函數,比單層感知器網絡具有更強的分類能力。在隱含層中心確定的情況下,RBF神經網絡只需對隱含層至輸出層的單層權值學習修正,比多層感知器具有更快的收斂速度,這也是本文選擇RBF神經網絡作為分類器的原因。
在 RBF 神經網絡構建和初始化采取有監督的聚類算法,在網絡參數的最終調整和訓練方面采取 Hybrid學習(HLA)算法。在隱層參數固定的條件下,由線性最小二乘法計算隱層和輸出層之間的連接權值,由梯度下降法調整隱層神經元的中心和寬度。這種混合學習算法,能使RBF網絡逼近Moody準則下的最優結構,即:在沒有其它先驗知識的情況下,與給定樣本一致的規模最小的網絡就是最好的選擇。從而保證該網絡具有較好的泛化能力。
奇異值分解SVD
對于任何一個矩陣A∈Rm×n,利用奇異值分解將其轉化為對角矩陣。
設A∈Rm×n(不失一般性,設m≥n),且rank(A)=k,則存在兩個酉矩陣Um×m和Un×n及廣義對角陣Dm×m使下式成立:
其中U的列向量是AAT的特征向量,V的列向量是ATA的特征向量,T表示轉置。
稱為矩陣A的奇異值, ui(i=k+1,…,m)是AAT對應于λi=0的特征向量,vi(i=k+1,…, n)是ATA對應于λi=0的特征向量。如果矩陣A代表一幅人臉圖像,則式
表示對該人臉圖像進行了正交分解,將矩陣
中主對角線上的奇異值元素連同中剩余的(ri-k)個0組合構成一個n維列向量
。
由于任何實矩陣A對應唯一的奇異值對角陣,因此,一幅人臉圖像對應于唯一的奇異值特征向量。
本文提出的人臉特征提取方法實現的流程如下:
(1)從人臉數據庫選擇人臉作為識別訓練集;
(2)將被選入訓練集的人臉圖像幾何歸一化處理;將被選入訓練集的人臉圖像灰度歸一處理;
(3)將預處理過的人臉圖像劃分成大小為的子塊;
(4)將每一幅圖像變為一個列向量(先分別將每一個子塊所有向量排成一列,再將所有子塊按順序排成一列);然后以子塊為單位進行;
(5)計算全部人臉圖像的均值;計算每一類人臉圖像的平均臉,同時將人臉圖像列向量與類內平均臉做差。
基于面部骨骼特征、眼睛的分布、鼻子的形狀等結構特征,是鑒別人臉的主要依據。將每一幅人臉圖像所形成的矩陣劃分成…等個二維矩陣分別降維為一維列向量。求訓練集中所有對應子塊的平均值, ;再對每一類樣本中的所有對應子塊求平均,
;對應子塊進行樣本規范化,
;并求協方差矩陣:
,從中取 m 個較大特征值對應的特征向量,構成對應子塊的特征臉空間 W1 ,即W1 =[w11,w12,…,w1 m ]T 。再對訓練樣本進行規范化處理
,投影到特征臉空間,獲得投影特征為:
。對任一測試樣本對應子塊進行規范化處理,即
,然后得到投影特征,即
用上述方法逐一對每個子塊進行處理。得到。
基于特征分塊貝葉斯分類器設計
每個基于特征分塊的貝葉斯分類器,利用了所對應的圖像塊包含的判別信息,為得到性能更好的分類器,需要將這些分類器融合給出最終的判別結果。每個貝葉斯分類器實際上是一個子分類器。可以有多種辦法實現分類器融合,如加權求和、相乘等。本文采取加權求和的方法:
其中表示兩幅圖像
的相似度,L是貝葉斯分類器(FBBC)的總數(這里是9),
是與的第b個特征塊之間的差值。
是由第b個貝葉斯分類器計算出的類條件概率密度。是第b個貝葉斯分類器對應的權值。
評論