新聞中心

        EEPW首頁 > 手機與無線通信 > 設計應用 > 基于Gabor小波與RBF神經網絡的人臉識別新方法

        基于Gabor小波與RBF神經網絡的人臉識別新方法

        作者: 時間:2009-08-10 來源:網絡 收藏
        完成上述步驟之后,每人最多對應于3個隱層節點,整個網絡的結構隨之確定。

        本文引用地址:http://www.104case.com/article/157900.htm

        3.2 網絡混合學習算法
        網絡學習就是通過調整連接權W(j,k)、隱層中心Ck和寬度σk,以減小輸出誤差。隱層參數Ck、σk的調整是非線性過程,學習速度較慢;而W(j,k)調整是線性過程,學習速度較快。因此,網絡的每一次訓練分為兩個層次進行。
        3.2.1 連接權調整
        設輸出目標矩陣T∈Rsxn,其元素t(j,i)為0或為1,表示Pi是否屬于j類,T每列有、且僅有一個元素為l,表示Pi所屬類別。定義誤差函數為:


        y(j,i)表示Pi在輸出層j節點的輸出yj(Pi),可通過線性最小二乘法求解最佳權值W*。
        3.2.2 隱層中心及寬度調整
        W固定,由(11)式采用梯度下降法,經推導可得Ck和σk的迭代計算公式為:

        其中梯度矢量為:


        式中η1、η2分別為隱層中心Ck和寬度σk的學習速率(η1,η2>O),m為迭代次數。
        σk的學習速率通常大于Ck的學習速率(選取η2=2η1)。但ηl或η2的選取一般只能通過試驗分析確定。為此,本文從(13)式出發,提出了學習速率η2的估算。設σk(0)為高斯寬度的初值,經推導可得η2的估算公式如下:


        式中a為常數項,用于控制學習速率大小。實驗表明a=0.01可以較好的滿足條件。


        4 實驗結果

        試驗選用0RL數據庫,共包括40個人的臉部圖像,其中每人lO幅具有豐富的面部表情和姿態變化。在未對ORL進行任何預處理的條件下,選取每人的前5幅圖像共200幅進行訓練,另外200幅用于。然后將訓練與圖像相互交換,再次進行實驗,正確率取兩次試驗結果的均值。表1、表2、圖4和表3“任選5幅”部分的實驗都是上述。為了便于比較,對于表3的1至4行的識別率是從相應參考文獻上引用過來,第5行即本文是作者根據本文提出的算法進行實驗的結果,其中對于“任選3幅”是指第一次選取每人的前3幅圖像共120幅進行訓練,余下280幅用于識別,第二次再選取每人的后3幅圖像共120幅進行訓練,余下280幅用于識別,識別率取兩次結果的平均;“任選5幅(1幅側面)”是指每人參與訓練的樣本都含1幅側面的圖像,其它與“任選5幅”的相同。
        首先對第二個類別細分判別規則進行了驗證。表l列出了設置不同判別規則,兩次試驗所得RBF網絡的隱層節點個數以及識別錯誤的圖像數目。
        表1可以看出,“正確歸類規則”的設置比較合理,改變規則或者各個聚類不作細分,識別成功率較低。而且按照本文的聚類初始化方法,所得RBF網絡的隱層節點數目很少。40個人的訓練樣本,只有少數幾個人的特征矢量需要進行類別細分。所以,本文的初始化方法得到的網絡結構非常簡單,網絡的學習訓練和分類識別具有較高的效率,并具備優異的泛化能力。

        從表1還能看出,采用前五幅圖像和后五幅圖像進行訓練,后者識別成功率明顯高于前者。其中兩幅識別錯誤的以及相應的訓練樣本,如圖3所示。

        圖3中每行最后一幅為識別錯誤圖像,前五幅為訓練圖像。可以看出,前五幅人臉之間的姿態變化較小,而測試人臉的姿態與訓練樣本差別較大。若采用前五幅圖像訓練將會使得RBF網絡隱層神經元的聚類寬度偏小,造成這幾個測試樣本與本屬同類的隱層聚類中心相對距離較遠,神經元激活程度不夠,從而導致分類識別錯誤。當采用不同姿態的人臉訓練時,同類樣本問的差異可以使得RBF網絡的學習更加充分,有利于正確地分類識別。
        通過實驗,8個方向的濾波器若忽略其中任何一個方向,識別正確率都明顯下降,說明對于多姿態人臉來說,各個方向的人臉特征都不可缺少。若使用全部40個濾波器運算量又太大,同時也不能獲得更好的結果。限于篇幅,表2列出了全8個方向與部分頻率組合的實驗結果比較,從表2可以看出選取空間頻率v∈{1,2}或v∈{0,1,2}均能獲得最佳識別結果,故本文在2個空間頻率v∈{l,2}和8個方向μ∈{0,…,7}上進行采樣,形成16個濾波器。

        圖4表示對人臉采用分解和采樣法進行降維處理的識別結果。由圖4可知,分解方法明顯優于采樣法,本文特征提取方法的最佳維數在140維左右。

        由表3可知,同樣采用RBF的分類器:與方法l相比,Gabor的特征提取方法優于主分量分析(PCA)與Fisher線性鑒別變換(FLD)的組合;方法2采用高階偽澤爾尼克不變矩表征人臉,需要運用橢圓模型對人臉進行精確的尺度校正和分割。方法3采用5個頻率的40個Gabor濾波器,本文選用2個頻率的16個濾波器,在識別速度和占用內存等方面具有顯著優勢。方法4采用自組織稀疏RAM的N―tuple分類器,對于小樣本具有較好的泛化逼近能力,本文算法在相同試驗條件下具有不相上下的識別率。

        5 結論
        實驗表明Gabor小波對于人臉位置、圖像亮度變化具備較好的適應能力,在基于二維圖像的人臉識別方法中具有一定的優越性。同時,也注意到前人研究成果主要針對128×128的人臉圖像,進一步的研究工作可以根據Gabor小波的構造原理,選取適用于較低分辨率圖像(如64x64)的濾波器參數。由于濾波處理的計算復雜度為O(d2),人臉識別速度可以提高4倍,則有望滿足實時識別要求。
        RBF具有結構簡單、非線性逼近能力強、收斂速度快以及全局收斂等顯著優點。本文采用的RBF神經網絡初始化方法,充分利用了人臉特征矢量的相對分布信息,聚類初始化過程簡單、快速,同時可以保證RBF神經網絡結構極其簡單,具有較好的泛化能力。本文提出的學習速率估算方法具有普遍性,使得RBF網絡無需先驗參數、具備自適應能力。而且神經網絡是以并行方式處理信息,采用硬件實現能夠達到較高速度,所以該研究成果具有廣泛意義。

        矢量控制相關文章:矢量控制原理

        上一頁 1 2 下一頁

        評論


        相關推薦

        技術專區

        關閉
        主站蜘蛛池模板: 且末县| 张家口市| 嘉义市| 湘乡市| 河池市| 平遥县| 泸溪县| 米泉市| 龙南县| 梧州市| 原平市| 上虞市| 亳州市| 来宾市| 岐山县| 广南县| 中宁县| 高陵县| 绍兴市| 屏东县| 山阳县| 东方市| 新化县| 辽源市| 和田县| 驻马店市| 南岸区| 焦作市| 巴楚县| 神农架林区| 西宁市| 洮南市| 永胜县| 虎林市| 改则县| 枣强县| 电白县| 洛川县| 新巴尔虎右旗| 河间市| 明水县|