基于卷積神經網絡的人臉識別檢測分析
基金項目:河南省高等學校青年骨干教師培養計劃,項目編號:2021GGJS190
本文引用地址:http://www.104case.com/article/202308/449818.htm0 引言
人臉識別技術的關鍵就在于人臉檢測,作為重要研究方向廣泛應用于模式識別和計算機識別領域[1]。人工設計特征作為傳統人臉檢測方法的重要監測依據。目前由于人臉檢測算法表現出較高的檢測精度,因而應用于多個領域[2]。人臉檢測算法結合深度學習在卷積神經網絡得到廣泛應用下逐漸獲取進一步發展,早已作為主流研究方法應用于各領域,檢測準確率高于傳統方法,超過95%[3],拓展人臉識別研究具有重要的意義。
近年,人臉識別技術早已被Facebook、Google、商湯科技、曠世科技應用融入到各個領域,尤其是在卷積神經網絡不斷持續進步發展的趨勢[4]。很多挑戰和問題在實際應用環節始終存在。盡管從識別準確度來看,在LFW 數據集中應用多種方式均可獲取較佳結果,人眼識別能力也得到顯著提升,然而必須要選取大量訓練樣本訓練各深度模型,倘若研究機構場所小型化或屬于高校,實現相對較為困難[5]。所以目前亟需解決的主要問題就在于怎樣訓練可滿足人臉匹配要求和快速區別人臉特征的性能佳且結構簡單[6]。本文應用卷積神經網絡到人臉識別領域,并開展網絡訓練以及測試優化分析。
1 基于卷積神經網絡的人臉檢測算法
圖1給出了AlexNet網絡模型結構圖。網絡模型中全連接層和卷積層分別為3 個和5 個,總共為8 層。將ReLU、局部響應歸一化及池化層增加至前兩層后,將Dropout 和池化加入到第6、7 層,并在第8 層應用softmax 分類器[7]。
圖1 AlexNet網絡結構
將Dropout 技術引進全連接層中,這種情況下全連接層在AlexNet 網絡模型訓練整個流程中的連接概率為固定且以隨機稀疏方式為主,將部分神經元丟棄,有利于網絡復雜度降低,參數計算量得到減少,過擬合現象也會在某種程度上減小[8]。需采取局部歸一化操作方式處理輸出結果,有效抑制局部神經元,進而促進網絡泛化能力的進一步強化。
網絡模型算量與卷積核結構尺寸大小相關,感受也隨著卷積核尺寸增大而擴大,盡管圖片特征信息提取效率有效增加,但計算參數急劇增加。小尺寸的卷積核被更多研究學者應用,可有效增加模型的寬度和深度。網絡參數模型訓練時長將得到顯著減少,同時還有利于降低第一層的參數計算量。
在人臉檢測時應用本文提出的網絡模型,需提前區分人臉及非人臉區域,為確保降低神經網絡參數,將第2 個全連接層刪除,僅將第1、第3 個全連接層保留。按照1×1 卷積核尺寸標準修改第1 個全連接層,用全連接神經網絡替代原有神經網絡,任意大小的尺寸均可輸入卷積神經網絡,人臉分類選用第2 個全連接層。本文所用的網絡結構參數見表1 所示。本文所用的網絡結構邏輯見圖2 所示。
圖2 網絡結構邏輯圖
將Dropout 技術引進全連接層中,這種情況下全連接層在AlexNet 網絡模型訓練整個流程中的連接概率為固定且以隨機稀疏方式為主,將部分神經元丟棄,有利于網絡復雜度降低,參數計算量得到減少,過擬合現象也會在某種程度上減小[8]。需采取局部歸一化操作方式處理輸出結果,有效抑制局部神經元,進而促進網絡泛化能力的進一步強化。
網絡模型算量與卷積核結構尺寸大小相關,感受也隨著卷積核尺寸增大而擴大,盡管圖片特征信息提取效率有效增加,但計算參數急劇增加。小尺寸的卷積核被更多研究學者應用,可有效增加模型的寬度和深度。網絡參數模型訓練時長將得到顯著減少,同時還有利于降低第一層的參數計算量。
在人臉檢測時應用本文提出的網絡模型,需提前區分人臉及非人臉區域,為確保降低神經網絡參數,將第2 個全連接層刪除,僅將第1、第3 個全連接層保留。按照1×1 卷積核尺寸標準修改第1 個全連接層,用全連接神經網絡替代原有神經網絡,任意大小的尺寸均可輸入卷積神經網絡,人臉分類選用第2 個全連接層。本文所用的網絡結構參數見表1 所示。本文所用的網絡結構邏輯見圖2 所示。
表1 網絡結構參數
2 實驗結果分析
2.1 數據集
作為評測數據集,FDDB 常用于人臉檢測。灰度和彩色圖共2 845 張圖片均包含在數據集中,共有5 171人臉標注數據,人臉拍攝環境為自然狀況。測試集挑戰性較高,同時低分辨率、遮擋等情況都包含在內,拍攝環境與日常應用場景都十分貼近。
作為人臉檢測的大型基準數據集,WIDERFace 由香港中文大學建立而成。采用手工標注數據集,人臉總數為4 萬張,光照及遮擋等不同場景下人臉圖像變化情況均包含在內。
2.2 網絡模型訓練設置
本文在訓練改進卷積神經網絡時,將Tensorfl ow 深度學習開源平臺作為重要應用工具,選取NVIDIAGTX1050 型GPU 加速,訓練數據用SSD 固態硬盤緩存,完成CUDA9.0GPU 并行計算庫的安裝。
網絡訓練基于網絡參數完成,同時將0 作為卷積層學習率,訓練的卷積層為候選框生成網絡特有,為確保能實現卷積神經網絡中人臉分類及候選框生成網絡間的共享,最后環節需要微調人臉分類網絡。
2.3 實驗結果分析
在人臉檢測中對本文改進的模型結構性能進行驗證,選取測試的數據集為FDDB 人臉數據集。召回率要求在實際使用過程中的嚴格程度更深,所以評估本算法應用的評價指標以FDDB 為主,Falsepositive 表示橫軸,即FP,誤檢數為檢測出人臉但實際非人臉的數量,Truepositiverate 表示縱軸,即recall 召回率。如圖3 所示,為測試曲線圖。
本文對比了CascadeCNN 及MTCNN 等較為經典的人臉檢測算法,測試評價方法均選用FDDB 數據庫實現,另外還對比了各檢測方法所耗費的時長,下圖為各檢測算法對應的數據結果。
圖3 FDDB評價圖
算法比較結果見表2。其中,fps 表示檢測速度,即每秒傳輸的幀數。通常算法檢測速度隨幀數增長而加快。本文主要是在GPU 上完成檢測速度的統一測試。與CascadeCNN、MTCNN,兩種算法相比,本文算法表現出較高的召回率,對比表中數據得出準確率最高,相比于MTCNN 和CascadeCNN 檢測速度較低,人臉簽到系統的基礎需求得到滿足。
表2 算法比較
為了確保人臉檢測算法多個特征能更直觀且清晰地顯示,在開展人臉檢測驗證前采用隨機方式挑選圖片,圖4 為檢測具體結果。側臉及戴頭盔遮擋的單人照片依次如圖(a)(b)所示,通過觀察對比得出,檢測人臉圖片的準確度及清晰度均相對較高,這意味著對于部分遮擋人臉或側臉采用本文算法展示的魯棒性較佳。
(a)
(b)
圖4 測試結果圖
3 結束語
本文開展基于卷積神經網絡的人臉識別檢測分析,得到以下有益結果:
1)本文算法表現出較高的召回率,人臉簽到系統的基礎需求得到滿足。
2)對于部分遮擋人臉或側臉采用本文算法展示的魯棒性較佳。
參考文獻:
[1] 姜紹忠,姚克明,陳磊,等.基于CNN與Transformer混合模型的口罩人臉識別方法[J].傳感器與微系統,2023, 42(1):144-148.
[2] 徐武,陳盈君,湯弘毅,等.局部特征映射與融合網絡的人臉識別優化算法[J].河南科技大學學報(自然科學版),2023, 44(02):59-64+72+7-8.
[3] 仲崇麗,劉華.改進卷積神經網絡的熱紅外成像人臉識別[J].激光雜志,2022,43(12):117-121.
[4] 季瑞瑞,謝宇輝,駱豐凱,等.改進視覺Transformer的人臉識別方法[J].計算機工程與應用,2023,59(8):117-126.
[5] 趙洪坡,劉顯梅.數據挖掘的熱紅外成像人臉識別研究[J].激光雜志,2022, 43(11):47-51.
[6] 孫金龍,吳振寧,肖仲喆,等.關于人臉識別算法對不同照明技術的魯棒性研究[J].電子器件,2022, 45(5):1123-1128.
[7] 馬倩,馬祥.聯合松弛塊對角表示矩陣回歸的遮擋人臉識別[J].計算機應用研究,2023,40(2):612-616+633.
[8] 張晨晨,王帥,王文一,等.針對人臉識別卷積神經網絡的局部背景區域對抗攻擊[J].光電工程,2023,50(1):113-125.
[9] 戚琦,馬迎新,王敬宇,等.面向算力受限邊緣環境的雙分支多尺度感知人臉檢測網絡[J].通信學報,2020,41(8):165-174.
[10] 皮家甜,楊杰之,楊琳希,等.基于多模態特征融合的輕量級人臉活體檢測方法[J].計算機應用,2020,40(12):3658-3665.
[11] 王藝皓,丁洪偉,李波,等.復雜場景下基于改進YOLOv3的口罩佩戴檢測算法[J].計算機工程,2020,46(11):12-22.
(本文來源于《電子產品世界》雜志2023年8月期)
評論