博客專欄

        EEPW首頁 > 博客 > 一覽端到端人臉識別最新進展,上大&京東AI研究院綜述被ACM旗艦期刊接收

        一覽端到端人臉識別最新進展,上大&京東AI研究院綜述被ACM旗艦期刊接收

        發(fā)布人:機器之心 時間:2022-01-21 來源:工程師 發(fā)布文章

        人臉識別是計算機視覺(CV)領域中最熱門和悠久的研究課題之一。本篇綜述全面地回顧了端到端深度學習人臉識別系統(tǒng)的三個組成要素,包括人臉檢測、人臉對齊和人臉表征。從最新的算法設計,評估指標,數(shù)據(jù)集,方法性能比較,現(xiàn)有的挑戰(zhàn)和未來發(fā)展方向等方面展開介紹,同時討論了不同要素對后續(xù)環(huán)節(jié)和整體識別系統(tǒng)的影響。通過該綜述,作者期望讀者能夠認識到各個要素中值得進一步探索的方法,以及如何從頭開始選擇合適的方法來建立一套先進的端到端人臉識別系統(tǒng)。該綜述已被 ACM 旗艦期刊 Computing Surveys(IF 10.282)接收。

        端到端深度人臉識別系統(tǒng)由三個關鍵要素構成:人臉檢測(face detection)、人臉對齊(face alignment)和人臉表征(face representation)。其中,人臉檢測的作用是定位靜止圖像或視頻幀中的人臉位置。然后,人臉對齊將人臉校準到一個規(guī)范的視角,并將人臉圖像裁剪到一個標準化像素大小。最后,在人臉表征階段,從對齊后的圖像中提取具有鑒別性的特征用于識別。

        在實際應用中,端到端人臉識別系統(tǒng)的性能表現(xiàn)同時取決于上述三種組成要素,任何一個環(huán)節(jié)出現(xiàn)短板,都會對端到端系統(tǒng)的識別性能造成不良影響,成為人臉識別系統(tǒng)的瓶頸。為了建立一套先進的端到端人臉識別系統(tǒng),因此有必要理解每個要素對系統(tǒng)整體的影響,以及各個要素之間的內在聯(lián)系。

        1.png

        論文地址:https://arxiv.org/pdf/2009.13290.pdf

        因此,來自上海大學、京東 AI 研究院和瑞爾森大學的研究者聯(lián)合撰寫的這篇綜述具有以下幾項主要貢獻:

        系統(tǒng)地調研并回顧了端到端深度人臉識別三個組成要素的最近進展;

        從多個方面介紹了這三個組成要素: 算法設計、評估指標、數(shù)據(jù)集和性能比較。并且指出了各個要素對其后續(xù)環(huán)節(jié)和整體系統(tǒng)的影響;

        分析了每個要素及其子類別現(xiàn)有的挑戰(zhàn)和發(fā)展方向,并從整體系統(tǒng)的角度進一步討論了主要的挑戰(zhàn)和未來趨勢。  

        下圖 1 為端到端人臉識別系統(tǒng)的流程展示:

        2.png

        下圖 2 介紹了各章節(jié)的主要內容,圖中左側部分主要是功能性的介紹,包括參考提供全面介紹和討論的功能內容。右側部分為技術性的內容,對三個要素分別進行了詳細的分析。  

        3.jpg

        人臉檢測

        給定一幅輸入圖像,人臉檢測的目標是找到圖像中所有的人臉,并給出所有人臉的包圍框的坐標和置信度得分。為了讓讀者更好的認識和理解人臉檢測的發(fā)展,研究者從多個角度對人臉檢測方法進行了分類,包括多階段、單階段、anchor-based、anchor-free、多任務學習、CPU 實時、面向問題等方法,具體分類可以參考下表 1。

        4.png

        表 1:深度人臉檢測方法的類別

        下圖 3 給出了具有代表性的人臉檢測方法的發(fā)展歷程。

        5.png

        圖 3:臉檢測方法的發(fā)展歷程

        此外,研究者討論了人臉檢測方法對后續(xù)人臉對齊和表征環(huán)節(jié)的影響。不精確的檢測框會導致人臉關鍵點定位性能下降,使用更魯棒的人臉檢測器能夠進一步提升識別性能。相關實驗結果如下圖 4 所示。

        6.png

        圖 4:人臉檢測對后續(xù)要素的影響

        人臉對齊

        人臉對齊的目標是將檢測到的人臉校準到一個規(guī)范的標準化視圖,并裁剪為固定圖像尺寸的圖像,這是提高人臉識別性能的必要步驟。人臉對齊方法包括基于關鍵點對齊和不使用關鍵點的兩種技術方案。其中,基于關鍵點的對齊方法是目前最常用的方案,根據(jù)如何獲取關鍵點可分為坐標點回歸、熱力圖回歸以及 3D 模型擬合三種方法。不使用關鍵點的人臉對齊方法通過可學習的方式直接生成對齊后的人臉圖像,具體分類可以參考下表 2。

        7.png

        表 2:人臉對齊方法的類別

        下圖 5 給出了人臉對齊方法的發(fā)展歷程。

        8.png

        圖 5:人臉對齊方法的發(fā)展歷程

        同時,研究者進一步討論了五種不同的對齊方法對人臉識別性能的影響。下圖 6 中的實驗結果表明恰當?shù)膶R策略能夠有利于提升人臉識別性能。

        9.jpg

        圖 6:合適的對齊策略有利于提升人臉識別性能

        人臉表征

        人臉表征利用深度卷積神經(jīng)網(wǎng)絡模型從預處理后的人臉圖像中提取具有身份判別力的特征,這些特征用于計算匹配人臉之間的相似度。我們從網(wǎng)絡模型架構,訓練監(jiān)督,以及具體的識別任務三個方面對人臉表征分別進行介紹,方法的具體分類可參考下表 3。

        10.png

        表 3:人臉表征學習方法的類別

        下圖 7 是人臉表征訓練監(jiān)督方法的發(fā)展歷程,包含了分類學習、特征嵌入、混合方法以及半監(jiān)督學習四種方案。

        11.png

        圖 7:人臉表征訓練監(jiān)督方法

        下圖 8 是三種有監(jiān)督人臉表示學習方法與公開數(shù)據(jù)集規(guī)模的發(fā)布趨勢,其中分類學習是目前主流研究和采用的方法。可以發(fā)現(xiàn)隨著訓練和測試的數(shù)據(jù)集規(guī)模不斷增加,對大規(guī)模數(shù)據(jù)集進行閉集分類訓練,可以近似模擬人臉識別的開集場景。這可能是近年來基于分類的訓練方法得到廣泛研究并占據(jù)主導地位的原因。 

        12.png

        圖 8:三種監(jiān)督人臉表示學習方法與公開數(shù)據(jù)集規(guī)模的發(fā)布趨勢

        討論和總結

        最后,研究者分析了端到端人臉識別系統(tǒng)各個組成要素現(xiàn)有的問題和未來趨勢,同時還有三種要素共有的挑戰(zhàn),以及面向整個識別系統(tǒng)的角度討論了現(xiàn)有挑戰(zhàn)和發(fā)展方向,如下表 4 所示。

        13.png

        表 4:端到端深度人臉識別系統(tǒng)的主要挑戰(zhàn)

        *博客內容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權請聯(lián)系工作人員刪除。



        關鍵詞: AI

        相關推薦

        技術專區(qū)

        關閉
        主站蜘蛛池模板: 乌审旗| 南开区| 永修县| 孝义市| 靖江市| 莫力| 邵武市| 都匀市| 拜城县| 孝义市| 孝昌县| 什邡市| 子洲县| 肃北| 突泉县| 南安市| 双峰县| 昭觉县| 昆山市| 株洲市| 洪湖市| 竹溪县| 永济市| 安新县| 湟源县| 枣阳市| 米泉市| 炉霍县| 社旗县| 汉沽区| 新田县| 南开区| 东平县| 萨迦县| 漳浦县| 孝昌县| 武定县| 洛扎县| 麻江县| 米泉市| 富宁县|