博客專欄

        EEPW首頁 > 博客 > 有手就行?把大象P轉身只需拖動鼠標,華人一作DragGAN爆火(2)

        有手就行?把大象P轉身只需拖動鼠標,華人一作DragGAN爆火(2)

        發布人:機器之心 時間:2023-05-20 來源:工程師 發布文章

        實驗


        為了展示 DragGAN 在圖像處理方面的強大能力,該研究展開了定性實驗、定量實驗和消融實驗。實驗結果表明 DragGAN 在圖像處理和點跟蹤任務中均優于已有方法。


        定性評估


        圖 4 是本文方法和 UserControllableLT 之間的定性比較,展示了幾個不同物體類別和用戶輸入的圖像操縱結果。本文方法能夠準確地移動操縱點以到達目標點,實現了多樣化和自然的操縱效果,如改變動物的姿勢、汽車形狀和景觀布局。相比之下,UserControllableLT 不能忠實地將操縱點移動到目標點上,往往會導致圖像中出現不想要的變化。


        圖片

        如圖 10 所示,它也不能像本文方法那樣保持未遮蓋區域固定不變。


        圖片


        圖 6 提供了與 PIPs 和 RAFT 之間的比較,本文方法準確地跟蹤了獅子鼻子上方的操縱點,從而成功地將它拖到了目標位置。


        圖片


        真實圖像編輯。使用 GAN inversion 技術,將真實圖像嵌入 StyleGAN 的潛空間,本文方法也可以用來操作真實圖像。


        圖 5 顯示了一個例子,將 PTI inversion 應用于真實圖像,然后進行一系列的操作來編輯圖像中人臉的姿勢、頭發、形狀和表情:


        圖片

        圖 13 展示了更多的真實圖像編輯案例:


        圖片

        定量評估

        研究者在兩種設置中下對該方法進行了定量評估,包括人臉標記點操作和成對圖像重建。


        人臉標記點操作。如表 1 所示,在不同的點數下,本文方法明顯優于 UserControllableLT。特別是,本文方法保留了更好的圖像質量,正如表中的 FID 得分所示。


        圖片

        這種對比在圖 7 中可以明顯看出來,本文方法打開了嘴巴并調整下巴的形狀以匹配目標臉,而 UserControllableLT 未能做到這一點。


        圖片


        成對圖像重建。如表 2 所示,本文方法在不同的目標類別中優于所有基線。


        圖片


        消融實驗


        研究者研究了在運動監督和點跟蹤中使用某種特征的效果,并報告了使用不同特征的人臉標記點操作的性能(MD)。如表 3 所示,在運動監督和點跟蹤中,StyleGAN 的第 6 個 block 之后的特征圖表現最好,顯示了分辨率和辨別力之間的最佳平衡。


        圖片


        表 4 中提供了

        *博客內容為網友個人發布,僅代表博主個人觀點,如有侵權請聯系工作人員刪除。



        關鍵詞: AI

        相關推薦

        技術專區

        關閉
        主站蜘蛛池模板: 车险| 凤阳县| 库尔勒市| 云霄县| 东山县| 若羌县| 甘洛县| 莱阳市| 天祝| 苏尼特右旗| 霍城县| 福鼎市| 大姚县| 库伦旗| 贡嘎县| 麟游县| 嘉峪关市| 开化县| 兰西县| 安阳市| 商水县| 曲靖市| 西盟| 林周县| 德格县| 湛江市| 安徽省| 郎溪县| 平阳县| 南安市| 台中市| 新密市| 馆陶县| 宣威市| 东宁县| 紫阳县| 哈尔滨市| 遂平县| 吉隆县| 临海市| 武鸣县|