新聞中心

        EEPW首頁 > 模擬技術 > 設計應用 > 三星研究員為VR提出更優用于圖像扭曲的深度學習技術

        三星研究員為VR提出更優用于圖像扭曲的深度學習技術

        作者: 時間:2023-02-02 來源:映維網 收藏

        Image Warping(圖像扭曲/圖像校正)廣泛用于各種計算機視覺和圖形任務,例如圖像編輯、光流、圖像對齊和全向視覺(例如VR)。傳統方法應用逆坐標變換來插值輸入空間中缺失的RGB值。然而,基于插值的方法會導致輸出圖像中出現鋸齒和模糊偽影。

        本文引用地址:http://www.104case.com/article/202302/442945.htm

        盡管社區已經探索了一系列的解決方案,但其一般存在著性能,光譜偏差,或無法評估圖像扭曲的頻率響應等問題。

        韓國大邱慶北科學技術院和三星的研究人員提出了一種用于圖像扭曲的深度學習技術。與其他現有方案相比,團隊的發明可以降低存儲速度并將分辨率提高3dB。另外,與基于信號處理的圖像插值技術(雙三次插值)相比,相關技術減少了屏幕的混疊現象,從而能夠實現更自然的視頻輸出。特別是,它可以清晰地恢復圖像的高頻component。團隊表示,這種方法可以用于VR,并且無需額外訓練的情況下就能夠在投影透視方面質量上優于其他扭曲方法。

        基于信號處理的圖像插值技術(雙三次插值)通過指定圖像的特定位置來在各種環境中保存期望的圖像。它具有節省內存和速度的優點,但會降低質量并令圖像變形。

        為了解決這個問題,社區開發了基于深度學習的超高分辨率視頻圖像轉換技術,然而,它們大多數是基于卷積人工智能的技術,缺點是像素之間的值估計不準確,并可能導致圖像變形。克服所述缺點的隱式表達神經網絡技術正在引起人們的注意,但隱式神經網絡技術的缺點是它不能捕捉高頻component,并且它需要增加內存和速度。

        所以,韓國大邱慶北科學技術院和三星的研究人員將圖像分解為多個頻率,以便在圖像中表達高頻component的特征,并使用隱式表達神經網絡技術將坐標重新分配到分解的頻率,以便更清晰地顯示圖像。

        這是一種將圖像深度學習技術傅里葉分析與隱式表達神經網絡技術相結合的新技術。它可以通過人工智能網絡解決恢復圖像中的基本頻率component,改善無法恢復高頻component的隱式表達神經網絡。

        如圖1所示,團隊提出了一種用于圖像扭曲的局部紋理估計器(LTEW)。相關算法利用了從輸入圖像估計的傅里葉特征和坐標變換的雅可比矩陣。在幾何學中,雅可比行列式表示局部放大率。因此,在MLP表示之前,他們將空間變化的雅可比矩陣乘以每個像素的傅里葉特征。另外,像素形狀的空間變化先驗對于增強神經功能的表征能力至關重要。然后,通過給定坐標變換的梯度項數值計算由方向和曲率描述的像素形狀。

        基于LTEW的圖像扭曲網絡由編碼器(EΨ)、LTEW(hψ)和解碼器(gθ)組成。編碼器(E?)設計有深度SR網絡,如EDSR、RCAN、RRDB,無需升級模塊。解碼器(gθ)是具有ReLU的4層MLP,其隱藏維數為256。LTEW(hψ)以局部網格(δx)、形狀(s)和特征圖(z)為輸入,并包括振幅估計器(ha)、頻率估計器和相位估計器。

        振幅和頻率估計器由具有256個信道的3×3卷積層實現,相位估計器是具有128個信道的單個線性層。

        他們假設變形圖像在點f(xj)附近具有相同的紋理。因此,使用最近鄰域插值找到xj處的估計傅里葉信息(Aj,Fj)。然后,將估計相位添加到局部網格(δx)和估計頻率之間的內積。在解碼器(gθ)重新采樣圖像之前,將振幅和正弦激活輸出相乘。

        團隊指出,實驗證明LTEW在尺度和單應變換方面都超過了現有的扭曲方法。盡管先前的扭曲技術使用卷積和多項式插值作為重采樣模塊,但他們基于LTEW的隱式神經函數將連續坐標作為輸入。


        如上面的圖7,圖8,圖9和圖10所示,團隊提出的LTEW在一系列的比較測試中均實現了出色的效果。與其他現有方案相比,團隊的發明可以降低存儲速度并將分辨率提高3dB。另外,與基于信號處理的圖像插值技術(雙三次插值)相比,相關技術減少了屏幕的混疊現象,從而能夠實現更自然的視頻輸出。

        值得一提的是,團隊提到了全向成像(ODI)。隨著虛擬現實的快速發展,ODI已成為產品開發的關鍵。等矩形投影(ERP)廣泛用于頭戴式顯示器的成像管道。由于從球形網格到矩形網格的投影,像素在高緯度附近稀疏分布。

        在驗證算法的泛化能力時,團隊提出的LTEW學習了空間變化的屬性,所以這一方法無需額外訓練的情況下就能夠在投影透視方面質量上優于其他扭曲方法。

        相關論文:Learning Local Implicit Fourier Representation for Image Warping

        團隊表示,“這次開發的技術非常出色,因為它顯示出比現有圖像扭曲技術更高的恢復性能和更少的內存消耗。我們希望所述技術在未來用于圖像質量恢復和圖像編輯,并希望它將為學術界和行業做出貢獻。”



        關鍵詞: 圖像處理

        評論


        相關推薦

        技術專區

        關閉
        主站蜘蛛池模板: 吴桥县| 锦屏县| 碌曲县| 永丰县| 凌云县| 建平县| 镇雄县| 阿荣旗| 荥阳市| 章丘市| 沙湾县| 教育| 北票市| 巴彦县| 禹城市| 永丰县| 滦平县| 平泉县| 客服| 麻阳| 广安市| 仙游县| 阿瓦提县| 喀喇沁旗| 神木县| 洞口县| 长治市| 利川市| 石楼县| 隆回县| 延边| 克什克腾旗| 闽侯县| 富顺县| 泊头市| 拜泉县| 灌云县| 东平县| 赣州市| 桦甸市| 安阳县|