博客專欄

        EEPW首頁 > 博客 > 人類對AI最大的誤解,來自AI擴圖

        人類對AI最大的誤解,來自AI擴圖

        發布人:傳感器技術 時間:2023-12-10 來源:工程師 發布文章

        是時候展示真正的技術了。

        -----------------------
        編輯|Moon來源|青投創新



        這幾天,在各大媒體榜單中,你一定看到過“AI擴圖”的話題。


        為什么會火?


        可以說,AI擴圖的火爆程度和搞笑程度不相上下。


        先上一張傳播度很高的AI擴圖“佳作”:


        這位博主憑借這一條視頻單條視頻點贊量171.7萬,轉發量213.2萬,評論區有23.2萬互動量。


        許多網友紛紛效仿,在評論區留下自己通過AI擴圖后的離譜照片,有些評論都能達到幾萬到幾十萬的點贊。


        當然,明星和影視劇成了AI擴圖搞笑創作的“重災區”,有這樣:



        這樣的:

        還有這樣的:

        AI擴圖仿佛打開了一扇新世界的大門,讓普通人和AI也能輕松發生交集,只是可能會讓人類產生“AI很弱”的錯覺罷了。


        其實,專業選手是十分驚艷的。


        01

        AI擴圖的頂流們


        AI擴圖,就是基于AI算法的智能識別,它可以根據圖像的上下文和紋理預測和生成圖片缺失的部分,為原始圖片帶來更大的畫幅和更廣的視角。
        其實AI擴圖這個功能早在幾個月就已經挺火了,最早是5月份Adobe Photoshop上線智能擴圖功能,只需輸入文字提示,AI即可擴圖生成我們想象中的場景。
        那個時候就已經有人用Photoshop生成惡搞影視劇照,表情包,可謂是小火了一把。

        但,作為AI擴圖圈的大哥大,Adobe Firefly可不是用來搞笑的。


        它需要用戶使用畫筆進行添加或減去圖片內容,進行局部重繪。隨后,就可以輸入新的描述詞進行再創作。



        10月左右,Adobe Firefly進行了一次重大更新,這次更新之后,Adobe直接將其命名為Firefly 2。
        在Firefly 2功能下,無論是圖片渲染程度、分辨率、還是圖像模型等,均有了質的提升,特別是在渲染人體時,皮膚紋理、發絲等微小細節也均被照顧到。
        從官方發布的圖片來看,相較于Firefly 1,Firefly 2明顯更為真實,細節之處也經得起推敲。 


        (圖:Firefly 1&2對比)


        值得一提的是,Adobe向Photoshop Beta用戶免費開放公測的AI功能—Generative Expand,其核心功能就是擴展。


        如果對生成的圖片不滿意,還可以通過修改描述進行無限生成,直到滿意為止。
        據悉,單次圖片生成的時間約在1分鐘左右,再加上圖片生成后的精致效果,側面展現了其強大的算力水平。 


        Adobe的成功,讓其他AI巨頭也蠢蠢欲動。
        7月份MidJourney正式對外更新了“平移擴圖”功能,可以實現圖片進行前后“擴圖 1.5 倍”或“擴圖 2 倍”,相對之前固定式的生成式功能顯得更加人性化。
        說起MidJourney的擴圖功能,簡直想象力拉滿。
        我們先來看下這兩個畫面:

        你能想象它們是出自同一張圖片嗎?
        除此之外,還有更震撼的效果。 ,時長00:42這就是Midjourney在它最新5.2版本中帶來的Zoom Out功能。


        效果一出,不少網友在驚嘆“太瘋狂”之余,也在猜測著它“擴”了多少次,有網友大膽地給出了預估:50次!!

        更多網友則是紛紛自己開始搞花活,不到一個小時,直接出一部大片: 


        ,時長00:30

        如此來看,MidJourney的擴圖功能還是相當可以的。


        此外,還有我們前幾天介紹過的——Pika1.0。其可以完成視頻的擴展。



        不得不說專業選手果然是不一樣的。
        02

        AI擴圖另類出圈


        但說實話,像MidJourney、Adobe Photoshop這種專業軟件的擴圖功能對于普通人來說,還是有一定門檻的,實用性并不高。
        隨后,為了滿足普通用戶的需求,國產AI繪畫工具相仿上線AI擴圖功能,比如美圖、海藝AI、觸手AI以及抖音等等。
        拿抖音來說,AI擴圖功能一上線,就因其用戶體量大,使用門檻低,無需提示詞,和平臺流量扶持,迅速火爆出圈,基本達到全民皆可玩透的境界。
        抖音熱榜甚至達到幾千萬人在看的程度。
        于是,才有了文章開頭的局面,AI擴圖正在成為全民娛樂的工具。
        似乎……這個邏輯,確實不是人能想出來的!!
        大哥應該很迷茫。

        真的很想撬開AI的腦袋,看看它到底在想什么?!


        不過,作為一款娛樂工具,可以給它們打個滿分,畢竟它為很多博主帶來了不少的粉絲和流量。


        03

        真正的AI擴圖技術


        針對AI擴圖,其實不管是Midjourney、Photoshop、DALL-E 2還是Stable Diffusion,其背后原理也有些相似之處。


        像DALL-E、Stable Diffusion、Photoshop的Generative Fill等都用到了一種叫做Outpainting的技術。


        Outpainting是一種圖像處理技術,與Inpainting(圖像內部填充)相反,可以根據現有圖像的內容、風格和上下文,合成與原始圖像相協調的新內容,從而擴展圖像的視覺范圍。


        Outpainting通常依賴于深度學習模型,有基于內容擴散的、基于GAN的、基于語義理解的等。


        此外,AI擴圖不僅是增加像素的數量,更重要的是增加圖像分辨率的過程。


        例如,CNN是AI擴圖中常用的神經網絡,通過學習大量的低分辨率和高分辨率圖像對,來理解圖像特征,學習如何從低分辨率重建高分辨率圖像。


        超分辨率技術使得模型能夠填補低分辨率圖像中缺失的像素,從而生成更高分辨率的圖像。


        在擴圖過程中為了保證圖像細節還要注意細節增強、噪聲抑制等。


        雖然目前AI擴圖技術有了很大進展,但實時處理能力還有待提升,通常來說更高質量的圖像擴展需要更多的計算時間。


        現有的很多AI擴圖工具生成速度已經有了不小的提高,不過成品的質量是否符合邏輯,這個概率還是比較隨機的。



        *博客內容為網友個人發布,僅代表博主個人觀點,如有侵權請聯系工作人員刪除。



        關鍵詞: AI擴圖

        技術專區

        關閉
        主站蜘蛛池模板: 祁连县| 云南省| 汕头市| 安顺市| 苗栗市| 云林县| 左贡县| 阿克陶县| 黎川县| 墨竹工卡县| 阳泉市| 宁晋县| 天祝| 黄大仙区| 仪征市| 土默特左旗| 台中市| 怀安县| 长春市| 五家渠市| 阿图什市| 德保县| 武乡县| 柘城县| 青海省| 蓬溪县| 定陶县| 工布江达县| 怀仁县| 上栗县| 和静县| 巴彦淖尔市| 宁夏| 铅山县| 砚山县| 台北市| 敖汉旗| 广德县| 偏关县| 大港区| 农安县|