博客專欄

        EEPW首頁 > 博客 > 我給梵高當Tony:這三款AI繪圖工具,就離譜

        我給梵高當Tony:這三款AI繪圖工具,就離譜

        發布人:大數據文摘 時間:2022-06-19 來源:工程師 發布文章

        大數據文摘授權轉載自果殼

        作者:Simon_阿文

        編輯:biu


        很多人說今年是“AI 繪畫元年”。先是 Disco Diffusion 火出了圈,從 Text-to-Image(用文字生成圖像)開發社區和創意設計行業,火到了普通人的視野中。


        人們熱衷將兩種完全不搭界的對象,比如“達芬奇”和“iPhone”字樣,輸入 AI 程序,然后等著畫面層層渲染完成。


        圖片

        又比如,我就把荷包蛋揉進了云朵里丨作者用 Disco Diffusion 生成


        那是一種“拆盲盒”般的體驗。對于沒有任何美術基礎和繪畫能力的人來說,AI 的“融梗”圖大多足夠驚艷,即便效果“翻車”,也能通過調整描述詞繼續優化。


        緊接著,AI 繪畫工具 Midjourney 也火了。和 Disco Diffusion 滿屏英文和代碼的簡陋界面不同,Midjourney 直接搭載在 Discord 頻道上,輸入指令的過程和給人發微信沒什么不同,更讓人吃驚的是,它生成畫作的時間一般在 60 秒左右。


        圖片

        神說:“要有 Wi-Fi”丨作者用 DALL·E 2 生成


        然后,OpenAI 的 DALL·E 2 半途殺出,和前兩者擅長“概念畫風”不同,DALL·E 2 更“寫實”,60 秒不到可以生成 10 張圖,不滿意還可以擦去局部重新生成……短短幾個月,“最強 AI 畫師”的稱號幾次易主。


        谷歌也坐不住,五月底發論文介紹自家選手——Imagen,直接叫板 DALL·E 2,號稱 Imagen 有“前所未有的寫實感和深度的語言理解”,目前暫未開放。


        這兩個月來,我和前面三位“AI 畫師”頻繁打交道,幾乎每天都在測試描述詞、調教機器人,踩了很多坑,翻了不少車。但與此同時,我收獲了不少杰作。


        這次,我將對比它們的畫作生成特點、用戶友好度等方面,同時整理好了它們的****,以及一些簡單的操作方法。


        在普通用戶那里,它們是具像化想象的得力工具;在專業人群那里,如果將它們和其他工具聯動起來,能有無窮盡的想象空間。


        Disco Diffusion:生成圖的藝術性最高


        圖片

        使用入口:

        https://colab.research.google.com/github/alembics/disco-diffusion/blob/main/Disco_Diffusion.ipynb


        Disco Diffusion 生成畫作的流程大概分為這幾步:打開程序;設置圖片尺寸、過程圖張數、生成圖張數等參數;用英文寫好描述詞(Prompts),格式大致為“畫作類型 + 對象(可以有多個)+ 畫風設定 + 一些起限定作用的修辭詞”;然后開始運行,等待 AI 渲染畫作。


        圖片我給 AI 寫的描述詞:“A beautiful painting of a starry night, shining its light across a sunflower sea by James Gurney, Trending on artstation.”


        一般來說,你需要等半個小時,如果盯著屏幕看,你會看到圖像從滿是噪點,逐漸變得清晰、有細節起來。


        使用期間,Disco Diffusion 可能會提示你在電腦上空出足夠的運行內存,但因為它運行在谷歌免費提供的 GPU 等計算資源上,對用戶的電腦硬件要求并不高,打開瀏覽器運行就可以。


        圖片用 AI 畫一個莫比斯風格的場景:“a beautiful painting of a spaceship flying over a desert by Moebius, trending on artstation.”


        Disco Diffusion 本身是個免費的開源軟件,但如果你想要更快的出圖速度,可以買谷歌 Colab 會員,以分配到更快的云端計算資源。


        除了只輸入文字讓 AI 自由發揮,你還可以事先墊進一張初始化圖片(Initial Image)去約束 AI 的創作。


        圖片比如,我先做了一張有樹木輪廓和綠色色塊的底圖(左),然后再操作,Disco Diffusion 就會在這個大框架下去發揮,成品為右圖


        Disco Diffusion 生成圖理論上可以商用,其程序基于 MIT 開源協議,所有互聯網用戶可以免費使用、復制、修改甚至出售生成圖。但我覺得還是存有風險。風險主要來源于你的描述詞會引來畫風抄襲的爭議。


        當你使用了風格鮮明的藝術家(尤其是在世的藝術家),以及某部商業作品作為關鍵詞時,都請不要直接拿來商用。


        Midjourney:不怎么“超綱”,更“聽話” 


        圖片

        Midjourney 目前還是邀請制,內測地址:

        https://o9q981dirmk.typeform.com/to/zZtF1mVc?typeform-source=midjourney-gallery


        為了測試 Midjourney 的生成效果,我復制了之前“投喂”給 Disco Diffusion 的關鍵詞——“星空”、“向日葵”、“梵高”——粘貼進去。


        圖片

        我用 Midjourney 生成的畫


        看到成品,我有一個直觀的感受:Midjourney 的想象力沒有 Disco Diffusion 那么會“超綱”。但如果從輔助創作的角度考慮,我會更傾向于用 Midjourney 這個更“聽話的工具”,畢竟,沒有一個創作者愿意把創作主導權讓給 AI。


        Midjourney 的優點就是:快。軟件生成圖非常快,一張算下來大概 60 秒。你要是對成品不滿意,還可以幾乎實時地提升細節,或延伸變化。


        圖片

        一分鐘生成 4 個小狗警察丨用 Midjourney 生成


        Midjourney 搭在了通訊軟件 Discord 上,在對話框輸入“/image”后,用英文輸入描述詞,然后按下回車鍵。這個過程就像在和 AI 聊天一下。


        60 秒后,你就可以在對話框里收到 4 張渲染好的圖片。如果對“圖 1”不滿意,可以點擊“U1”按鈕增加細節,按“V1”按鈕延伸變化,直到滿意為止。


        于是,我拿 Midjourney 生成了“十九世紀的麥當勞”和“十八世紀的打工人”:


        圖片


        圖片


        之所以說 Midjourney 是“產品化”了的 Disco Diffusion,一個是它的界面更友好,另一個是它還內建了一個創作社區,你可以看到玩家們用哪些描述詞生成了什么樣的畫作。這就是一個極具參考價值的“畫風”數據庫,太適合拿來“抄作業”了。


        圖片


        比如,我嘗試生成《愛,死亡和機器人》里那集《糟糕之旅》的場景,參考了上圖兩位藝術家的描述詞,之后就生成了滿意的畫作:


        圖片


        “抄作業”讓生成像樣作品的門檻進一步降低了,但另一方面,也會失去了很多探索的樂趣。不要讓游戲秘籍毀掉了一個好游戲。


        版權方面,如果你是免費用戶,圖像的版權歸屬于 AI,每月支付 30 美元后,就能將圖片拿去商用了。但同時,如果你因此獲利達兩萬美元以上,則需要給 Midjourney 20% 的分成。


        DALL·E 2:我給梵高理發,我讓大象轉身


        圖片


        我當了回“托尼”,用 DALL·E 2 給梵高理發,申請地址:

        labs.openai.com/waitlist


        我等了一個多月,才拿到了 DALL·E 2 的內測資格。如果說 Disco Diffusion 更擅長描繪氛圍、風景或概念藝術,那么 DALL· E 2 則擅長寫實。


         “大象能轉身嗎?”我以這個“經典甲方需求”為例,試試 DALL· E 2 的寫實能力。


        圖片


        它轉過來了。


        我讓網友扮演甲方,讓大象去做些別的事情。比如,讓大象在海洋館里游:


        圖片


        讓大象和鯊魚共舞:


        圖片


        讓大象開哈雷摩托車在路上狂飆:


        圖片


        讓大象被曹沖稱:


        圖片


        “甲方”們無話可說。


        毫不夸張地說,這是我目前用過體驗最好的 AI 繪圖工具,操作足夠簡單,完成度高,速度快到可以當搜索引擎:不到一分鐘生成 10 張圖片(1024 × 1024),可無限延伸變化,甚至可以擦除局部重新生成。你可以不停地給梵高“理發”。


        在版權方面,DALL·E 2 背后的組織 OpenAI 列了幾條嚴格的限制:圖片生成版權最終歸屬 OpenAI;僅供個人學習探索使用,不能商用,不能用于制作 NFT;不能在社交媒體上發布過于寫實的人臉生成結果,會有肖像侵權風險。


        OpenAI 也聲稱已經禁止 AI 記住名人的臉,也規避了種族和性別的刻板印象等。


        在苦苦等到 DALL·E 2 內測資格之前,我找了一個“平替”——DALL·E mini,是用第一代 DALL·E 做的 demo,生成速度快,但畫面完成度不及 DALL·E 2。


        圖片

        榴蓮沙發|用 DALL·E mini 生成,軟件地址:

        https://huggingface.co/spaces/dalle-mini/dalle-mini


        生成圖像,只是第一步


        “能不能讓它們動起來?”我看著 AI 返回來的畫作,開始想辦法:


        圖片

        圖片

        圖片

        圖片


        AI 生成圖像完成,并不代表創意就結束了。如果你把它當成其中一個環節,再連接其他創意流程,想象空間是巨大的。


        我再展示一下插畫師 Nerko 的創意:他先用 Midjourney 生成自己想要的素材,然后再將這些局部組裝起來。


        圖片

        圖片

        @NekroXIII


        在他手里,AI 是種“生產力”。挑選和合成,仍是他全權主導。在用上 Midjourney 之前,他已經畫了 15 年插畫。



        *博客內容為網友個人發布,僅代表博主個人觀點,如有侵權請聯系工作人員刪除。



        關鍵詞: AI

        相關推薦

        技術專區

        關閉
        主站蜘蛛池模板: 东宁县| 建德市| 页游| 清水河县| 长治县| 缙云县| 玛沁县| 河北省| 宁都县| 弥渡县| 鹤岗市| 商河县| 广东省| 贞丰县| 会泽县| 化州市| 柳河县| 元氏县| 芦山县| 宜昌市| 吉隆县| 平武县| 顺义区| 宁津县| 桂林市| 平湖市| 宁海县| 高碑店市| 巴彦淖尔市| 本溪市| 鲜城| 祁东县| 神农架林区| 盘锦市| 米泉市| 萨迦县| 金湖县| 铜山县| 威远县| 察哈| 迁安市|