博客專欄

EEPW首頁 > 博客 > 我給梵高當Tony：這三款AI繪圖工具，就離譜

我給梵高當Tony：這三款AI繪圖工具，就離譜

發布人：大數據文摘時間：2022-06-19 來源：工程師

加入技術交流群
- 掃碼加入
  和技術大咖面對面交流
  海量資料庫查詢

發布文章

大數據文摘授權轉載自果殼

作者：Simon_阿文

編輯：biu

很多人說今年是“AI 繪畫元年”。先是 Disco Diffusion 火出了圈，從 Text-to-Image（用文字生成圖像）開發社區和創意設計行業，火到了普通人的視野中。

人們熱衷將兩種完全不搭界的對象，比如“達芬奇”和“iPhone”字樣，輸入 AI 程序，然后等著畫面層層渲染完成。

又比如，我就把荷包蛋揉進了云朵里丨作者用 Disco Diffusion 生成

那是一種“拆盲盒”般的體驗。對于沒有任何美術基礎和繪畫能力的人來說，AI 的“融梗”圖大多足夠驚艷，即便效果“翻車”，也能通過調整描述詞繼續優化。

緊接著，AI 繪畫工具 Midjourney 也火了。和 Disco Diffusion 滿屏英文和代碼的簡陋界面不同，Midjourney 直接搭載在 Discord 頻道上，輸入指令的過程和給人發微信沒什么不同，更讓人吃驚的是，它生成畫作的時間一般在 60 秒左右。

神說：“要有 Wi-Fi”丨作者用 DALL·E 2 生成

然后，OpenAI 的 DALL·E 2 半途殺出，和前兩者擅長“概念畫風”不同，DALL·E 2 更“寫實”，60 秒不到可以生成 10 張圖，不滿意還可以擦去局部重新生成……短短幾個月，“最強 AI 畫師”的稱號幾次易主。

谷歌也坐不住，五月底發論文介紹自家選手——Imagen，直接叫板 DALL·E 2，號稱 Imagen 有“前所未有的寫實感和深度的語言理解”，目前暫未開放。

這兩個月來，我和前面三位“AI 畫師”頻繁打交道，幾乎每天都在測試描述詞、調教機器人，踩了很多坑，翻了不少車。但與此同時，我收獲了不少杰作。

這次，我將對比它們的畫作生成特點、用戶友好度等方面，同時整理好了它們的****，以及一些簡單的操作方法。

在普通用戶那里，它們是具像化想象的得力工具；在專業人群那里，如果將它們和其他工具聯動起來，能有無窮盡的想象空間。

Disco Diffusion：生成圖的藝術性最高

使用入口：

https://colab.research.google.com/github/alembics/disco-diffusion/blob/main/Disco_Diffusion.ipynb

Disco Diffusion 生成畫作的流程大概分為這幾步：打開程序；設置圖片尺寸、過程圖張數、生成圖張數等參數；用英文寫好描述詞（Prompts），格式大致為“畫作類型 + 對象（可以有多個）+ 畫風設定 + 一些起限定作用的修辭詞”；然后開始運行，等待 AI 渲染畫作。

我給 AI 寫的描述詞：“A beautiful painting of a starry night, shining its light across a sunflower sea by James Gurney, Trending on artstation.”

一般來說，你需要等半個小時，如果盯著屏幕看，你會看到圖像從滿是噪點，逐漸變得清晰、有細節起來。

使用期間，Disco Diffusion 可能會提示你在電腦上空出足夠的運行內存，但因為它運行在谷歌免費提供的 GPU 等計算資源上，對用戶的電腦硬件要求并不高，打開瀏覽器運行就可以。

用 AI 畫一個莫比斯風格的場景：“a beautiful painting of a spaceship flying over a desert by Moebius, trending on artstation.”

Disco Diffusion 本身是個免費的開源軟件，但如果你想要更快的出圖速度，可以買谷歌 Colab 會員，以分配到更快的云端計算資源。

除了只輸入文字讓 AI 自由發揮，你還可以事先墊進一張初始化圖片（Initial Image）去約束 AI 的創作。

比如，我先做了一張有樹木輪廓和綠色色塊的底圖（左），然后再操作，Disco Diffusion 就會在這個大框架下去發揮，成品為右圖

Disco Diffusion 生成圖理論上可以商用，其程序基于 MIT 開源協議，所有互聯網用戶可以免費使用、復制、修改甚至出售生成圖。但我覺得還是存有風險。風險主要來源于你的描述詞會引來畫風抄襲的爭議。

當你使用了風格鮮明的藝術家（尤其是在世的藝術家），以及某部商業作品作為關鍵詞時，都請不要直接拿來商用。

Midjourney：不怎么“超綱”，更“聽話”

Midjourney 目前還是邀請制，內測地址：

https://o9q981dirmk.typeform.com/to/zZtF1mVc?typeform-source=midjourney-gallery

為了測試 Midjourney 的生成效果，我復制了之前“投喂”給 Disco Diffusion 的關鍵詞——“星空”、“向日葵”、“梵高”——粘貼進去。

我用 Midjourney 生成的畫

看到成品，我有一個直觀的感受：Midjourney 的想象力沒有 Disco Diffusion 那么會“超綱”。但如果從輔助創作的角度考慮，我會更傾向于用 Midjourney 這個更“聽話的工具”，畢竟，沒有一個創作者愿意把創作主導權讓給 AI。

Midjourney 的優點就是：快。軟件生成圖非常快，一張算下來大概 60 秒。你要是對成品不滿意，還可以幾乎實時地提升細節，或延伸變化。

一分鐘生成 4 個小狗警察丨用 Midjourney 生成

Midjourney 搭在了通訊軟件 Discord 上，在對話框輸入“/image”后，用英文輸入描述詞，然后按下回車鍵。這個過程就像在和 AI 聊天一下。

60 秒后，你就可以在對話框里收到 4 張渲染好的圖片。如果對“圖 1”不滿意，可以點擊“U1”按鈕增加細節，按“V1”按鈕延伸變化，直到滿意為止。

于是，我拿 Midjourney 生成了“十九世紀的麥當勞”和“十八世紀的打工人”：

之所以說 Midjourney 是“產品化”了的 Disco Diffusion，一個是它的界面更友好，另一個是它還內建了一個創作社區，你可以看到玩家們用哪些描述詞生成了什么樣的畫作。這就是一個極具參考價值的“畫風”數據庫，太適合拿來“抄作業”了。

比如，我嘗試生成《愛，死亡和機器人》里那集《糟糕之旅》的場景，參考了上圖兩位藝術家的描述詞，之后就生成了滿意的畫作：

“抄作業”讓生成像樣作品的門檻進一步降低了，但另一方面，也會失去了很多探索的樂趣。不要讓游戲秘籍毀掉了一個好游戲。

版權方面，如果你是免費用戶，圖像的版權歸屬于 AI，每月支付 30 美元后，就能將圖片拿去商用了。但同時，如果你因此獲利達兩萬美元以上，則需要給 Midjourney 20% 的分成。

DALL·E 2：我給梵高理發，我讓大象轉身

我當了回“托尼”，用 DALL·E 2 給梵高理發，申請地址：

labs.openai.com/waitlist

我等了一個多月，才拿到了 DALL·E 2 的內測資格。如果說 Disco Diffusion 更擅長描繪氛圍、風景或概念藝術，那么 DALL· E 2 則擅長寫實。

“大象能轉身嗎？”我以這個“經典甲方需求”為例，試試 DALL· E 2 的寫實能力。

它轉過來了。

我讓網友扮演甲方，讓大象去做些別的事情。比如，讓大象在海洋館里游：

讓大象和鯊魚共舞：

讓大象開哈雷摩托車在路上狂飆：

讓大象被曹沖稱：

“甲方”們無話可說。

毫不夸張地說，這是我目前用過體驗最好的 AI 繪圖工具，操作足夠簡單，完成度高，速度快到可以當搜索引擎：不到一分鐘生成 10 張圖片（1024 × 1024），可無限延伸變化，甚至可以擦除局部重新生成。你可以不停地給梵高“理發”。

在版權方面，DALL·E 2 背后的組織 OpenAI 列了幾條嚴格的限制：圖片生成版權最終歸屬 OpenAI；僅供個人學習探索使用，不能商用，不能用于制作 NFT；不能在社交媒體上發布過于寫實的人臉生成結果，會有肖像侵權風險。

OpenAI 也聲稱已經禁止 AI 記住名人的臉，也規避了種族和性別的刻板印象等。

在苦苦等到 DALL·E 2 內測資格之前，我找了一個“平替”——DALL·E mini，是用第一代 DALL·E 做的 demo，生成速度快，但畫面完成度不及 DALL·E 2。

榴蓮沙發｜用 DALL·E mini 生成，軟件地址：

https://huggingface.co/spaces/dalle-mini/dalle-mini

生成圖像，只是第一步

“能不能讓它們動起來？”我看著 AI 返回來的畫作，開始想辦法：

AI 生成圖像完成，并不代表創意就結束了。如果你把它當成其中一個環節，再連接其他創意流程，想象空間是巨大的。

我再展示一下插畫師 Nerko 的創意：他先用 Midjourney 生成自己想要的素材，然后再將這些局部組裝起來。

@NekroXIII

在他手里，AI 是種“生產力”。挑選和合成，仍是他全權主導。在用上 Midjourney 之前，他已經畫了 15 年插畫。

*博客內容為網友個人發布，僅代表博主個人觀點，如有侵權請聯系工作人員刪除。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關鍵詞： AI

焦點

更多>>

技術專區

關閉

博客專欄

我給梵高當Tony：這三款AI繪圖工具，就離譜

相關推薦

技術專區