輸入「/imagine」和關鍵字, 一分鐘就能生成4 張圖,操作如此簡單的Midjouney, 甚至讓財經權威《經濟學人》在6 月都用它做封面。但台灣人為何特別瘋狂,甚至擁有全球最大的Facebook 社團?社群創始人林思翰與Vogue 藝術總監周青永,為你揭密Midjourney 這項AI 新繪圖工具狂潮。
AI技術早已不是新聞,尤其在2021年NFT熱潮下生成藝術(generative art)與機器學習(machine learning)更多進入大眾視野。投入這些大多需要coding基礎,但近期卻出現零基礎都能上手的AI繪圖工具。這也是Midjourney在今年5月推出beta版、開放公眾使用後,旋即引發全球關注的原因,《經濟學人》6月的「AI新境界」(AI's New Frontier)主題報導甚至直接用Midjourney製作封面。然而台灣人特別瘋狂,瞬間湧入一度癱瘓Midjourney伺服器,這源自5月20日Midjourney AI台灣社群創始人林思翰在Facebook如病毒擴散般的一篇貼文,「原本成立社團的初衷單純是大家聊天、交換邀請碼,沒想到變那麼大,連官方都嚇到說—你的社群比我們當時Discord上的人還要多。」100人成長為2萬多人全球最大的Midjourney社團,他訝異也開玩笑說台灣人「跟風」特別厲害。而帶領Vogue團隊賣出全球首個NFT封面的周青永,對新技術的關注也不落人後,認為台灣社群對科技的態度很開放,這或許是出自大眾對創作的嚮往。
Q:Midjourney是兩位首次運用的AI繪圖工具?
周青永:我算是首次使用。印象中AI繪圖被廣泛注意首先是2016年淘寶雙11購物節時,號稱AI設計平台「魯班」做了1.7億個Banner,當下半信半疑,之後就沒有新報導曝光。2020年在臺北設計與藝術指導協會的活動中,曾看過叁式的藝術總監何庭安分享機器學習成果,我再次注意到AI,隔年2021年就是大家熟知的NFT浪潮,Art Blocks平台為首的生成藝術作品受到關注,台灣也出現許多演算藝術家。直到Midjourney,我看見林思翰分享的文章,覺得進入門檻較低,不需要特別去懂coding,就想說來試試看。
林思翰:之前最受關注的是Google跟NVIDIA,可是他們只展示挑過的成果圖,我對沒有真正釋出應用的工具都是保持觀望態度,軟體的實力要使用才知道。我有用過Disco Diffusion,算是容易上手但還是要一點coding基礎,而且成果只限定幾款繪圖濾鏡,還達不到我的要求。Google的Imagen超級難申請,DALL·E 2 AI我排了好幾個月都還沒排到,像Midjourney釋出給大眾使用,我才真正感受到其威力。
Q:為什麼Midjourney能真正地引起大眾迴響?為何它讓那麼多人驚艷到?
林思翰:Midjourney引起社群迴響的最大關鍵在於簡單、幾乎零門檻,輸入關鍵字就能製圖,而且風格很廣、常常難以分辨是AI畫的,這讓人很興奮也很恐懼。社群、公開的性質讓Midjourney進步快速,新手不用埋頭自己算,可以(在Discord上)參考別人的算圖結果並複製關鍵字去改,大家可以不斷交流、研究如何優化關鍵字。而官方有投票機制每週判斷使用者喜歡哪些圖,以此更新演算法,可看作是大家日以繼夜努力優化出來的成果。
周青永:用中國流行語來講就是「簡單粗暴」。你只要輸入關鍵字,就能快速模仿一些大家熟知的藝術風格,蠻震撼的。我覺得台灣人對創作有一種嚮往,很多人可能沒有創作技能,但這種工具可以幫助他們快速實現對創作的憧憬。
Q:現在最流行輸入哪些關鍵字?AI與人腦的邏輯畢竟不同,有什麼技巧能更容易得到理想的結果?
林思翰:我什麼都算,覺得沒有一定好用的關鍵字,例如繪畫風格的圖輸入artstation可以幫助很多,但下在攝影風格上就很怪。如果只打廣義的形容詞像是beautiful,Midjourney會沒辦法定義精準,最好要指定藝術家、設計師等名稱,這非常考驗背景知識。台灣社群超愛新海誠、吉卜力兩個關鍵字,我想是因為風格強烈到難以忽視,例如同時輸入新海誠與多個藝術家,整張圖幾乎只顯現新海誠風格。不是說一些歐美藝術家不紅,我有嘗試輸入過,全部混在一起時反倒辨識度不高。
周青永:我一開始也想到新海誠,台灣偏愛唯美、夢境一般的風格,國外則不太避諱算強烈詭異的東西,但最近他們開始搭配FaceApp後製出穩定的人臉成果,唯美風格也逐漸增加,但我不偏好這種作法,這對優化Midjourney本身的機器學習沒幫助。我想演算出貼近攝影師拍出的人像,上傳過參考圖片看能不能縮短運算時間,但經常失敗,最後還是全憑調整關鍵字的內容與排序。算人臉用stunning或beautiful較容易得到美觀的成果,而輸入攝影師的名稱,其風格會對人臉有很大影響。跟AI溝通的邏輯很重要,想算出東亞臉孔,對AI來說亞裔範圍廣泛到中東、印度一帶,那就要縮小範圍,有人同時用日台韓三國作為關鍵字,我也嘗試把單眼皮加進去(有點刻板印象),會比較接近想像的東亞面孔。
Q:像Midjourney這樣的工具,對產業有怎樣的衝擊?現階段的限制又是什麼?
林思翰:目前與直接使用之間還有一段距離,但就創意廣告產業來說,確實是可以加速提案、找參考資料或繪製概念圖等流程。我想音樂工作者能利用平常累積的文字素材輔助繪製概念宣傳圖,插畫師、概念設計師這類具創作能力的人也能利用AI繪圖成果稍加修改,像角色插畫師就能生成背景節省不少時間。Midjourney的限制也很明顯,人與動物算是它的致命傷。再來是它只擅長畫複雜的東西,不適合算極簡風格,你可以想像它是拼圖的概念,叫它單純演算一個正圓、字母或漂亮漸層它做不到。取樣的資料庫也是個問題,像Artstation等都是國外素材庫,要找到亞洲或在地素材本身就很困難。現在解析度也有限制,但官方暫時沒必要開發這部分,產生更多細節破綻算再大也沒意義,反而優化演算法讓人臉不要歪掉比較重要。
周青永:做人臉確實會有這樣的狀況,解析度的確是下個階段才需面對的問題。有一件事很有趣,Midjourney會在演算加入一些變數條件,這是種可能性但有時輸出會不穩定,我之前嘗試了1,000多個結果後終於有滿意的成果,再算一次全部歪掉,瞬間懷疑人生。時尚產業面向很廣,目前還不到衝擊的程度。這在服裝設計師產出collection概念、我們用mood board跟攝影師溝通風格時或許有幫助,但Midjourney繪圖都有某種風格筆觸,還沒辦法擬真到攝影拍出的味道,除非想演算像德國新銳攝影師Elizaveta Porodina幫Zendaya拍Vogue Italia封面這種強烈藝術風格。此外我們經常需要拍時尚單品,但Midjourney無法精確還原某一單品,只能模仿大致風格,應用上就有困難。補充一下,我覺得社群小編礙於版權與預算時,可以善用這種工具。
Q:最後,我們想問:AI繪圖工具會取代人嗎?AI生成的作品能算是個人原創的作品嗎?
周青永:我認為它還是停留在工具的概念上,現階段還不能取代人,前一陣子不是有報導爆出研究員聲稱Google的LaMDA擁有自我意識?現在AI能夠提供回饋式的結果,但不會主動溝通或給予意見,還沒辦法達到互相理解,但AI繪圖可能會是下一代的主流創作工具。至於原創問題,我認為爭議在Midjourney模仿其他作品風格去製圖,可是人在創作過程中也無法避免參考到他人,我想若運用算圖將這些風格內化並表達出概念,就不只是仿作。致敬跟抄襲的界線永遠受熱議,我們也沒有一條準則說作品裡有幾成原創性才能稱為你的作品。
林思翰:我覺得不用太擔心,工業時代到現在人也沒被取代,未來對創意工作者的競爭力要求可能更高,但相信會找到新出路。像我作為導演控管品質不一定需要動手去做,大家還是會認為那些是我的作品,這跟AI繪圖很像,成果取決你的溝通、創意產出及後製調整能力。針對原創性問題,社團中有個律師分享法律上只保障人類創作的智慧財產權,國外就有案例以AI繪圖申請沒通過。法律之外的道德爭辯又見仁見智,但我們社團投票中有個共識,只要有對圖加工,不論比例多少都能聲稱有創作成分,邏輯在於你有無付出勞力,不能單純複製他人的關鍵字算圖就好。我自己在製圖後一定會有很大程度的修改,盡量讓人看出有調整過。
Hans Lin 林思翰
谷汩文化 Group.G 導演,從事廣告動畫設計工作多年,為ASUS、Acer、Samsung、Nespresso、Porsche、BVLGARI等客戶服務,曾受邀到Adobe與Apple擔任講師。
Jeter Chou 周青永
Vogue Taiwan藝術總監,擁有逾20年跨領域設計經驗,以臺北時裝週Fashion Gamer沉浸式AR街區體驗獲數位奇點獎肯定。身兼Condé Nast Taiwan數位產品設計主管,團隊曾於單季連續獲5項CSSDA S.Kudos,創下當時國內最多得獎紀錄,目前亦擔任CSSDA常駐評審。全球Vogue市場首個成功售出的NFT封面專案領導者與發起人。
文|吳哲夫
圖片提供|周青永、林思翰
一起透過La Vie 2022/8月號《職人與他的工具》,一窺工具與技術、人們之間的共創關係!