Midjourney創作怎麼玩?專家揭密關鍵字技巧、AI繪圖工具的限制與發展潛力

Midjouney_AI繪圖_01

輸入「/imagine」和關鍵字, 一分鐘就能生成4 張圖,操作如此簡單的Midjouney, 甚至讓財經權威《經濟學人》在6 月都用它做封面。但台灣人為何特別瘋狂,甚至擁有全球最大的Facebook 社團?社群創始人林思翰與Vogue 藝術總監周青永,為你揭密Midjourney 這項AI 新繪圖工具狂潮。

AI技術早已不是新聞,尤其在2021年NFT熱潮下生成藝術(generative art)與機器學習(machine learning)更多進入大眾視野。投入這些大多需要coding基礎,但近期卻出現零基礎都能上手的AI繪圖工具。這也是Midjourney在今年5月推出beta版、開放公眾使用後,旋即引發全球關注的原因,《經濟學人》6月的「AI新境界」(AI's New Frontier)主題報導甚至直接用Midjourney製作封面。然而台灣人特別瘋狂,瞬間湧入一度癱瘓Midjourney伺服器,這源自5月20日Midjourney AI台灣社群創始人林思翰在Facebook如病毒擴散般的一篇貼文,「原本成立社團的初衷單純是大家聊天、交換邀請碼,沒想到變那麼大,連官方都嚇到說—你的社群比我們當時Discord上的人還要多。」100人成長為2萬多人全球最大的Midjourney社團,他訝異也開玩笑說台灣人「跟風」特別厲害。而帶領Vogue團隊賣出全球首個NFT封面的周青永,對新技術的關注也不落人後,認為台灣社群對科技的態度很開放,這或許是出自大眾對創作的嚮往。

Midjouney_AI繪圖_05
周青永為設計友人演算的未來感建築影像。

Q:Midjourney是兩位首次運用的AI繪圖工具?

周青永:我算是首次使用。印象中AI繪圖被廣泛注意首先是2016年淘寶雙11購物節時,號稱AI設計平台「魯班」做了1.7億個Banner,當下半信半疑,之後就沒有新報導曝光。2020年在臺北設計與藝術指導協會的活動中,曾看過叁式的藝術總監何庭安分享機器學習成果,我再次注意到AI,隔年2021年就是大家熟知的NFT浪潮,Art Blocks平台為首的生成藝術作品受到關注,台灣也出現許多演算藝術家。直到Midjourney,我看見林思翰分享的文章,覺得進入門檻較低,不需要特別去懂coding,就想說來試試看。 

Midjouney_AI繪圖_07
周青永的〈未來奧運會〉。

林思翰:之前最受關注的是Google跟NVIDIA,可是他們只展示挑過的成果圖,我對沒有真正釋出應用的工具都是保持觀望態度,軟體的實力要使用才知道。我有用過Disco Diffusion,算是容易上手但還是要一點coding基礎,而且成果只限定幾款繪圖濾鏡,還達不到我的要求。Google的Imagen超級難申請,DALL·E 2 AI我排了好幾個月都還沒排到,像Midjourney釋出給大眾使用,我才真正感受到其威力。

Midjouney_AI繪圖_09
林思翰〈史前高等文明〉。

Q:為什麼Midjourney能真正地引起大眾迴響?為何它讓那麼多人驚艷到?

林思翰:Midjourney引起社群迴響的最大關鍵在於簡單、幾乎零門檻,輸入關鍵字就能製圖,而且風格很廣、常常難以分辨是AI畫的,這讓人很興奮也很恐懼。社群、公開的性質讓Midjourney進步快速,新手不用埋頭自己算,可以(在Discord上)參考別人的算圖結果並複製關鍵字去改,大家可以不斷交流、研究如何優化關鍵字。而官方有投票機制每週判斷使用者喜歡哪些圖,以此更新演算法,可看作是大家日以繼夜努力優化出來的成果。

Midjouney_AI繪圖_10
Discord的操作介面,周青永嘗試運算符合時尚審美的作品。

周青永:用中國流行語來講就是「簡單粗暴」。你只要輸入關鍵字,就能快速模仿一些大家熟知的藝術風格,蠻震撼的。我覺得台灣人對創作有一種嚮往,很多人可能沒有創作技能,但這種工具可以幫助他們快速實現對創作的憧憬。

Midjouney_AI繪圖_04
林思翰〈不能共存的節日〉。

Q:現在最流行輸入哪些關鍵字?AI與人腦的邏輯畢竟不同,有什麼技巧能更容易得到理想的結果? 

林思翰:我什麼都算,覺得沒有一定好用的關鍵字,例如繪畫風格的圖輸入artstation可以幫助很多,但下在攝影風格上就很怪。如果只打廣義的形容詞像是beautiful,Midjourney會沒辦法定義精準,最好要指定藝術家、設計師等名稱,這非常考驗背景知識。台灣社群超愛新海誠、吉卜力兩個關鍵字,我想是因為風格強烈到難以忽視,例如同時輸入新海誠與多個藝術家,整張圖幾乎只顯現新海誠風格。不是說一些歐美藝術家不紅,我有嘗試輸入過,全部混在一起時反倒辨識度不高。

Midjouney_AI繪圖_02
林思翰讓Midjourney在台灣爆紅的十二生肖創作。

周青永:我一開始也想到新海誠,台灣偏愛唯美、夢境一般的風格,國外則不太避諱算強烈詭異的東西,但最近他們開始搭配FaceApp後製出穩定的人臉成果,唯美風格也逐漸增加,但我不偏好這種作法,這對優化Midjourney本身的機器學習沒幫助。我想演算出貼近攝影師拍出的人像,上傳過參考圖片看能不能縮短運算時間,但經常失敗,最後還是全憑調整關鍵字的內容與排序。算人臉用stunning或beautiful較容易得到美觀的成果,而輸入攝影師的名稱,其風格會對人臉有很大影響。跟AI溝通的邏輯很重要,想算出東亞臉孔,對AI來說亞裔範圍廣泛到中東、印度一帶,那就要縮小範圍,有人同時用日台韓三國作為關鍵字,我也嘗試把單眼皮加進去(有點刻板印象),會比較接近想像的東亞面孔。

Midjouney_AI繪圖_08
周青永發現人臉在畫面中比例越小,越難控制並克服恐怖谷效應,因此成功的人像作品大多以肖像為主體。

Q:像Midjourney這樣的工具,對產業有怎樣的衝擊?現階段的限制又是什麼? 

林思翰:目前與直接使用之間還有一段距離,但就創意廣告產業來說,確實是可以加速提案、找參考資料或繪製概念圖等流程。我想音樂工作者能利用平常累積的文字素材輔助繪製概念宣傳圖,插畫師、概念設計師這類具創作能力的人也能利用AI繪圖成果稍加修改,像角色插畫師就能生成背景節省不少時間。Midjourney的限制也很明顯,人與動物算是它的致命傷。再來是它只擅長畫複雜的東西,不適合算極簡風格,你可以想像它是拼圖的概念,叫它單純演算一個正圓、字母或漂亮漸層它做不到。取樣的資料庫也是個問題,像Artstation等都是國外素材庫,要找到亞洲或在地素材本身就很困難。現在解析度也有限制,但官方暫時沒必要開發這部分,產生更多細節破綻算再大也沒意義,反而優化演算法讓人臉不要歪掉比較重要。 

Midjouney_AI繪圖_11
周青永發現人臉在畫面中比例越小,越難控制並克服恐怖谷效應,因此成功的人像作品大多以肖像為主體。

周青永:做人臉確實會有這樣的狀況,解析度的確是下個階段才需面對的問題。有一件事很有趣,Midjourney會在演算加入一些變數條件,這是種可能性但有時輸出會不穩定,我之前嘗試了1,000多個結果後終於有滿意的成果,再算一次全部歪掉,瞬間懷疑人生。時尚產業面向很廣,目前還不到衝擊的程度。這在服裝設計師產出collection概念、我們用mood board跟攝影師溝通風格時或許有幫助,但Midjourney繪圖都有某種風格筆觸,還沒辦法擬真到攝影拍出的味道,除非想演算像德國新銳攝影師Elizaveta Porodina幫Zendaya拍Vogue Italia封面這種強烈藝術風格。此外我們經常需要拍時尚單品,但Midjourney無法精確還原某一單品,只能模仿大致風格,應用上就有困難。補充一下,我覺得社群小編礙於版權與預算時,可以善用這種工具。 

Q:最後,我們想問:AI繪圖工具會取代人嗎?AI生成的作品能算是個人原創的作品嗎?

周青永:我認為它還是停留在工具的概念上,現階段還不能取代人,前一陣子不是有報導爆出研究員聲稱Google的LaMDA擁有自我意識?現在AI能夠提供回饋式的結果,但不會主動溝通或給予意見,還沒辦法達到互相理解,但AI繪圖可能會是下一代的主流創作工具。至於原創問題,我認為爭議在Midjourney模仿其他作品風格去製圖,可是人在創作過程中也無法避免參考到他人,我想若運用算圖將這些風格內化並表達出概念,就不只是仿作。致敬跟抄襲的界線永遠受熱議,我們也沒有一條準則說作品裡有幾成原創性才能稱為你的作品。 

Midjouney_AI繪圖_06
林思翰〈蔘命之樹〉。

林思翰:我覺得不用太擔心,工業時代到現在人也沒被取代,未來對創意工作者的競爭力要求可能更高,但相信會找到新出路。像我作為導演控管品質不一定需要動手去做,大家還是會認為那些是我的作品,這跟AI繪圖很像,成果取決你的溝通、創意產出及後製調整能力。針對原創性問題,社團中有個律師分享法律上只保障人類創作的智慧財產權,國外就有案例以AI繪圖申請沒通過。法律之外的道德爭辯又見仁見智,但我們社團投票中有個共識,只要有對圖加工,不論比例多少都能聲稱有創作成分,邏輯在於你有無付出勞力,不能單純複製他人的關鍵字算圖就好。我自己在製圖後一定會有很大程度的修改,盡量讓人看出有調整過。

Midjouney_AI繪圖_03
周青永最近以宇宙終結為概念的演算新嘗試。

Hans Lin 林思翰

谷汩文化 Group.G 導演,從事廣告動畫設計工作多年,為ASUS、Acer、Samsung、Nespresso、Porsche、BVLGARI等客戶服務,曾受邀到Adobe與Apple擔任講師。

Jeter Chou 周青永

Vogue Taiwan藝術總監,擁有逾20年跨領域設計經驗,以臺北時裝週Fashion Gamer沉浸式AR街區體驗獲數位奇點獎肯定。身兼Condé Nast Taiwan數位產品設計主管,團隊曾於單季連續獲5項CSSDA S.Kudos,創下當時國內最多得獎紀錄,目前亦擔任CSSDA常駐評審。全球Vogue市場首個成功售出的NFT封面專案領導者與發起人。

文|吳哲夫

圖片提供|周青永、林思翰

一起透過La Vie 2022/8月號《職人與他的工具》,一窺工具與技術、人們之間的共創關係!

延伸閱讀

RECOMMEND

為放鬆而生的瀏覽器「Opera Air」:透過正念練習、冥想引導,幫助你從繁雜資訊中找到心流

為放鬆而生的瀏覽器「Opera Air」:透過正念練習、冥想引導,幫助你從繁雜資訊中找到心流

現代人的生活不能沒有瀏覽器,我們使用瀏覽器工作、購物、娛樂,與網路世界連結。這款瀏覽器「Opera Air」,號稱第一款「為放鬆及紓壓而設計的瀏覽器」,內建正念練習、冥想引導、運動指導等,它不僅僅是瀏覽網頁的工具,更能幫助使用者管理壓力、提升專注力,並在一天當中保持清晰的情緒狀態。

一款為放鬆而生的瀏覽器

由挪威瀏覽器開發商Opera推出的最新產品「Opera Air」,是全球首款以正念為核心設計的瀏覽器。Opera Air以北歐極簡視覺與霧面玻璃介面呈現,其兼具一般瀏覽器的功能,並結合呼吸練習、冥想、雙耳節拍(Binaural beats)、伸展運動等一系列體驗,讓使用者在工作階段中感到更放鬆。

為放鬆而生的瀏覽器「Opera Air」:透過正念練習、冥想引導,幫助你從繁雜資訊中找到心流
Opera Air使用介面(圖片來源:Opera Air)

針對Opera Air的發表,Opera產品資深總監Mohamed Salah表示:「網路世界雖然美好,卻也容易讓人感到混亂與不知所措,所以我們決定運用科學方法,幫助使用者更有條理地探索網路世界,讓他們在瀏覽時感到更輕鬆、更高效。」

在工作間進行正念練習

Opera Air最有特色的功能,就是引導使用者進行正念休息。每個練習時長介於3-15分鐘,使用者可以自行調整音量、自然背景聲與背景音樂,也能設定定時提醒,確保自己不會忘記適時休息。

為放鬆而生的瀏覽器「Opera Air」:透過正念練習、冥想引導,幫助你從繁雜資訊中找到心流
Opera Air最有特色的功能,就是引導使用者進行正念休息(圖片來源:Opera Air)

其中,「Take a Break」模式提供呼吸練習、冥想以及身體掃描(Body scan),而「Boosts」模式則利用雙耳節拍技術,透過在左右耳播放稍有差異的頻率,進而影響大腦波動,促進 放鬆、專注或冥想狀態。藉由這些練習,使用者將能感受到創意力與專注度提升,並獲得深度的放鬆。

為放鬆而生的瀏覽器「Opera Air」:透過正念練習、冥想引導,幫助你從繁雜資訊中找到心流
「Boosts」模式利用雙耳節拍技術,進而影響大腦波動,促進 放鬆、專注或冥想狀態(圖片來源:Opera Air)

在Opera Air中,正念練習並不會影響網頁瀏覽體驗。使用者可以在瀏覽網頁或編輯文件時,開啟「Focused Calm」模式,透過背景音樂與大自然音效,建立深度專注的心流狀態。

除了正念練習外,Opera Air也提供其他實用功能如:

▎智慧運動

邀請使用者在3D模型的指導下,進行平衡運動練習,與身體重新連結、提高靈活性。

為放鬆而生的瀏覽器「Opera Air」:透過正念練習、冥想引導,幫助你從繁雜資訊中找到心流
(圖片來源:Opera Air)

▎引導式冥想

透過獨特的聲音引導,帶領使用者進入放鬆、寧靜的個人空間,在此暫停、深呼吸並重新專注於當下。

為放鬆而生的瀏覽器「Opera Air」:透過正念練習、冥想引導,幫助你從繁雜資訊中找到心流
(圖片來源:Opera Air)

▎Aria AI

無需付費或訂閱的內建AI助手,可即時對話、生成圖像、摘要文章、語音輸出。

為放鬆而生的瀏覽器「Opera Air」:透過正念練習、冥想引導,幫助你從繁雜資訊中找到心流
(圖片來源:Opera Air)

▎廣告攔截

內建廣告攔截功能,減少干擾,讓瀏覽體驗更流暢、無壓力。

為放鬆而生的瀏覽器「Opera Air」:透過正念練習、冥想引導,幫助你從繁雜資訊中找到心流
(圖片來源:Opera Air)

▎免費VPN

內建免費VPN,提供快速且穩定的連線體驗,並確保隱私安全與網路保護。

為放鬆而生的瀏覽器「Opera Air」:透過正念練習、冥想引導,幫助你從繁雜資訊中找到心流
(圖片來源:Opera Air)

延伸閱讀

RECOMMEND

從生活出發,捕捉生命的「躍動」 ViewSonic 第五屆 ColorPro Awards 國際視覺藝術暨攝影展於松菸展出百大入圍作品!

從鏡頭、螢幕看見生命的活力,捕捉躍動的瞬間!生活是人們感受生命最為直觀的方式,在我們習以為常的生活中,入微的、貼切的找到生命的活力,而躍動正是這種活力的展現。

第五屆ColorPro Awards以「躍動Momentum」為題,號召各方創作者一同發揮自己的想像力、觀察力並反哺成觸動人心的作品。ViewSonic將於1/17()1/19() 在松山文創園區展出近150件的得獎作品,讓觀展者可以從創作者的視角出發,捕捉每個躍動的瞬間! 

2020年首屆賽事以來,ColorPro Awards已然成為全球創作者不可缺席的年度盛會。今年吸引來自超過100多國的創作者參加,參賽作品數量達10,461件。為了鼓勵創作以及多元的作品面向,本屆賽事特別新增了數位藝術以及生成藝術等獎項,讓創作者透過科技突破傳統媒材限制,促進探索全新藝術形式。 

展覽主視覺以金色作為主色調,象徵創作的豐富能量與高貴質感,並巧妙搭配簡潔通透的金屬展架,營造出現代與藝術交融的氛圍。在充滿人文氣息的展覽空間中,每件作品的故事與情感得以被完美呈現,讓觀展者不僅能欣賞作品的細節與美感,更能透過創作者視角,深刻感受「躍動Momentum」主題中迸發的活力,體驗藝術與創意激盪之美。 

獲獎作品簡介:

 •  靜態攝影類 : 

本次靜態攝影類由來自智利的Benjamín Yavar奪冠,其作品《蟲洞 (Wormhole)》捕捉潛水者準備穿越如蟲洞排列的魚群時的壯觀場景。

ViewSonic 第五屆 ColorPro Awards

靜態攝影類第二名由來自土耳其的Hüseyin Karahan奪得,其作品《游泳比賽(Swimming race )》呈現游泳比賽時,水中的泳者在有秩序地向前進的有趣畫面。 

ViewSonic 第五屆 ColorPro Awards

靜態攝影類第三名由來自印度的Mahendra Bakle獲得,其作品《火山騎士Riders of the Volcano )呈現夕陽餘暉中,布羅莫火山旁騎士瀟灑的剪影。 

ViewSonic 第五屆 ColorPro Awards

 •  動態攝影類 : 

動態攝影類第一名由來自埃及的Serageldin Abouibrahim奪冠,其作品色彩的精(Essence of colors透過一系列動態場景,展現藝術家從空白畫布到情感豐沛傑作的自我探索與創作旅程。 

動態攝影類第二名 James Varela 在多種自然場景的切換中,展現宇宙的躍動。 

動態攝影類第三名動能(Momentum由來自英國的創作者Tiger Law獲得,在交錯的音樂和繪畫場景中,呈現出作者對Momentum一詞的獨特觀點。 

  •  數位藝術類 

數位藝術類第一名由來自葡萄牙的António Montanha奪冠,其作品《戀人們The Lovers)》中,金色蜻蜓停留於扶桑花間,展現異國花卉的奇艷之美。 

ViewSonic 第五屆 ColorPro Awards
  •  生成藝術類 (人氣獎) 

生成藝術類別旨在激發和探索新藝術工具的創意潛力,評選流程將先由專業評審初步篩選參賽作品,然後開放民眾進行公開投票,獲得最多票選的作品將獲得最佳人氣獎。 

在生成藝術類獲得人氣獎的是來自印尼的Gilang Ramadhan,其作品 《平靜海中的大浪(Big Waves in a Calm Sea描繪著一個人在大浪中划著獨木舟的刺激畫面。 

ViewSonic 第五屆 ColorPro Awards

作品連結

臺灣專區/特別獎作品簡介 

本屆臺灣總共有16件作品入圍,生成藝術類11幅、數位藝術類1幅、動態攝影作品類2件、靜態攝影作品類2幅。 

本次ColorPro Awards臺灣參與踴躍,其中生成藝術類的繳件數量由臺灣奪冠,並有11件作品入圍前30名一同角逐生成藝術類人氣投票獎,展現出臺灣創作者的無限潛力。 

本次ColorPro Awards展中亦特設專區,展出表現亮眼的台灣作品。 

  •  數位藝術類: 

數位藝術類入圍前10名的台灣作品 飄渺覺醒(Ethereal Awakening) (郭子欣) 描繪身穿星光與花朵長裙的女性步入宇宙與自然交融世界的夢幻場景。 

ViewSonic 第五屆 ColorPro Awards
  •  生成藝術類: 

生成藝術類的前10名入圍作品則各具特色,有展現中西舞蹈及武術文化交融的作品 芭蕾與中國古老劍舞的結合 (Ballet with the ancient art of Chinese sword dance)(周耀宗) 貼近生活展現時光冉冉的作品《時光交錯的街角(The Crossroads of Time)(王思婷)、亦有充滿未來感、展現優美光影流動的作品光流 (Light flow) (邱浚豪) 

ViewSonic 第五屆 ColorPro Awards
ViewSonic 第五屆 ColorPro Awards
ViewSonic 第五屆 ColorPro Awards
  •  靜態攝影類: 

攝影作品入圍前一百名的《螳螂蝦的暴力瞬間(張益賓),捕捉水底螳螂蝦的攻擊瞬間,充滿戲劇張力。《Embrace the wave(楊晶婷) 則呈現潛水者與海底世界合而為一的優美時刻。 

ViewSonic 第五屆 ColorPro Awards
ViewSonic 第五屆 ColorPro Awards
  •  動態攝影類: 

動態攝影作品中入圍前五十名的《The Competitor (李可揚) 利用台灣北海岸海景與人體的意象表達人類對夢想及理想的追求。《Heart beats(劉俊毅) 呈現愛人徜徉在街道中的樣貌。 

每個人對「躍動」的定義與感受各有不同,而本次展覽透過 ViewSonic 的全方位顯示與投影解決方案,為創作者打造了一個自由揮灑創意的舞台,同時也讓觀展者能透過這場視覺盛宴,深入探索全球創作者的多元視角,感受他們對「躍動 Momentum」的獨特詮釋與藝術表達。