攝影這項已存在200多年的技藝,在受到AI撞擊的此刻,將擦出什麼樣的奇觀?La Vie 11月號封面邀請「bigflowerdeer」主理人鹿虹、紅花以AI 算圖創作,本身即是攝影與新媒體藝術背景的兩人,也與我們分享投入算圖世界後的實驗心路。
2023年的現在,AI算圖已非新鮮事,但點開Instagram上名為「bigflowerdeer」的帳號,實拍般的光感、城市街頭場景、不落於鳳眼或單眼皮刻板印象的亞洲人像,會讓你驚訝於Midjourney竟也能如此寫實。畢竟這套奠基於大量資料庫的算圖AI,從2022年5月開放使用後,作品還是以歐美繪畫感居多。
「bigflowerdeer」由攝影師鹿虹、紅花共同創立,兩人於今年6月開始進入AI算圖領域。新媒體藝術和設計背景的紅花,早從Midjourney第1代就開始關注,「更新到第4代的時候,大家突然很在乎,照片的真實感可以做到什麼程度?」等到第5代推出,紅花發現光感、空氣中的透視、底片感等都大幅進化,加上剛好要幫Midjourney AI台灣社團版主林思翰推廣線上課程,決定親自入場。鹿虹笑說:「她算圖算到三更半夜,我還不理解她在幹嘛,結果隔天我用了之後,連續一個禮拜都算到三更半夜。」他稱過程就像是走進「精神時光屋」,「攝影創作是實驗與實踐的過程,Midjourney實驗了一些難以達到、但想要完成的畫面。」
想算出很難實際拍到的畫面
以紅花來說,她算的圖像幾乎都是「在台灣很難拍到的」,對馬戲團和遊樂園很感興趣的她,因為台灣較少理想的場景,所以就會在算圖裡實驗。她的作品也常見大片花海,畢竟台灣很難找到位置、數量、排列組合都符合理想狀態的場景,不然就是會有模特兒躺在花海裡凹陷下去的問題。鹿虹的算圖則常和動漫相關,倒也不是局限於宮崎駿、新海誠等關鍵字,而是會有類似《獵人》奇犽的念能力、《海賊王》惡魔果實等元素。
以攝影師的工作流程來比喻,鹿虹說他們算圖的出發點可以分成兩種,「一種是腦中已經有構圖,再去執行;另一種比較開放,給AI一些指令,看它能給你什麼。這也和拍攝時引導模特兒很像,不同模特兒的反饋都不一樣。」因此相較於Stable Diffusion可以算出很逼真的人物、連續多張穩定的圖像,他們都更喜歡Midjourney算奇幻場景的能力與隨機性。有次紅花下了「水晶球裡的遊樂園」給Midjourney,但跑出來的圖像卻像是「魔法建築系課堂」,不在原本預設內的畫面也很有趣。
封面創作幕後!不同於實拍的Midjourney合作案
這次La Vie也邀請他們以AI創作封面,為傳達攝影因科技飛快進展產生的奇觀感,編輯部先選定他們在Instagram上的一張作品,構圖是小孩在城市街頭、看見魚飄浮空中的驚奇;但該圖片的光感偏暗,希望能以此為基準調整並創造新作。鹿虹說,最初La Vie喜歡的那張作品,他下給Midjourney的指令大約是「很多河豚在東京街頭飄浮」、「小孩在街頭夢遊」,由很多字義類似的關鍵字,不斷拼湊嘗試而成。例如想要生成像河豚般圓圓胖胖的魚,他下過「chubby fish/bubble fish/round fish」,以及飄起來的動作「float/fly」,都是不同結果;想要很多隻魚,many和a lot of數量也不同;想要亞洲臉孔小孩,可以下Asian或Japanese,年紀可以規範幾歲,或單純寫young child,動作則是「running/sleepwalking/wondering」。他說,創作就是不斷選擇,各種排列組合都得去嘗試的過程。
針對這次封面,鹿虹一共嘗試了5批算圖。在保持上述構圖與人物元素的基準上,第1批加入「cinematic」(戲劇性)的關鍵字,但造成畫面色調變得太過濃郁,好像有懸疑情節要上演。因此第2批加入「sunlight」(陽光),以及應La Vie要求不希望人物有過多豐富的情緒,多了「noemotion」(無表情)。接下來的第3、第4批,分別下達指令「穿制服」、「平視(焦距35mm)」,而因應第4批算出來的人和魚都偏「兇」,最後第5批加入「cute」讓整體可愛一點。
從與攝影師常規的合作流程來看,往往是針對細節調整後決定最終的照片,但這次的封面照其實是來自第2批。「你下越多指定,AI無視的也越多。」紅花說,Midjourney會自行決定每一個指定的重要次序,如果想控制魚飄浮的位置,那光感、人物狀態的指令可能會被忽略。因此她認為AI算圖合作案,邏輯和攝影完全不同,攝影能在某一個基礎上持續修改,「Midjourney不能對過去的某一張圖、某一個細節太過執著,要把每一次都當成新的圖看,因為每一次都偏向綜合感官的變化。目前雖然已經推出局部修改的功能,但結果依然難以控制到理想狀態,AI對我來說是從0%到60%,後期還是需要大量人工調整。」
Photoshop何嘗不是過去的AI ?
其實魚也算是鹿虹的小彩蛋,因為他私底下很愛釣魚,總想讓平常出現在大海的魚群們飄浮空中。但這個這乍看超現實的構圖,背後仍有攝影實際執行的邏輯,例如真的在街上架設超大型透明魚缸,就能拍出魚群悠游城市的畫面,只是成本太過高昂。「我們的算圖作品,通常都能看得出來是我們本來就感興趣的事與主題。」紅花說,現在使用AI算圖的人很多,但很容易辨別創作者究竟是有自己的脈絡,還是被AI拖著走。兩人都很喜歡一位名為Takeru的創作者(Instagram帳號:maneki.metropolis),算圖產量很高,氛圍從未來感到近期的宗教與神話感,但都和服裝材質有關。這就是出於創作者自身的興趣與對畫面有慾望,再透過AI實驗出來。
只要創作者夠清楚自己的脈絡,他們就不認為會被AI取代,畢竟如果連創作者自己的創作動機都不穩定,不論實拍或算圖,都很難在市場上生存。鹿虹說:「算圖AI或文字AI,對我們來說就像Photoshop一樣,就是一個工具。底片時代其實也有『Photoshop』,只是他們是用暗房。現在的Photoshop對於過去的人而言,何嘗不是另外一種AI?」對於AI算圖是否會取代攝影,紅花則提到,攝影不是只有商案,更多的還是生活中的影像,每個人都會為某些時刻留下照片。相機也好,AI也罷,操作機具的始終是人,有想留影的念頭與慾望,攝影就持續存在。
AI算圖創作Tips!
1. 交叉使用放大軟體
Midjourney的原始圖為「200KB、畫素1024 x 1024」,如果有實體輸出的需求,就要使用AI放大軟體。鹿虹和紅花目前會交叉使用3種軟體:Topaz Photo AI、Gigapixel AI,以及Photoshop的內建軟體。
2. 藝術風格很重要
要完成Midjourney圖像,除了元素、色調、視角等等,也可以加入「藝術風格」,例如王家衛、新海誠、宮崎駿,都是很好辨別的關鍵字。
3. 名為「權重」的指令
權重也可以理解為比例,例如你想要的元素是「女孩和花」,這個功能可以控制畫面裡女孩和花各占比多少,如果花的比例很大,可能會產生「一朵花包覆著女孩」。
4. 關鍵字是會被忽略的
Midjourney不會滿足使用者所有的關鍵字,會選擇性忽略某些指令,需適時自己檢查哪些指令是無用的。
5. 適時和ChatGPT 同事討論
針對下給Midjourney的指令,可以請問ChatGPT:「如果我要用圖像生成什麼樣的一張圖,你會下什麼指令?」或者請ChatGPT規範術語,因為有時人類可以理解的文字並非電腦能懂。
6. Stable Diffusion vs Midjourney
相較於Midjourney,Stable Diffusion可以訓練出穩定的模組,通常用來算肖像,也可以算出一系列看似「拍同一個人、但有不同光感與角度」的照片,但場景趣味性較低。
bigflowerdeer
鹿虹(Instagram帳號:luhonghsu)、紅花(Instagram帳號:bigredflower)共同經營的AI算圖主題帳號。兩人皆為攝影師,於2023年6月踏入AI算圖領域,用影像拼湊對世界的想像。IG:bigflowerdeer
文|張以潔 圖片提供|bigflowerdeer