禮拜日出文,當然是派福利啦!💝
最近 GPT 4o 推出的製圖功能,令 AI 製圖像洪水般氾濫 🌊,尤其是所謂吉卜力風格,真係睇到眼都反。🙄 不過,跟風是人類的天性,也沒有甚麼好批評的,用 AI 來取樂也是無傷大雅的事情,不必看得太認真。💁🏻♀️ AI 真的要取代繪師嗎?我看在動漫界的工業式生產流程中,一些低級環節的確無可避免會被機器取代。這些程序本來就已經是機械式的了,只是從前要用人手去做而已。🤖✍🏼 在中高層的技術環節中,人的美學判斷和實現能力,還是機器無法單獨做到的。😎 這一點在任何範籌也一樣,無論是繪畫、音樂、文學,我依然相信人類是無可取代的,但這只適用於高階的創作者。😇 與其說 AI 會取代人,不如說它不斷迫使人去精進自己,去發現人之為人的最後底線,以及力保這條底線不會被突破!👻
作為 AI 製圖深度成癮者,我也要先戴個頭盔。🪖 我在《愛虛構》同人誌所做的圖,全部都不能稱為藝術品,甚至連作品也稱不上!🥲 我沒有愚蠢到以為這樣就是真正的漫畫!😌 我的立場很簡單:AI 可以幫助不懂畫圖的我,去製作出自己喜歡的風格的圖像,作為以文字為主的同人誌的裝飾,也幫助帶出我們的創作特色。所以,就算圖畫本身不夠格成為漫畫作品,它還是我們刊物不可或缺的部分。😉 為免誤會,我還是不厭其煩地再說一遍吧!🥱
人們講到 GPT 4o 製圖這麼厲害,我自然很好奇想一試。我一向用的是 Midjourney,覺得它的 niji 6 動漫風很合自己的口味。坊間有很多其他應用,可以把人物做得很立體,細節也非常精美,很能滿足某些福利狂迷的痴想。🤤(即是成人向二創啦 👙)這方面 Midjourney 把關極嚴,很容易就 ban 你的指令和參考圖片。👺 我覺得這不是主要問題,反正我其實是個正派的人🤪,沒有想用 AI 去做非禮的事。🤭 不過,Midjourney 的 niji 6 還是有它的重大缺撼 😰 — 手部 🖐🏼(特別是手指)失誤率很高、背景十分粗糙(細節欠奉,近乎草稿)、很多描寫指令完全聽不懂,也不會跟著做,基本上是自把自為。😤 有時候為了一個細節,改幾十次也徒勞無功,令人十分沮喪。🤦🏻♀️(蔓左臂的紋身 🌿,除了有兩三次撞中,幾乎永遠做不好。)我覺得它的語言理解力比 ChatGPT 差很多,很多時給它參考圖勝過千言萬語(俗語話:嘥氣!😮💨)
不過,Midjourney 怎麼說都是一個以製圖為目標的應用,慢慢發展出很多有用的 parameters,例如 character reference 和 character weight,可以製作出外貌相對穩定的人物形象。🧑🏻🦰👩🏼🦳👱🏽 其他的參數變化也可以做很多調整。局部修圖的功能也是不可缺少的。👍🏼 有時整幅圖也很滿意,只是某個細節不成,可以用局部修改去解決。至於 personalization 之類的個人化功能,也有助於建立相對獨特的風格 🧔🏻♀️,而不只是指明「某風格」的單純模仿。所以,我覺得如果精於運用,用 AI 也是可以有獨創性的。🦄
那 ChatGPT 怎麼樣?真的是那麼強嗎?🤔 我只是初步試用,不敢說有很準確的判斷。暫時發現的優點(相對於 Midjourney 而言),是可以做「合照」。📷 大家應該察覺到,我們同人誌其實沒有真正的合照或合圖,所有雙人或三人圖都是由不同的圖經過剪貼並排的,並不是同一張圖。在最初兩三個月,我用 Midjourney 試做過一些合圖,但成果不是很美滿。😟 Midjourney 會把給它參考的人物混合在一起,例如我和庭音姐的髮型、髮色、眼睛顏色和高度等特徵,有時會拉平,有時會互換、有時會混合。它會把兩個或以上的參考圖視為 Blending 的材料。🐻❄️👨🏿🦱🐼 這個問題在 ChatGPT 中某程度是克服了,但也不能說是完全解決。兩個以上的人物的特徵大體上是保留了,但在高度或細微差異上,還是有不受控的情況。第一次生成的圖通常最接近參考原圖,但每叫它重新修改一次,它便會偏離得越來越遠,而人物特徵的 blending 和平均化便會越來越明顯,結果就是千人一面了。 🐵🙉🙊
GPT 4o 沒有局部修改也是一個大問題。用語言指示它修改,雖然它大體上會聽命執行,但總會有些偏離的地方(做多、做少或做錯),而且會連你不想改的地方也全部重新生成一次,慢慢會出現差異。🫠 就算不是變得很差,但總會失去一些之前令人滿意的地方。😶🌫️ 所以,總的來說就會越修越差,往無法挽回的方向惡化。🫥 GPT 4o 一鍵生成的完成度(細節準確性)雖然頗高,但使用者對它的控制其實頗低,始終有聽天由命的感覺。🤷🏻♀️ 在微控制方面,似乎還是 Midjourney 優勝。
GPT 4o 暫時的另一個缺點,是風格非常單一,至少在漫畫方面如此。雖然說可以叫它做不同風格的漫畫,但其實全部都近似吉卜力風格,差別不是很大。🧔♂️🧔🏻♂️🧔🏼♂️🧔🏽♂️🧔🏾♂️ 相反,Midjourney 做到的風格差異可以很多,很多樣化,而且 Midjourney 也盡量防止直接取用既有的風格,沒有那麼容易模仿。(這對很多人來說可能是缺點吧!大家用 AI 的主要動機也很低級,就是直接抄!😈)
另一個可能是我自己的主觀感覺,就是 GPT 4o 的人物在神情和動態方面都較呆板,一致性很高,看起來全部都差不多樣子。😐🫤😑 相反,Midjourney 的人物差別比較大,也比較有神彩,有質感,有動感,也即是所謂的傳神了。🤩 就算細節上有很多失誤和不足,我還是覺得 Midjourney 的圖比 GPT 4o 好看很多!所以,暫時來說我還是會以 Midjourney 為主要製圖工具,在它做不好的地方,才試用 GPT 4o 來補足吧!
好了,下面是分享試用 GPT 4o 的成果,主要是用它來做合照或合圖。大家應該會對一些圖有印象,就是本來用 Midjourney 做的合拼圖。我會把原圖和新圖放在一起讓大家比較。因為很難具體說明每個特徵,所以重做的時候會出現各種偏差,特別是我們三姊妹的高度差別。正確的是我最高、庭音姐中間、晨輝妹最矮小。但大部分情況,就算我用文字指明,也未必能有效做到。我會先貼用 GPT 新做的圖,然後才貼 Midjourney 做的原圖。
GPT 4o 有一個奇怪現象,就是「矮化」或者「幼化」!大家看來都矮了一截,減了十歲!👶🏻👧🏻🧒🏻
最後貼試用 GPT 4o 做的四格漫畫,內容是我和庭音姐參加名古屋女子馬拉松的重要場面!🏃♀️🏃🏻♀️(大家有讀那段日記嗎?非常激情呀!🔥❤️🔥👩🏻❤️👩🏻)經過幾次重做,在分格的重點上好像有了區別,最後一組還做出了 Nagoya Women’s Marathon 的橫額,可惜頭髮和褲子長度還是出現了不穩定的狀況。 🙈
第一次試做:
第二次:
第三次:
嗯,距離滿意還很遠呢!不過,玩一下也無妨吧!😉
圖片由 Midjourney 及 GPT 4o 生成