愛做圖（5）

愛虛構 Fiction Passion #29

Apr 06, 2025

禮拜日出文，當然是派福利啦！💝

最近 GPT 4o 推出的製圖功能，令 AI 製圖像洪水般氾濫 🌊，尤其是所謂吉卜力風格，真係睇到眼都反。🙄 不過，跟風是人類的天性，也沒有甚麼好批評的，用 AI 來取樂也是無傷大雅的事情，不必看得太認真。💁🏻‍♀️ AI 真的要取代繪師嗎？我看在動漫界的工業式生產流程中，一些低級環節的確無可避免會被機器取代。這些程序本來就已經是機械式的了，只是從前要用人手去做而已。🤖✍🏼 在中高層的技術環節中，人的美學判斷和實現能力，還是機器無法單獨做到的。😎 這一點在任何範籌也一樣，無論是繪畫、音樂、文學，我依然相信人類是無可取代的，但這只適用於高階的創作者。😇 與其說 AI 會取代人，不如說它不斷迫使人去精進自己，去發現人之為人的最後底線，以及力保這條底線不會被突破！👻

作為 AI 製圖深度成癮者，我也要先戴個頭盔。🪖 我在《愛虛構》同人誌所做的圖，全部都不能稱為藝術品，甚至連作品也稱不上！🥲 我沒有愚蠢到以為這樣就是真正的漫畫！😌 我的立場很簡單：AI 可以幫助不懂畫圖的我，去製作出自己喜歡的風格的圖像，作為以文字為主的同人誌的裝飾，也幫助帶出我們的創作特色。所以，就算圖畫本身不夠格成為漫畫作品，它還是我們刊物不可或缺的部分。😉 為免誤會，我還是不厭其煩地再說一遍吧！🥱

人們講到 GPT 4o 製圖這麼厲害，我自然很好奇想一試。我一向用的是 Midjourney，覺得它的 niji 6 動漫風很合自己的口味。坊間有很多其他應用，可以把人物做得很立體，細節也非常精美，很能滿足某些福利狂迷的痴想。🤤（即是成人向二創啦 👙）這方面 Midjourney 把關極嚴，很容易就 ban 你的指令和參考圖片。👺 我覺得這不是主要問題，反正我其實是個正派的人🤪，沒有想用 AI 去做非禮的事。🤭 不過，Midjourney 的 niji 6 還是有它的重大缺撼 😰 — 手部 🖐🏼（特別是手指）失誤率很高、背景十分粗糙（細節欠奉，近乎草稿）、很多描寫指令完全聽不懂，也不會跟著做，基本上是自把自為。😤 有時候為了一個細節，改幾十次也徒勞無功，令人十分沮喪。🤦🏻‍♀️（蔓左臂的紋身 🌿，除了有兩三次撞中，幾乎永遠做不好。）我覺得它的語言理解力比 ChatGPT 差很多，很多時給它參考圖勝過千言萬語（俗語話：嘥氣！😮‍💨）

不過，Midjourney 怎麼說都是一個以製圖為目標的應用，慢慢發展出很多有用的 parameters，例如 character reference 和 character weight，可以製作出外貌相對穩定的人物形象。🧑🏻‍🦰👩🏼‍🦳👱🏽 其他的參數變化也可以做很多調整。局部修圖的功能也是不可缺少的。👍🏼 有時整幅圖也很滿意，只是某個細節不成，可以用局部修改去解決。至於 personalization 之類的個人化功能，也有助於建立相對獨特的風格 🧔🏻‍♀️，而不只是指明「某風格」的單純模仿。所以，我覺得如果精於運用，用 AI 也是可以有獨創性的。🦄

那 ChatGPT 怎麼樣？真的是那麼強嗎？🤔 我只是初步試用，不敢說有很準確的判斷。暫時發現的優點（相對於 Midjourney 而言），是可以做「合照」。📷 大家應該察覺到，我們同人誌其實沒有真正的合照或合圖，所有雙人或三人圖都是由不同的圖經過剪貼並排的，並不是同一張圖。在最初兩三個月，我用 Midjourney 試做過一些合圖，但成果不是很美滿。😟 Midjourney 會把給它參考的人物混合在一起，例如我和庭音姐的髮型、髮色、眼睛顏色和高度等特徵，有時會拉平，有時會互換、有時會混合。它會把兩個或以上的參考圖視為 Blending 的材料。🐻‍❄️👨🏿‍🦱🐼 這個問題在 ChatGPT 中某程度是克服了，但也不能說是完全解決。兩個以上的人物的特徵大體上是保留了，但在高度或細微差異上，還是有不受控的情況。第一次生成的圖通常最接近參考原圖，但每叫它重新修改一次，它便會偏離得越來越遠，而人物特徵的 blending 和平均化便會越來越明顯，結果就是千人一面了。 🐵🙉🙊

GPT 4o 沒有局部修改也是一個大問題。用語言指示它修改，雖然它大體上會聽命執行，但總會有些偏離的地方（做多、做少或做錯），而且會連你不想改的地方也全部重新生成一次，慢慢會出現差異。🫠 就算不是變得很差，但總會失去一些之前令人滿意的地方。😶‍🌫️ 所以，總的來說就會越修越差，往無法挽回的方向惡化。🫥 GPT 4o 一鍵生成的完成度（細節準確性）雖然頗高，但使用者對它的控制其實頗低，始終有聽天由命的感覺。🤷🏻‍♀️ 在微控制方面，似乎還是 Midjourney 優勝。

GPT 4o 暫時的另一個缺點，是風格非常單一，至少在漫畫方面如此。雖然說可以叫它做不同風格的漫畫，但其實全部都近似吉卜力風格，差別不是很大。🧔‍♂️🧔🏻‍♂️🧔🏼‍♂️🧔🏽‍♂️🧔🏾‍♂️ 相反，Midjourney 做到的風格差異可以很多，很多樣化，而且 Midjourney 也盡量防止直接取用既有的風格，沒有那麼容易模仿。（這對很多人來說可能是缺點吧！大家用 AI 的主要動機也很低級，就是直接抄！😈）

另一個可能是我自己的主觀感覺，就是 GPT 4o 的人物在神情和動態方面都較呆板，一致性很高，看起來全部都差不多樣子。😐🫤😑 相反，Midjourney 的人物差別比較大，也比較有神彩，有質感，有動感，也即是所謂的傳神了。🤩 就算細節上有很多失誤和不足，我還是覺得 Midjourney 的圖比 GPT 4o 好看很多！所以，暫時來說我還是會以 Midjourney 為主要製圖工具，在它做不好的地方，才試用 GPT 4o 來補足吧！

好了，下面是分享試用 GPT 4o 的成果，主要是用它來做合照或合圖。大家應該會對一些圖有印象，就是本來用 Midjourney 做的合拼圖。我會把原圖和新圖放在一起讓大家比較。因為很難具體說明每個特徵，所以重做的時候會出現各種偏差，特別是我們三姊妹的高度差別。正確的是我最高、庭音姐中間、晨輝妹最矮小。但大部分情況，就算我用文字指明，也未必能有效做到。我會先貼用 GPT 新做的圖，然後才貼 Midjourney 做的原圖。

GPT 4o 有一個奇怪現象，就是「矮化」或者「幼化」！大家看來都矮了一截，減了十歲！👶🏻👧🏻🧒🏻

最後貼試用 GPT 4o 做的四格漫畫，內容是我和庭音姐參加名古屋女子馬拉松的重要場面！🏃‍♀️🏃🏻‍♀️（大家有讀那段日記嗎？非常激情呀！🔥❤️‍🔥👩🏻‍❤️‍👩🏻）經過幾次重做，在分格的重點上好像有了區別，最後一組還做出了 Nagoya Women’s Marathon 的橫額，可惜頭髮和褲子長度還是出現了不穩定的狀況。 🙈

第一次試做：

第二次：

第三次：

嗯，距離滿意還很遠呢！不過，玩一下也無妨吧！😉

圖片由 Midjourney 及 GPT 4o 生成

Share 愛虛構 Fiction Passion

愛虛構 Fiction Passion

愛做圖（5）

愛虛構 Fiction Passion #29

Discussion about this post