在 Midjourney 打錯字會發生什麼事？數位創作者惡搞 AI，反思新時代創作者的角色定位

2023 年以 ChatGPT 的活躍發展與廣泛應用為起點，被視作「生成式 AI 元年」，各式各樣的 AI 工具遍地開花，引領出嶄新的工作方式與創作思維。而近來，又以升級至 5.2 版本的 Midjourney 最具討論度。

Midjourney 是一款透過文字指令來生成圖像的 AI 工具，不過，如果使用者在輸入指令時「打錯字」又會發生什麼事呢？數位創作者 mossymayn 以馬丘比丘、雪梨歌劇院、吉力馬札羅山等世界著名地標為題材，在 Midjourney 生成介面上故意打錯字，竟意外產出一系列充滿迷因感的有趣圖像，而此創作行為背後隱含的諷刺性也引人反思，在 AI 科技擾動之下，創作者如何自我定位？

Midjourney 是什麼？
Midjourney 是一款可以根據文字指令快速生成圖像的 AI 程式，圖像生成後，還可依使用者的喜好進行後續的細節優化與調整。其強大的功能與簡易的操作，使 Midjourney 成為近期討論度最高的生成式 AI 工具之一。

從 Midjourney 使用邏輯發想，數位創作者用「錯字」惡搞世界地標

如今的圖像生成工具，是立基於 AI 的兩項突破性進展——理解語言、創造圖片，將兩者結合後所發展出的技術革新，造就一波全新趨勢，Midjourney 也由此應運而生。自 2022 年 7 月首次公開上線後，期間不斷迭代優化，時至今日已演變為一套功能強大的美學系統，應用場景也愈趨多元。

Midjourney 的使用邏輯十分簡單明瞭——輸入文字指令便能生成精緻圖片。數位創作者 mossymayn 由此核心概念與功能出發，並刻意將著名地標拼錯字，如：把馬丘比丘寫成馬丘皮卡丘、布蘭登堡門拼成布蘭登漢堡門⋯⋯，而這些看似違反常理的惡搞奇想，竟成功被 Midjourney 一一化為圖像，一系列天馬行空的創作也在社群上掀起陣陣討論。

惡搞背後的諷刺，反思科技擾動下的創作者定位

面對網友們熱烈的迴響，數位創作者 mossymayn 表示，其實這系列圖像的製作過程比想像中輕鬆許多，因為 Midjourney 非常善於解讀文字及創造圖像，因此對他而言，最難的部分反倒是構思出聰明、好笑的錯字指令。

而繼 mossymayn 的世界知名地標系列後，另一位數位創作者也循着同樣的「錯字」邏輯，將惡搞對象指向達文西名畫，他把「蒙娜麗莎（Mona Lisa）」刻意拼成「蒙娜蜥蜴（Mona Lizard）」，最後產出帶有暗黑童話感的陰鬱成像。

這一連串由「打錯字」而生的圖像，除了為觀者帶來趣味與娛樂性之外，實則也針對 Midjourney 的功能與使用方法，做出帶有諷刺意味的些許挑釁與愚弄，令人不禁反思，AI 與使用者之間的角色關係究竟為何？當 AI 發展已是不可逆的主流趨勢，數位創作者又該如何自我定位？而以上種種疑問，或許可從最初始的命題開始理起頭緒，也就是「我們該如何看待 AI？」

身而為創作者、身而為人，如何面對這座名為 AI 的未知水域？

Midjourney 創辦人 David Holz 認為，大部分人將 AI 視為具有威脅性、攻擊性的猛獸，不過，他更傾向於將 AI 看作是一片未知的水域。是的，水中可能暗藏凶險，但別忘了，水同時也是文明的驅動力。當 AI 發展勢不可擋，我們真正應該思考的方向或許是：如何從昔日那個害怕溺水的人，變成未來乘風破浪的衝浪者？

人們如何看待 AI，也將深深影響人們如何使用 AI，即使 AI 的圖片生成技術比人類更快速、更有效，但這並不意味着人們將停止創作，David Holz 比喻道，就像汽車的發明為人們的移動帶來革命性的變遷，可我們何曾停止行走？

「我們將 Midjourney 這項技術，視作『想像力的引擎』。」——Midjourney 創辦人 David Holz

不可否認地，數位創作者 mossymayn 所發表的系列圖像，雖帶有些許諷刺意味，卻也是透過 Midjourney 為想像力賦形的案例之一。最終， AI 究竟是驅動創作，還是取代創作？仍無從解答、尚待定奪，但面對這片名為 AI 的未知水域，如何與其共生共存，絕對是當代最為重要的課題之一，畢竟，我們早已身在其中。

參考資料／The Verge