2023 年以 ChatGPT 的活跃发展与广泛应用为起点,被视作「生成式 AI 元年」,各式各样的 AI 工具遍地开花,引领出崭新的工作方式与创作思维。而近来,又以升级至 5.2 版本的 Midjourney 最具讨论度。
Midjourney 是一款透过文字指令来生成图像的 AI 工具,不过,如果使用者在输入指令时「打错字」又会发生什么事呢?数位创作者 mossymayn 以马丘比丘、雪梨歌剧院、吉力马札罗山等世界著名地标为题材,在 Midjourney 生成介面上故意打错字,竟意外产出一系列充满迷因感的有趣图像,而此创作行为背后隐含的讽刺性也引人反思,在 AI 科技扰动之下,创作者如何自我定位?
Midjourney 是什么?
Midjourney 是一款可以根据文字指令快速生成图像的 AI 程式,图像生成后,还可依使用者的喜好进行后续的细节优化与调整。其强大的功能与简易的操作,使 Midjourney 成为近期讨论度最高的生成式 AI 工具之一。
从 Midjourney 使用逻辑发想,数位创作者用「错字」恶搞世界地标
如今的图像生成工具,是立基于 AI 的两项突破性进展——理解语言、创造图片,将两者结合后所发展出的技术革新,造就一波全新趋势,Midjourney 也由此应运而生。自 2022 年 7 月首次公开上线后,期间不断迭代优化,时至今日已演变为一套功能强大的美学系统,应用场景也愈趋多元。
Midjourney 的使用逻辑十分简单明了——输入文字指令便能生成精致图片。数位创作者 mossymayn 由此核心概念与功能出发,并刻意将著名地标拼错字,如:把马丘比丘写成马丘皮卡丘、布兰登堡门拼成布兰登汉堡门⋯⋯,而这些看似违反常理的恶搞奇想,竟成功被 Midjourney 一一化为图像,一系列天马行空的创作也在社群上掀起阵阵讨论。
恶搞背后的讽刺,反思科技扰动下的创作者定位
面对网友们热烈的回响,数位创作者 mossymayn 表示,其实这系列图像的制作过程比想像中轻松许多,因为 Midjourney 非常善于解读文字及创造图像,因此对他而言,最难的部分反倒是构思出聪明、好笑的错字指令。
而继 mossymayn 的世界知名地标系列后,另一位数位创作者也循着同样的「错字」逻辑,将恶搞对象指向达文西名画,他把「蒙娜丽莎(Mona Lisa)」刻意拼成「蒙娜蜥蜴(Mona Lizard)」,最后产出带有暗黑童话感的阴郁成像。
这一连串由「打错字」而生的图像,除了为观者带来趣味与娱乐性之外,实则也针对 Midjourney 的功能与使用方法,做出带有讽刺意味的些许挑衅与愚弄,令人不禁反思,AI 与使用者之间的角色关系究竟为何?当 AI 发展已是不可逆的主流趋势,数位创作者又该如何自我定位?而以上种种疑问,或许可从最初始的命题开始理起头绪,也就是「我们该如何看待 AI?」
身而为创作者、身而为人,如何面对这座名为 AI 的未知水域?
Midjourney 创办人 David Holz 认为,大部分人将 AI 视为具有威胁性、攻击性的猛兽,不过,他更倾向于将 AI 看作是一片未知的水域。是的,水中可能暗藏凶险,但别忘了,水同时也是文明的驱动力。当 AI 发展势不可挡,我们真正应该思考的方向或许是:如何从昔日那个害怕溺水的人,变成未来乘风破浪的冲浪者?
人们如何看待 AI,也将深深影响人们如何使用 AI,即使 AI 的图片生成技术比人类更快速、更有效,但这并不意味着人们将停止创作,David Holz 比喻道,就像汽车的发明为人们的移动带来革命性的变迁,可我们何曾停止行走?
「我们将 Midjourney 这项技术,视作『想像力的引擎』。」——Midjourney 创办人 David Holz
不可否认地,数位创作者 mossymayn 所发表的系列图像,虽带有些许讽刺意味,却也是透过 Midjourney 为想像力赋形的案例之一。最终, AI 究竟是驱动创作,还是取代创作?仍无从解答、尚待定夺,但面对这片名为 AI 的未知水域,如何与其共生共存,绝对是当代最为重要的课题之一,毕竟,我们早已身在其中。
参考资料/The Verge





