作为一名导演、音乐创作者和制作人,我在36小时内完成了工作。
7 个月前
这个故事为任何想要以新方式表达自己的人提供了灵感,并展示了借助人工智能,成功是可能的,而这在以前是不可想象的。最终的结果不仅是一件艺术作品,还有改变艺术和文化创作方式的新方法。
现在是2021年,我开始学习人工智能。我还不知道最终会用它做什么,但我坚信它有巨大的潜力。一个遥远的愿景是,它将帮助我制作一款名为 Dark Disharmony 的恐怖冒险游戏的续集,但像我一贯的情况一样,事情总是会与我预期的有所不同。
我经历了许多项目,最终我选择了 MidJourney 来生成图形,并为我们的小捷克民族翻译了一本完整的手册。对我来说,如果我想学习某样东西,就必须做笔记,因此我在我的 d3arts.cz 网站上发布这些内容。
由于我的主要工作是互联网服务提供商,我终于可以负担得起购买一块合适的显卡,这样我就可以在本地工作站上运行 Stable Diffusion,享受无审查的图形生成,只需支付电费。通过对 Stable Diffusion 的训练,我正在创建我一致的 AI 角色——AI 模型——使用 LoRA 模型和 SDXL 检查点。我已经在 MidJourney 中使用图像提示预生成了 LoRA 模型的模型——从不同角度拍摄。基于这些模板,我创造了 Lenka Baier。她是一位适合我审美的漂亮金发女郎。
Lenka Baier — 我的 AI 模型和歌手
从我生成的下一代中,我不断完善我的 AI 模型,有时还会使用 ReActor 插件进行换脸。Lenka 在社交网络 Instagram 上复活,我用一些相当恼人的内容来迷惑新关注者,结果发现扮演网红并与一群好色的追随者一起发帖并不是我所追求的满足感。顺便提一下,我的一个朋友爱上了我的模型,而我失去了一个朋友,因为他无法忍受 Lenka Baier 是我的创作。我继续在 AI 工作中自我教育,并在 Facebook 上发现不同的社区。
其中一个是 Cursed AI group,人们在这里玩弄 AI 生成的奇异内容。我正在创建自己的 AI 图形设计师社区。随着 AI 的发展,各种幻想家和点击诱饵创作者开始创造神秘的历史照片,这与我当前的工作密切相关,提示是:Giant something,Kandahar 大约在 1923 年。这个 Cursed AI 群组对此进行了娱乐,直到这个主题因这些限制而被禁止并暂时被遗忘。但我被这种不可思议的美学深深吸引,因此继续发展它。
我们的艺术小组叫 Homo Digitalis 3.2.1. — 展览 2045:人类的消亡
在2024年,我与 Petr Mareš 和 Martina Jurčeková 一起组织了一场 AI 展览,地点在 Hradec Králové 的现代艺术画廊——2045:人类的消亡,在这里我生活,我们交流 AI 的印象和知识。展览出乎意料地成功,我们在 捷克版 Wired 上被报道。Petr Mareš 除了写作生涯外,还是一名音乐家,因此我通过 Udio 生成音乐,我认为这在生成我最喜欢的微流派 synthwave 时相当成功,这是一种90年代迪斯科和新波电子音乐的混合。Martina 则在使用 RunwayML 生成视频。因此,在我妻子提供的空闲时间里,我全身心投入到这些项目的研究中。
借助图像到视频工具和完善的提示,我首先在 MidJourney 中预生成一个图像数据库,通常生成多达两百个图像,然后使用 RunwayML 创建动态图像。就这样,我们得到了第一首单曲 Secrets of Kandahar — Circa 1923。在 Gen-2 版本中,我制作了一部完整的音乐视频,并将其上传到我的 YouTube 频道。
欢迎来到神奇的坎大哈世界。这是一部借助人工智能工具实现的音乐视频,其中阿拉伯文化的纪录片镜头与奇异的科技、超现实主义、达达主义和电子神秘主义不可思议地融合在一起。
由于我曾在 Hradec Králové 的应用网络艺术学校 上过两年学,术语和技术对我来说并不成问题,我所创造的东西只是我个人品味的问题。不要误以为一切都只是提示的问题。我经常会使用 Photoshop 来创建与我的想法相符的图像到视频工具的理想模板,有时这真的很痛苦。一旦我使用这样的镜头,可能需要大约五十次生成才能让我满意。
因此,我认为使用 RunwayML 值得选择 无限版,所以我在 AI 上投入了相当多的资金,以获得真正高质量的输出。与 MidJourney 和 Udio 的情况类似,所以我决定制作一整张专辑。然而,想象一下,如果你要用正常的团队和计算机图形制作一部完整的影片,并以经典的方式创造类似的东西,那是完全不同的数字。
人工智能很棒,但你不能害怕投入时间和金钱。
在 Udio Beta 中,我浏览 其他作者,查看他们的文本到音乐提示,发现指定要使用的具体乐器或合成器与 "Synthwave & Synthpop" 结合是个好主意——这在任何地方都没有提到。使用 "以 艺术家名字 的风格" 并使用不太符合我想法的歌曲的 Inpaint 阶段的混音。再次,我大约需要 80 次生成才能找到合适的作品。
我还通过反馈了解到,确实存在 不安谷现象,一些不必要的反馈和评论只是因为近乎完美的生成实际上让人感到害怕。幸运的是,这并不完全是我的情况,因此记住这一点并采取艺术的态度,简单地承认某些事情是很重要的。顺便说一下,这种现象帮助我们生存,找出模式中的缺陷,探索不一致性,或基于不一致性进行发明。
然而,接下来的视频中的反馈迫使我详细阐述故事,并让我的 AI 模型作为歌手参与其中。使用 Lalal.ai 工具——一个音轨分离器,我将实际的声乐与 Udiem 创建的音轨分开。然后我将使用某个音轨进行口型同步,这 RunwayML Gen3-Alpha 可以做到,因此我将把生成的视频中的声乐注入到她的嘴唇中。
情节:主角由 AI 模型 Lenka Baier 扮演,前往神秘的坎大哈以结束她的心碎。由于人类与机器之间的冲突,她失去了爱,因为她爱上了她的机器人伴侣。坎大哈以其宁静、宽容和神秘而闻名,所有对立面在这里和谐共存。生活在这里的人们过着高科技低生活的生活方式,非常喜欢音乐,建造巨型机器,并与外星文明和生物进行神秘接触。因此,Lenka 挑战了一只怪兽动物的灵媒,以找出强大的运输海龟藏在哪里,并将她爱人的个性最后的残余记录在一个光盘上,踏上了一段旅程,在她到达目的地时遇到了许多有趣的现象。坎大哈对她完全敞开,因此在探索城市时,她遇到了三位戴着无线电头巾的智者,然后还利用一位当地富人的好感,寻找一个神秘的 AI 圣地,在那里愿望成真。Lenka 进入圣地,将她心爱的意识残余插入一个神秘的计算机中,触发转变为安卓的过程,在那里他们的个性合并为一个单一的机器人身体。这样,他们将再次永远在一起。
通过 DistroKid 等发行平台,我可以将歌曲发布到所有可能的音乐平台,比如……让我按顺序说:亚马逊、Anghami、iTunes、Apple Music、MediaNet、Boomplay、Deezer、Instagram、Facebook、Adaptr、Flo、YouTube Music、iHeartRadio、Clar Música、JooBox、Kuck Media、NetEase、Qobuz、Pandora、Saavn、Spotify、腾讯、Tridal、TikTok Music。还有 DistroVid——一个音乐视频发行平台,转向 Vevo、iTunes Video、Apple Music、TikTok Music、Tridal 和 Boomplay。
最后,在发行方面,最有趣的事情是将这样的作品送入一个节日。 Filmfreeway.com 平台可以帮助实现这一点,值得支付黄金会员费,并在搜索中输入 AI,选择一个节日,凭借一点运气,你的作品将被选中,并支付较少的报名费。就我个人而言,我期待着在布拉格举行的 捷克国际 AI 电影节,今年将在 Atlas 电影院举行第三届。祝我好运。
捷克 AI 电影节第三届
不管你喜欢与否,电影制作的 (r)evolution 已经到来,而这一切都是由人工智能驱动的。
如果你是一位多才多艺的艺术家,喜欢独自工作,人工智能将成为你最好的同事,极大地提升你的生产力,几乎吸收你所有的想法和灵感。因此,我认为我们正进入一个“手巧”的时代,他们能够以异常大的数量创造真正原创和高质量的作品。我只想补充我最新的作品,那就是名为 Giants 的单曲,我仍在制作视频。
正如我的一位教授所说:“你永远不知道风会把你带到哪里,所以要学习一切。”他是对的,因为必要的通识知识、艺术史和术语是将你与其他以相同方式使用 AI 的人区分开的东西,就像在制作游戏时需要必要的高级数学知识一样,因为 AI 不会为你想出主意,但它肯定会帮助你以一种丰盛的方式实现它,希望有一天我能借此完成 Dark Disharmony 2。现在,感谢 AI,我正在慢慢成为一个元人类 (我们在节目中讨论过),因为我已经消除了许多缺点,比如语言障碍、编程技能差和缺乏时间进行高质量创作,而我还要在照顾家庭之间分配这些时间。
推荐阅读:
FluxAI 中文
© 2025. All Rights Reserved