"深度风格未死:这些作品,AI提示词可造不出来!"


17 天前

提示词并非万能:深度风格依然存在


图像合成:MidJourney + Deep Dream Generator 的深度风格

生成式 AI 内容的第一波浪潮大约从 2014 年到 2021 年,那时 Dall-E 和其他基于文本生成图像(提示词驱动)的工具还未普及。深度风格指的是深度学习和神经风格迁移,根据 TensorFlow 的解释,这是一种“优化技术,用于将两张图像——一张内容图像和一张风格参考图像(例如某位著名画家的作品)——融合在一起,使输出图像看起来像内容图像,但以风格参考图像的风格‘绘制’而成。”


我在 2016 年创作的其中一张“深度风格”图像

我最初为 AI 生成图像应用的风格来自西非蜡染面料的图案。19 世纪的复古挂毯和蕾丝图案也是我常用的图像风格来源。源照片是我自己拍摄的。从 2016 年到 2019 年,我使用 Deep Dream Generator 的深度风格工具,创作(生成)了各种灵感迸发的图像。随着时间的推移,我对该工具的使用技巧和知识逐渐提升。这开启了一种实践,即在社交媒体平台上每天至少发布一张图像,吸引了越来越多欣赏这些作品的粉丝。


“非洲蕾丝”——使用 Deep Dream Generator 的“深度风格”工具创作

一位粉丝将上述图像作为底图,然后在 iPad 上绘制并发送到刺绣机上进行加工。他们克服了刺绣软件的限制,最终以灯箱的形式呈现给我(见下图)。同年,我受史密森尼博物馆策展人委托,为一个展览创作了 11 位“未来主义代表人物”。在图像风格上,我使用了这些人物发明的图像(见下面的凯勒肖像),包括古董面料甚至盲文(点状图案)。


米奇使用刺绣软件和机器对“非洲蕾丝”进行的再创作

我在 2021 年史密森尼 FUTURES 展览中展示的深度风格海伦·凯勒肖像

当时,基于提示词的文本生成图像 AI 工具还未问世。这些作品并非通过提示词创作。接下来的 6 个月内,文本生成图像模型和工具陆续向公众开放,引发了 AI 热潮。2022 年,最先进的文本生成图像模型——如 OpenAI 的 DALL-E 2、Google Brain 的 Imagen、Stability AI 的 Stable Diffusion 和 MidJourney——开始崭露头角。然而,尽管这些工具广受欢迎,我并未放弃 DDG 的深度风格技术。


MidJourney + Deep Dream Generator 的深度风格

文本生成图像模型通常是潜在扩散模型,它结合了语言模型(将输入文本转换为潜在表示)和生成图像模型(根据该表示生成图像)。最有效的模型通常是在大量图像和文本数据上训练的。——维基百科

尽管网络上公开了大量图像和数据(可能未经某些艺术家的同意),但有色人种的多样化图像仍然匮乏。缺乏代表性是历史上被边缘化的创作者对新兴技术发展不感兴趣的主要原因之一。


MidJourney + Adobe Photoshop(图像合成)

从某种意义上说,生成式 AI 和 GenAI 艺术与过去的技术创新并无不同,但由于工具的普及和易用性,这种情况正在改变。此外,图像质量和可能性也在不断提高。上述图像与我 2016 年使用深度风格创作的第一张图像的主要区别在于分辨率。而且,它还在不断进步。

注:使用深度风格可以使文本生成图像的输出更具独特性,但我只在需要时使用该工具。有时我会使用 Adobe Photoshop 来完成 AI 生成的图像。

推荐阅读:

FluxAI 中文

© 2025. All Rights Reserved