AI图像生成对决:Imagen 3、Qwen 2.5 MAX与Midjourney 6.1强强对比,谁能胜出?


大约 1 个月前

Midjourney V6.1生成的图像来自EJ Yao

AI 图像生成对决:Imagen 3、Qwen 2.5 MAX 和 Midjourney 6.1

比较

哇!Google Imagen 3 让我惊艳 (Midjourney 有竞争者了)

在大家都在问 Midjourney V7 什么时候发布,并且我们都在等待月底的发布时,我的兄弟让我别再等待,去试试 Imagen 3。我当时想,真的吗?但是让我告诉你,事情变得疯狂令人兴奋!昨天,我测试了三个大牌:Google Imagen 3Qwen 2.5 MAXMidjourney 6.1。坦白说,我以前认为 Midjourney 是唯一真正能生成高质量、真实效果的竞争者——但现在不再是。让我给你分析一下。

Imagen 3 Imagen 3 是我们最高质量的文本到图像模型,能够生成更具细节、更丰富的图像… deepmind.google

我使用的提示: 好吧,这就是我给这些 AI 提供的内容:

早餐的惬意:

一张特写照片,焦点是一个冒着热气的咖啡杯和一片烤面包,摆放在一只白色的盘子上。咖啡杯略微偏左,展示出其浓郁的深色,轻柔的蒸汽缭绕而上。在右边,一片金黄酥脆的烤面包安静地躺在干净的白色盘子上,面包的质感让人垂涎欲滴,上面融化了一小块黄油。两样东西都清晰可见,形成了一种和谐的搭配,吸引人们的注意力,突显出它们对比强烈而又相互衬托的质感和颜色。在背景中,一摞模糊的复古书籍增添了温暖和情境,一撮新鲜的香草(如迷迭香或百里香)在前景中若隐若现,形成一条自然引导线指向主角。柔和温暖的光线洒在整个场景上,突显出悠闲早餐环境的舒适氛围。整体氛围宁静而令人安心,正好适合一个安静的早晨时光。

Imagen 3生成的图像来自EJ Yao

禅意莲花:

一朵精致的莲花特写,柔和的光线,花瓣上的露珠,细雨轻拂,宁静的禅意花园,微距摄影

Imagen 3生成的图像来自EJ Yao

赛博朋克安卓:

超细致的英俊安卓人像面向镜头,Symmetrical cybernetic 生命体,半面露出复杂的机械内部和电路,发出机械隧道背景,戏剧性的技术照明伴随着金属反射,单色银白灰色调带有凉爽的蓝色基调,中心构图,照片级逼真,全细节机械部件,工业科幻美学,放射状机械图案,铬合金表面,景深

Imagen 3生成的图像来自EJ Yao

日本豆腐天妇罗:

一碗日本风格的菜肴,包含四块香脆的炸豆腐天妇罗,搭配清淡的汤底,撒上切碎的海藻,旁边有其他食物,放在一张木桌上。

Imagen 3生成的图像来自EJ Yao

好的,我知道这不是 100% 准确

牛油果吐司的完美:

一片开放式的吐司,上面堆满了切片的牛油果、新鲜绿叶和芽菜,摆放在圆盘上。一个白色的圆形陶瓷盘,带有细微的斑点,盘边装饰着深色的香醋状汁液和几颗粉红色的石榴籽。切薄的牛油果片,鲜艳的绿色,位于吐司的中心。一颗柔软的白色水波蛋恰好 nestled 在牛油果和芽菜之间。

Imagen 3生成的图像来自EJ Yao

海底座头鲸:

水平线摄影展示一只座头鲸在水下游动,清晰可见它的眼睛和身体上附着的藤壶。水下的海洋呈现出深蓝色渐变,而水面上则显示出温柔的涟漪和阴沉的云层。鲸鱼的沟纹和皮肤质感展现出生动的细节。整个场景散发出宁静而戏剧化的氛围。

Imagen 3生成的图像来自EJ Yao

我也看到一些结构不一致的地方

孤独的钢琴:

一张近距离、亲密的视角,描绘一架孤独的旧钢琴,它孤零零地伫立在一个空旷、多尘的房间里,阳光透过一扇模糊的窗户洒下。背景模糊地过渡到柔和的灰色和淡蓝色调,聚焦在钢琴磨损的琴键和破裂的木材上,唤起孤独和被遗忘旋律的感受,最少的背景细节增强了孤立感。

Imagen 3生成的图像来自EJ Yao

海岸灯笼:

一张近距离、亲密的视角,描绘一盏孤独、风化的灯笼悬挂在雾气蒙蒙的海岸小路上的木杆上,背景模糊地过渡到柔和的灰色和淡蓝色调,聚焦在灯笼生锈的金属和破裂的玻璃上,唤起孤独和怀旧的情感,最少的背景细节增强了孤立感。

Imagen 3生成的图像来自EJ Yao

它们的表现如何: 好吧,让我们来看看结果。剧透警告: Imagen 3 让我最为惊讶。

  • 逼真的图像: 三个模型——Imagen 3、Qwen 2.5 MAX 和 Midjourney 6.1——都做得非常出色,生成了逼真的输出。Midjourney 依然在多样性上闪耀,但 Imagen 3 也迅速迎头赶上。
  • 鲸鱼图像失败: 无论是 Qwen 还是 Midjourney,都在座头鲸的提示上出现了失误。它们的鲸鱼看起来更像模糊的斑点或过分风格化的诠释。但Imagen 3 完美做到。细节清晰,质感真实,氛围恰到好处。
  • 文本处理: 这里情况变得有趣了。Midjourney 在处理文本提示时较为困难(如果你尝试过在图像中加入可读文本,你就会知道)。而 Imagen 3 处理短的英语和西班牙语短语表现不错,不过它还不懂中文。这对需要文字重的设计人来说可能是个游戏规则改变者。

为什么 Imagen 3 可能成为你的新选择: 如果你只是想要一个简单、免费的文本到图像生成工具,Imagen 3 值得一试。可以肯定的是,虽然 Midjourney V7 一直在拖延,但在我们等待时,Imagen 3 正在成为一个强有力的替代选项。

而且,它是免费的(至少现在是)。这对任何想要尝试 AI 艺术而又不想花钱的人来说都是一个巨大的胜利。

ImageFx 生成的图像截图来自EJ Yao

新玩家:ImageFX 这是我朋友提醒我的一件酷事——ImageFX。感觉就像 Midjourney 网络用户界面的早期版本。每次点击你可以得到四个图像输出,这对于快速比较来说很赞。我很期待进一步测试,尤其是因为它似乎在应对 Midjourney 处理困难的事情(比如文本)时表现得不错。

ImageFx 生成的图像截图来自EJ Yao

最终想法: 那么,结论是什么?

  • Midjourney 在多样性和风格种类方面仍然是王者。
  • Qwen 2.5 MAX 令人印象深刻,但需要改进,特别是在详细提示方面。
  • Imagen 3 是黑马。它的改进可谓令人瞩目,特别是在逼真度和文本整合方面。

目前来说,如果你想要高质量、真实的图像而不想花钱,我会说 Imagen 3 是一个很棒的选择。而且,关注一下 ImageFX——它可能会成为另一个受欢迎的选择。

ImageFx 生成的图像截图来自EJ Yao

接下来是什么? 我将继续测试这些工具并分享我的发现。如果你有具体的提示或想法希望我尝试,请在评论中告诉我!也请告诉我你最喜欢哪个 AI 生成器,为什么。如果你对 ImageFX 有任何建议,我非常乐意听取!

如果你喜欢这个,请确认你已经点赞并订阅了哦!这是你能帮助我继续做这件事情的小方法,我真的很感激你!

推荐阅读:

FluxAI 中文

© 2025. All Rights Reserved