10 个月前
随机图片 --ar 1:1 --v 6.1
AI生成视频正成为热门趋势,微软、OpenAI和Meta等大公司纷纷参与。微软推出VASA-1,OpenAI预告Sora,Meta的Movie Gen则具备视频编辑和音频生成能力。尽管Movie Gen尚未对外发布,但其功能包括基于图像生成视频和添加音效。Meta的透明度相对较高,但仍未公开训练数据。虽然AI视频工具在不断进步,但仍面临生成时间和成本等挑战,未来的发展值得关注。
本文对比了Grok2和Google ImageFX两种图像生成工具,重点测试它们生成真实人物肖像的能力。Grok2以其生动的户外场景和细腻的肤色细节著称,而Google ImageFX则在肖像质量和光滑度上表现出色,适合追求传统完美肖像的用户。两者在细节处理上各有千秋,Grok2在细致度上略胜一筹,而ImageFX更适合书籍封面或企业网站的肖像。作者对两者的表现均表示满意。
Google的Veo 2在视频生成领域表现出色,凭借其高质量、真实感和动态视频制作能力,成为OpenAI的Sora和Meta的MovieGen等竞争对手的有力竞争者。Veo 2在复杂指令的遵循、模拟真实物理和捕捉电影效果方面表现优异。Facebook Research推出的MovieGen Bench为评估AI视频模型提供了环境,Veo 2在与其他模型的比较中表现突出,显示出卓越的质量和用户偏好。其真实感和对用户请求的精确响应使其在视频生成方面脱颖而出。
本文比较了Flux Pro 1.1与Midjourney V 6.1的图像生成效果。Flux Pro在文本理解和图像清晰度上表现优异,但在艺术风格和色彩变化上不如Midjourney。尽管Flux Pro生成的图像锐利,且对提示的遵循性较好,但在某些情况下,Midjourney的图像更具美感和自然感。总体而言,Midjourney在创意项目中仍是更佳选择。
作者发现Flux AI能够生成超现实的图像,并能够通过自动化工具如Make.com将这些图像转化为被动收入。最初对自动化工具持怀疑态度,但经过多次尝试后,作者成功创建了一套自动化系统,专注于钓鱼类产品,通过生成吸引人的内容来促进销售。设定简单的工作流程后,能够高效地生成和发布图像,提升内容创作效率。
最近我使用Flux的托管版本生成图像,但费用很高。于是我决定使用gguf格式在本地生成图像,这种格式使模型更紧凑、加载更快。整个过程分为四部分:下载并运行ComfyUI、下载工作流程、下载模型、编写提示并运行工作流程。需要下载ComfyUI和相关模型,并在ComfyUI中加载它们。最终可以在浏览器中查看生成的图像和控制器。
© 2025. All Rights Reserved