8 个月前
雨天,纽约第五大道作者:Childe Hassam --ar 16:9 --s 750 --style raw
Movie Gen Audio 是一个生成式AI模型,可以根据视频生成或扩展音频。用户通过文本提示控制生成音频的类型。模型分类音频为非叙事音效和乐器音乐,并通过FTI架构分析技术细节。Meta AI团队通过多个过滤步骤收集数据,包括视频时长、分辨率和重复内容去除,然后使用音频事件检测和音频-视频对齐评分进行分类,识别音频类型。
© 2025. All Rights Reserved