计算机行业专题报告:METAMOVIEGEN的论文告诉我们什么?
Movie Gen:音视频两手抓,模型效果亮眼。2024 年10 月4 日,Meta 团队发布论文《Movie Gen: A Cast of Media Foundation Models》,介绍了一系列基础模型Movie Gen,该模型在文本到视频合成、视频个性化、视频编辑、视频到音频生成等多个任务上取得了显著成果,标志着Meta 正式进入视频生成赛道,与Sora、Pika、Runway 等进行竞争。Meta 通过扩大训练数据、计算资源和模型参数,使用Flow Matching(流匹配)方法训练的Transformer 模型,打造Movie Gen 的2 种基础模型:Movie Gen Video(300 亿参数)和MovieGen Audio(130 亿参数),生成高质量的视频或音频。基于Movie Gen Video 基础模型进一步训练与微调后,得到可以生成可个性化视频的PersonalizedMovie Gen Video 模型和可精确编辑视频的Movie Gen Edit。
多模态大模型架构与训练方法持续创新,向实现应用落地大幅迈进。
Movie Gen 系列模型打开创意生成与创意编辑市场AI 应用落地的新的想象空间,“文本控制生成”的方式将逐步融入创意工作流,“文本+UI”并存的模式将长期持续;模型架构创新尚无止境,“流匹配+最优传输+纯Transformer”生成效率、质量均优于DiT;对于多模态大模型预训练或是微调,高质量的数据及处理起到决定性作用;未来在模型训练方面,获得更多的算力基础依然是必不可少的,而架构等技术创新有望持续提升训练效率和生成质量,两者并不矛盾。
投资建议:Scaling Law 持续发挥效力,建议关注:英伟达、AMD、博通、Vertiv、美光、Oracle、微软、海光信息、协创数据、中科曙光、浪潮信息、英维克、神州数码等;音视频创意类赛道依然大有可为,建议关注Adobe、万兴科技、美图公司等。
风险提示:技术迭代不及预期的风险;商业化落地不及预期的风险;政策支持不及预期风险;全球宏观经济风险
声明:
- 风险提示:以上内容仅来自互联网,文中内容或观点仅作为原作者或者原网站的观点,不代表本站的任何立场,不构成与本站相关的任何投资建议。在作出任何投资决定前,投资者应根据自身情况考虑投资产品相关的风险因素,并于需要时咨询专业投资顾问意见。本站竭力但不能证实上述内容的真实性、准确性和原创性,对此本站不做任何保证和承诺。
- 本站认真尊重知识产权及您的合法权益,如发现本站内容或相关标识侵犯了您的权益,请您与我们联系删除。
推荐文章: