AI+专题系列点评(二十二)：豆包AI：多主体互动与高效计算的视频生成

吴鸣远 2024-10-17 08:26:34

2024-10-17 08:26:34 阅读

　　事项：

    　　2024 年9 月24 日，字节跳动旗下火山引擎在深圳举办的AI 创新巡展上正式发布了两款豆包视频生成大模型：Pixel Dance 和Seaweed，同时开启了面向企业市场的邀测。豆包AI 视频生成大模型具备多主体协同和复杂任务处理的显著能力，支持复杂的多镜头操作，如变焦、平移和环绕，确保不同镜头切换时视觉风格和细节的一致性。该模型采用动态集成Transformer（DiT）架构，每分钟处理高达80 万次Token，远超行业标准，具备强大的并发处理能力。这些特性使豆包AI 在视频生成领域，尤其是影视和广告行业，拥有广泛的应用前景和竞争优势。

    　　评论：

    　　多主体互动与复杂任务处理：豆包AI 视频生成大模型突破了多主体复杂互动的技术障碍，支持深度语义理解，通过复杂指令驱动多个角色的自然互动。这使得生成的视频角色动作、表情高度协调，自然流畅，满足影视、游戏等多角色场景的需求。

    　　多镜头切换与一致性：依托动态集成Transformer（DiT）架构，模型支持丰富的多镜头操作，如变焦、环绕、平移等，并在不同镜头切换中保持主体风格、氛围的一致性。这解决了传统视频生成中因镜头切换导致视觉不连贯的问题，为视频创作者提供了更灵活的视觉表达手段。

    　　细节处理与风格适应性：该模型具备强大的细节处理能力，能够准确呈现人物的外貌、服装等细微变化，并且适应多种风格需求。即使在复杂的时序转换中，视频内容仍能保持高度一致性，进一步提升视频的表现力与观赏性。

    　　高效计算与扩展能力：豆包AI 视频生成模型具备每分钟高达80 万Token 的并发处理能力，远超行业标准。这使其能够高效应对大规模应用中的高并发需求，确保系统的稳定性和效率。同时，它在影视制作和广告生成等领域展现出巨大的应用潜力。豆包AI 的技术突破显著提升了生成高质量复杂视频内容的效率，推动了智能化视频生成领域的发展，并在行业中展现了强大的竞争优势。

    　　投资建议：AI 大模型本质应落脚垂类应用，国内大模型正快速追赶美国先进水平，中文大模型的突破有望为下游AI 应用注入新的活力，看好AI+应用产品力与商业化落地进程。建议关注以下标的：AI+应用侧：1）安全：永信至诚、深信服；2）办公：金山办公、福昕软件；3）法律：金桥信息、华宇软件、通达海；4）医疗：润达医疗；5）教育：佳发教育、欧玛软件、新开普；6）金融：同花顺、新致软件；7）邮箱：彩讯股份；8）传媒：掌阅科技、华策影视；9）数据：海天瑞声；10）电商：焦点科技；11）OA：致远互联、泛微网络；12）ERP：用友网络、金蝶国际。算力侧：1）算力基础：润泽科技、亚康股份、海光信息、寒武纪、龙芯中科；2）服务器：中科曙光、浪潮信息、紫光股份、神州数码、拓维信息。

    　　风险提示: 商业化后表现不及预期，用户付费意愿低，行业技术迭代速度较快。

豆包二十

声明：

风险提示：以上内容仅来自互联网，文中内容或观点仅作为原作者或者原网站的观点，不代表本站的任何立场，不构成与本站相关的任何投资建议。在作出任何投资决定前，投资者应根据自身情况考虑投资产品相关的风险因素，并于需要时咨询专业投资顾问意见。本站竭力但不能证实上述内容的真实性、准确性和原创性，对此本站不做任何保证和承诺。

本站认真尊重知识产权及您的合法权益，如发现本站内容或相关标识侵犯了您的权益，请您与我们联系删除。

AI+专题系列点评(二十二)：豆包AI：多主体互动与高效计算的视频生成

推荐文章：

上港集团: 关于收到中国证监会《关于同意上海国际港务（集团）股份有限公司向专业投资者公开发行公司债券注册的批复》的公告

利亚德: 关于利德转债赎回实施的第七次提示性公告

本钢板材: 本钢板材股份有限公司关于预计触发可转换公司债券转股价格向下修正条件的提示性公告

利元亨: 广东利元亨智能装备股份有限公司关于实施“利元转债”赎回暨摘牌的第十一次提示公告

利元亨: 广东利元亨智能装备股份有限公司关于“利元转债”转股数额累计达到转股前公司已发行股份总额10%的公告

飞凯材料: 关于“飞凯转债”恢复转股的提示性公告

天汽模: 关于汽模转2赎回结果的公告

天汽模: 关于汽模转2摘牌的公告