传播文化业：AI行业深度更新报告：大模型“开源、轻量、端侧”化视频与语音加速落地

陈筱/杨昊 2024-08-09 18:30:56

2024-08-09 18:30:56 阅读 367

　　投资要点：

    　　继续看好AI技术发展对内容产业的推动作用。随着AI大模型开源化、轻量化，以及视频和语音等模态的快速进步，部分应用场景有望发生变化，可沿如下思路进行布局：1）游戏等应用改造，推荐吉比特、恺英网络、完美世界、美图公司，受益标的腾讯控股、网易、快手、巨人网络；2）教育赛道，受益标的南方传媒、皖新传媒、世纪天鸿；3）情感陪伴与社交，受益标的昆仑万维、盛天网络。

    　　大模型侧：开源能力快速提升，轻量化趋势显著。2024 年以来，大模型发展呈现三大趋势：1）开源模型发展，能力快速接近闭源产品水平；2）“轻量化”，模型“性价比”快速提升；3）端侧模型发展，AI 硬件已经开始布局。这些都意味着AI 大模型的发展在向着落地可行方向进发。

    　　AI 生成视频：能力兑现有望加速。自从2024 年2 月OpenAI sora演示视频放出，AI 视频领域的行业标准被显著提高，而经历4 个多月的积累后，6-7 月国内外多个团队交出“类sora”产品的首份答卷：国内有多次迭代、面向全球、快速商业化的快手可灵，从文本大模型发家的独角兽企业智谱；海外则有持续保持高生成质量的Runway Gen3 Alpha、有3D 生成相关经验帮助的Luma。这些产品的生成效果都比“前sora 时代”的产品有显著提升，预示着AI视频领域的预期或加速兑现。

    　　语音功能：或助推AI 产品迭代。GTP-4o 的高级语音功能已经在7月底开始小范围测试，这一功能使得AI 可以从用户语音中获得情感、语调等更丰富的信息，回应时也可以体现出语调等更丰富的表达，且交互延迟小、可被打断，AI 语音交互的体验预计有显著提升。

    　　该领域AI 技术的发展有望对教育、情感陪伴等应用场景的使用有改进效果，对人机交互体验提升将有所帮助。

    　　风险提示：AI 应用推进放缓，AI 相关商业化落地不及预期，生成式内容监管风险。

开源深度

声明：

风险提示：以上内容仅来自互联网，文中内容或观点仅作为原作者或者原网站的观点，不代表本站的任何立场，不构成与本站相关的任何投资建议。在作出任何投资决定前，投资者应根据自身情况考虑投资产品相关的风险因素，并于需要时咨询专业投资顾问意见。本站竭力但不能证实上述内容的真实性、准确性和原创性，对此本站不做任何保证和承诺。

本站认真尊重知识产权及您的合法权益，如发现本站内容或相关标识侵犯了您的权益，请您与我们联系删除。

传播文化业：AI行业深度更新报告：大模型“开源、轻量、端侧”化视频与语音加速落地

推荐文章：

上港集团: 关于收到中国证监会《关于同意上海国际港务（集团）股份有限公司向专业投资者公开发行公司债券注册的批复》的公告

利亚德: 关于利德转债赎回实施的第七次提示性公告

本钢板材: 本钢板材股份有限公司关于预计触发可转换公司债券转股价格向下修正条件的提示性公告

利元亨: 广东利元亨智能装备股份有限公司关于实施“利元转债”赎回暨摘牌的第十一次提示公告

利元亨: 广东利元亨智能装备股份有限公司关于“利元转债”转股数额累计达到转股前公司已发行股份总额10%的公告

飞凯材料: 关于“飞凯转债”恢复转股的提示性公告

天汽模: 关于汽模转2赎回结果的公告

天汽模: 关于汽模转2摘牌的公告

传播文化业：AI行业深度更新报告：大模型“开源、轻量、端侧”化 视频与语音加速落地

传播文化业：AI行业深度更新报告：大模型“开源、轻量、端侧”化视频与语音加速落地