传播文化业:AI行业深度更新报告:大模型“开源、轻量、端侧”化 视频与语音加速落地

陈筱/杨昊 2024-08-09 18:30:56
机构研报 2024-08-09 18:30:56 阅读 367

  投资要点:

      继续看好AI技术发展对内容产业的推动作用。随着AI大模型开源化、轻量化,以及视频和语音等模态的快速进步,部分应用场景有望发生变化,可沿如下思路进行布局:1)游戏等应用改造,推荐吉比特、恺英网络、完美世界、美图公司,受益标的腾讯控股、网易、快手、巨人网络;2)教育赛道,受益标的南方传媒、皖新传媒、世纪天鸿;3)情感陪伴与社交,受益标的昆仑万维、盛天网络。

      大模型侧:开源能力快速提升,轻量化趋势显著。2024 年以来,大模型发展呈现三大趋势:1)开源模型发展,能力快速接近闭源产品水平;2)“轻量化”,模型“性价比”快速提升;3)端侧模型发展,AI 硬件已经开始布局。这些都意味着AI 大模型的发展在向着落地可行方向进发。

      AI 生成视频:能力兑现有望加速。自从2024 年2 月OpenAI sora演示视频放出,AI 视频领域的行业标准被显著提高,而经历4 个多月的积累后,6-7 月国内外多个团队交出“类sora”产品的首份答卷:国内有多次迭代、面向全球、快速商业化的快手可灵,从文本大模型发家的独角兽企业智谱;海外则有持续保持高生成质量的Runway Gen3 Alpha、有3D 生成相关经验帮助的Luma。这些产品的生成效果都比“前sora 时代”的产品有显著提升,预示着AI视频领域的预期或加速兑现。

      语音功能:或助推AI 产品迭代。GTP-4o 的高级语音功能已经在7月底开始小范围测试,这一功能使得AI 可以从用户语音中获得情感、语调等更丰富的信息,回应时也可以体现出语调等更丰富的表达,且交互延迟小、可被打断,AI 语音交互的体验预计有显著提升。

      该领域AI 技术的发展有望对教育、情感陪伴等应用场景的使用有改进效果,对人机交互体验提升将有所帮助。

      风险提示:AI 应用推进放缓,AI 相关商业化落地不及预期,生成式内容监管风险。

声明:
  1. 风险提示:以上内容仅来自互联网,文中内容或观点仅作为原作者或者原网站的观点,不代表本站的任何立场,不构成与本站相关的任何投资建议。在作出任何投资决定前,投资者应根据自身情况考虑投资产品相关的风险因素,并于需要时咨询专业投资顾问意见。本站竭力但不能证实上述内容的真实性、准确性和原创性,对此本站不做任何保证和承诺。
  2. 本站认真尊重知识产权及您的合法权益,如发现本站内容或相关标识侵犯了您的权益,请您与我们联系删除。