传播文化业评级:GPT-4O语音、视频模式测试 可提升教育、情感陪伴体验

陈筱/杨昊 2024-08-01 08:30:49
机构研报 2024-08-01 08:30:49 阅读

  本报告导读:

      GPT-4o 高级语音、视频等功能开始测试,语音功能后续有望向所有付费用户开放,无延迟、具备情感的语音和视频交互将提升教育、情感陪伴等场景下的AI 体验。

      投资要点:

      事件:北京时间2024年7月31日凌晨,OpenAI宣布开始向小部分ChatGPT Plus 用户测试GPT-4o 的高级语音模式,预计今年秋天会向所有ChatGPT Plus 用户开放。

      此次测试为基础,语音功能有望在今年秋季向所有付费用户开放,更多新功能也将陆续落地。根据OpenAI 的说法,本次测试将主要搜集安全、功能方面的反馈,OpenAI 将于8 月初分享一份全面的GPT-4o 评估报告,随后,还会发布视频和屏幕共享新功能。语音功能预计今年秋天会向所有ChatGPT Plus 用户开放。

      GPT-4o 语音功能可实现无延迟对话并感知情绪语调,此次测试距离自首次发布已有近3 个月。北京时间2024 年7 月31 日凌晨,OpenAI 宣布开始向一小部分ChatGPT Plus 用户推出高级语音模式,相关功能最早在2024 年5 月14 日对外公开,OpenAI 在GPT4-o 发布会上展示了高级语音功能和视频功能,其中高级语音功能能以平均320 毫秒的速度对音频输入做出反应,过程中互动几乎无延迟,能够适应人类说话适时停顿的习惯、记忆对话内容上下文,还可以感知用户声音中的情绪语调,包括悲伤、兴奋等等。

      语音功能可用于教育及情感陪伴场景,甚至改变人机交互方式。从测试用户反馈来看,部分用户利用GPT-4o 进行口语练习,GPT-4o将针对用户发音进行实时评分,多种语言测试下都有稳定表现;情感方面,在用户对GPT-4o 讲笑话时,它将提供笑声给予反馈;GPT-4o 还能实现在讲故事的同时创建各种背景声,以增加沉浸感;有用户结合视频功能向GPT-4o 展示了宠物猫的情况,GPT-4o 也能够积极回应。我们认为,GPT-4o 高级语音、视频等功能将在教育及情感陪伴领域发挥作用,改进相关体验,甚至改变人机交互方式,建议关注教育及情感陪伴赛道的应用机会,受益标的南方传媒、世纪天鸿、昆仑万维、盛天网络、汤姆猫。

      风险提示:AI 效果不及预期;产品上线节奏放缓;商业化推进缓慢。

声明:
  1. 风险提示:以上内容仅来自互联网,文中内容或观点仅作为原作者或者原网站的观点,不代表本站的任何立场,不构成与本站相关的任何投资建议。在作出任何投资决定前,投资者应根据自身情况考虑投资产品相关的风险因素,并于需要时咨询专业投资顾问意见。本站竭力但不能证实上述内容的真实性、准确性和原创性,对此本站不做任何保证和承诺。
  2. 本站认真尊重知识产权及您的合法权益,如发现本站内容或相关标识侵犯了您的权益,请您与我们联系删除。