人工智能行业点评报告:“满血”O1大模型重磅亮相 引领新一轮多模态AI迭代浪潮

刘雯蜀/陶韫琦 2024-12-07 12:39:09
机构研报 2024-12-07 12:39:09 阅读

  投资要点

      北京时间12 月6 日凌晨,OpenAI 开启为期12 天直播活动并在首日上线完整版的o1 大模型,并发布ChatGPT Pro 服务(订阅价格为每月200 美元),模型能力再次实现大幅提升。近期亚马逊、谷歌Deepmind 以及国内腾讯、万兴科技等厂商均在多模态AI 及应用领域持续迭代,商业化进程有望加速。

      OpenAI 上线完整版o1 模型和进阶模式以及ChatGPT Pro 订阅服务

    北京时间12 月6 日凌晨,OpenAI 在其举办的“12 天12 场直播”活动首秀中发布完整版o1 大模型。o1 模型回答用户提问时可形成类似人类思维方式的内部思维链条,从而明显提高回答专业问题的准确性,o1 模型回答困难现实问题时出现重大错误的概率可减少34%。相比o1-preview,完整版o1 模型响应更快且更准确,同时增加了多模态输入的能力。

      OpenAI 推出ChatGPT Pro,定价为每月200 美元。ChatGPT Pro 用户可以无限量地使用o1 模型(Plus 用户限制为每周50 条信息),以及无限量使用o1 mini模型和高级语音模式。o1 pro 会使用更多的计算资源进入深入思考,并为“最难的问题提供最好的答案”。OpenAI 未来计划为模型添加更多更强大、计算密集型的功能。

      亚马逊、谷歌DeepMind 相继发布多模态大模型,应用场景持续延伸

    在12 月4 日的re:Invent 大会上,亚马逊AWS 发布了新款AI 多模态系列大模型Amazon Nova。Nova 一共包含6 个模型,其中Micro 和Lite 模型能够理解文本、图像和视频输入,适合快速和低成本的交互场景。Pro 模型结合多模态能力和高准确性及响应速度,适合视频摘要、软件开发辅助等高级应用。最高端的Premier 模型预计将于2025 年初发布,旨在处理复杂推理任务。而Canvas、Reel 用于创意任务。Canvas 模型能够从文本或图像提示生成专业级图像,Reel模型则能够用自然语言控制风格和摄像机运动,制作短视频。

      近日,谷歌DeepMind 推出第二代大规模基础世界模型Genie 2,相比于上一代模型,Genie 2 在通用性上实现重大突破——能生成丰富多样的3D 世界,可以模拟虚拟世界,包括采取任何行动(如跳跃、游泳等)的后果。基于大规模视频数据集进行训练后,Genie2 展现出了各种规模的涌现能力,例如物体交互、复杂的角色动画、物理效果、建模、预测其他智能体行为的能力等等。基于Genie 2 模型,研究人员可以快速尝试新环境并训练和测试具身AI 智能体。

      近期国内厂商在大模型及产品层面均有升级迭代,关注多模态AI 商业化加速

    近日,万兴科技旗下视频创意软件Filmora V14 版本新增上线超十项AI 功能,包括音频成片、图生视频、智能切片、AI 翻译唇形驱动、AI 文生音效等一系列AI 能力,适用于视频博客、教育工作者、营销团队等群体视频创作增效提质。

      在大模型侧,近日腾讯开源了130 亿参数的类Sora 文生视频模型HunyuanVideo,具备物理模拟、一镜到底、文本语义还原度高、动作一致性强、色彩分明、对比度高等技术特性,可生成带有音乐的视频。国内厂商多模态模型及产品应用呈现加速迭代趋势。

      建议关注标的

      AI Agent 应用:科大讯飞、彩讯股份、焦点科技、鼎捷数智、泛微网络、拓尔思、迈富时;

      AI 垂类应用:金山办公、三六零、万兴科技、昆仑万维、虹软科技、润达医疗、美图公司、商汤-W;

      风险提示

      1、AI 技术迭代不及预期的风险;2、AI 商业化产品发布不及预期;3、政策不确定性带来的风险;4、下游市场不确定性带来的风险;

声明:
  1. 风险提示:以上内容仅来自互联网,文中内容或观点仅作为原作者或者原网站的观点,不代表本站的任何立场,不构成与本站相关的任何投资建议。在作出任何投资决定前,投资者应根据自身情况考虑投资产品相关的风险因素,并于需要时咨询专业投资顾问意见。本站竭力但不能证实上述内容的真实性、准确性和原创性,对此本站不做任何保证和承诺。
  2. 本站认真尊重知识产权及您的合法权益,如发现本站内容或相关标识侵犯了您的权益,请您与我们联系删除。