传媒行业:DEEPSEEK获全球关注 国产AI持续繁荣

证券之星 2025-02-04 09:23:20
股市要闻 2025-02-04 09:23:20 阅读

  DeepSeek 接连发布V3、R1 系列模型,性能比肩OpenAI2024 年12 月26 日,国产AI 厂商DeepSeek 发布V3 大模型,以极低的训练成本(557.6 万美元),实现性能对标GPT-4o。2025 年1 月20 日,DeepSeek 发布R1系列大模型(包括R1 和R1-Zero),同样在数学、代码和自然语言推理等任务上比肩OpenAI o1 正式版,引起全球AI 产业、科研界的广泛关注。

      技术层面:纯强化学习路径,助力“顿悟”式认知突破技术层面,DeepSeek-R1 系列模型主要在几个方面实现突破:1)强化学习(RL)有效性凸显:R1-Zero 选择了仅依靠强化学习(RL),而除去传统AI 推理能力训练过程中的SFT(监督微调)和思维链(COT),同样能够激发模型的推理能力;2)“顿悟”现象的出现:R1 系列模型在处理复杂问题时,会在一段时间后实现“顿悟”式的认知突破,推动R1-Zero 在AIME 数学竞赛、编程竞赛平台Codeforces 上均实现优异水平。这或将意味着AI 复杂推理、自主学习能力的进一步提升。

      效率层面:极高性价比,引起全球关注

      DeepSeek 系列模型发布后,引起全球AI 产研界、科技巨头的广泛关注,微软、Meta、Deepmind、Anthropic 等管理层对其性能及训练效率给予高度评价。其主要原因在于极高的“性价比”:在性能逼近全球顶尖模型的同时,V3 训练成本557.6万美元,仅为Meta Llama3 的约1%。据The Information 报道,Meta 已成立4 个专门小组研究DeepSeek 的工作原理,用以改进Llama 模型。

      应用层面:坚持模型开源,应用登顶多国下载榜在低成本、高性能之外,R1 系列模型坚持开源模式,选择了最开放的许可证和用户协议、明确可“模型蒸馏”,同时发布了详细的技术报告。API 服务方面,定价为每百万输入tokens1 元(缓存命中)/4 元(缓存未命中),每百万输出tokens16元,其中输出价格仅为OpenAI o1 的3%。C 端应用方面,DeepSeek 于1 月15 日推出移动端应用,1 月27 日同时登顶中美地区iOS 下载榜。据AI 产品榜数据,DeepSeek App 上线20 天日活已超过2000 万。

      投资建议:维持强于大市

      我们认为,模型角度看,从大语言模型类的豆包、DeepSeek,到视频生成类的海螺、可灵、Vidu、Pixverse,以及3D 生成类的VAST、混元,国产AI 与海外OpenAI等头部企业的差距已逐步缩小,且在部分领域实现突破。应用角度看,DeepSeek背后的国产AI 模型能力提升、调用成本降低以及开源的趋势,有望推动AI 应用生态持续繁荣。建议关注AI 模型&应用布局较早的企业:恺英网络、昆仑万维、巨人网络、盛天网络、奥飞娱乐、上海电影、中文在线、美图公司。

      风险提示:技术发展缓慢,AI 应用落地缓慢,政策监管趋严的风险。

声明:
  1. 风险提示:以上内容仅来自互联网,文中内容或观点仅作为原作者或者原网站的观点,不代表本站的任何立场,不构成与本站相关的任何投资建议。在作出任何投资决定前,投资者应根据自身情况考虑投资产品相关的风险因素,并于需要时咨询专业投资顾问意见。本站竭力但不能证实上述内容的真实性、准确性和原创性,对此本站不做任何保证和承诺。
  2. 本站认真尊重知识产权及您的合法权益,如发现本站内容或相关标识侵犯了您的权益,请您与我们联系删除。
最新发布
今日焦点