计算机行业点评报告:DEEPSEEK搅动了全球AI的“一池春水”

证券之星 2025-02-04 09:23:13
股市要闻 2025-02-04 09:23:13 阅读

  事件:

      2025 年2 月1 日-2 日,华为云和腾讯云分别宣布已上线基于其云服务的DeepSeek-R1 相关服务。此外,微软、英伟达、亚马逊、英特尔、AMD等已于近日上线DeepSeek 模型服务。

      2025 年1 月20 日,深度求索公司正式发布DeepSeek-R1,并同步开源模型权重,DeepSeek-R1 在数学、代码、自然语言推理等任务上性能对齐OpenAI-o1 正式版。

      投资要点:

      DeepSeek 成立不足2 年时间,V3 和R1 模型的推出广受关注DeepSeek(深度求索)成立于2023 年7 月,由量化资管公司幻方量化创立,DeepSeek 专注于开发先进的大语言模型(LLM)和相关技术。

      2024 年1 月5 日,发布第一个大模型DeepSeek LLM;5 月7 日,发布MoE 架构的DeepSeek V2;12 月26 日,上线DeepSeek-V3 并同步开源,DeepSeek-V3 采用FP8 训练,性能对其世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet。2025 年1 月20 日,发布DeepSeek-R1,DeepSeek-R1 在数学、代码、自然语言推理等任务上,性能比肩OpenAIo1 正式版。同时,DeepSeek 并通过DeepSeek-R1 的输出,蒸馏了6个小模型开源给社区,其中32B 和70B 模型在多项能力上实现了对标OpenAI o1-mini。

      DeepSeek-R1 的发布广受关注,1 月27 日,Deepseek 应用登顶苹果中国地区和美国地区应用商店免费App 下载排行榜,并在美区下载榜上超越了ChatGPT。Meta 首席AI 科学家Yann Lecun 表示“DeepSeek-R1 面世与其说意味着中国公司在AI 领域正在超越美国公司,不如说意味着开源大模型正在超越闭源。”,OpenAI 首席执行官Sam Altman 首次承认OpenAI 的闭源策略“站在了历史错误的一边”。

      DeepSeek-R1 的推出,搅动了全球AI 产业界的“一池春水”。

      DeepSeek 引领全球AI 基础技术创新,并实现成本极致优化DeepSeek 引领了全球AI 基础技术创新,主要技术创新包括模型架构、算力优化、强化学习、知识蒸馏、开源策略等。(1)架构:DeepSeek-V3创新了自研的多头潜在注意力机制MLA 和DeepSeek MoE 架构。(2)开源:DeepSeek 开源代码和模型,加速技术迭代和生态系统建设。(3)高效硬件利用:DeepSeek 并通过高效的负载均衡策略、FP8 混合精度训练框架以及通信优化等技术手段,大幅提升了算力利用效率,降低了训练成本。

      据DeepSeek 公众号,DeepSeek-V3 的API 服务定价为每百万输入tokens 0.5 元(缓存命中)/ 2 元(缓存未命中),每百万输出tokens 8元。根据暗涌公众号采访报告,DeepSeek 创始人梁文锋对产品价格问题表示“我们只是按照自己的步调来做事,然后核算成本定价。我们的原则是不贴钱,也不赚取暴利。这个价格也是在成本之上稍微有点利润。”DeepSeek 基于国内团队训练,提振国内信心并激发AI 创新活力梁文锋表示“DeepSeek-V2 背后的团队都是一些Top 高校的应届毕业生、没毕业的博四、博五实习生,还有一些毕业才几年的年轻人。V2模型没有海外回来的人,都是本土的”。此外,根据Semianalysis 预计,DeepSeek 在服务器上的资本开支约16 亿美元,其中包括NVIDIA 的A100、H100、H800、H20 分别为10000、10000、10000、30000 颗。

      我们认为:DeepSeek 以中国的技术团队和本土的算力资源,在前沿大模型领域实现了对全球技术创新的引领,惊艳了海内外市场。

      DeepSeek 的突破,也表明了我国在算力受限的情况下,通过极致的技术探索,实现对海外AI 技术的追赶的可行性,将进一步提振包括中国在内的全球AI 工作者的信心,激发AI 创新活力。同时,DeepSeek 有望通过成本优化和技术创新,推动全球AI 应用和AI 终端技术的创新和普及,并有望加速AGI 时代到来。

      行业评级及投资策略:DeepSeek-R1 代表中国力量引领了全球AI产业创新,或将提振AI 产业信心,推动AI 应用、AI 端侧创新加速,并将利好AI 算力需求实现长期增长,维持计算机行业“推荐”评级。

      相关标的:

      1)AI 应用:金山办公、福昕软件、合合信息、光云科技、明源云、万兴科技、虹软科技、新开普、卫宁健康、嘉和美康、同花顺、恒生电子、金证股份、用友网络、金蝶国际、鼎捷数智、能科科技、广联达。

      2)大模型:科大讯飞、三六零、云从科技、拓尔思、第四范式;3)AI 算力:海光信息、寒武纪、浪潮信息、中科曙光、紫光股份、华勤技术、中国长城、龙芯中科、英维克、曙光数创、润泽科技、网宿科技、云赛智联、飞荣达、软通动力、中国软件国际、并行科技。

      风险提示:大模型产业发展不及预期、中美博弈加剧、宏观经济影响下游需求、市场竞争加剧、相关标的公司业绩不及预期等。

声明:
  1. 风险提示:以上内容仅来自互联网,文中内容或观点仅作为原作者或者原网站的观点,不代表本站的任何立场,不构成与本站相关的任何投资建议。在作出任何投资决定前,投资者应根据自身情况考虑投资产品相关的风险因素,并于需要时咨询专业投资顾问意见。本站竭力但不能证实上述内容的真实性、准确性和原创性,对此本站不做任何保证和承诺。
  2. 本站认真尊重知识产权及您的合法权益,如发现本站内容或相关标识侵犯了您的权益,请您与我们联系删除。
最新发布
今日焦点