人工智能行业DEEPSEEK专题研究:“低成本、高性能、强推理”三位一体 DEEPSEEK驱动高质量模型平价化

证券之星 2025-02-15 04:42:22
股市要闻 2025-02-15 04:42:22 阅读 160

DeepSeek模型密集更新,用户数将持续高速增长

      自2024年起,DeepSeek在A领域迅速崛起并不断送代。2024年12月底至2025年1月底,更新尤为密集,发布了参数众多且性能提升的V3、支持思维链输出和模型训练的R1,以及深耕图像领域的视觉和多模态模型。2024年12月底到2025年1月底,全球用户数从34.7万激增至1.19亿。与ChatGPT相比,DeepSeek仅用一年多就达到ChatGPT两年的用户规模,在国内1月跃居月均活跃用户数榜首: APP下载量也大幅增长

    DeepSeek具备低成本、高性能、强推理三大特点

    DeepSeek-V3通过算法创新和工程优化大幅提升模型效率,从而降低成本,提高性价比。DeepSeek V3训练成本仅为557方美元,耗时不到两个月。DeepSeek通用及推理模型成本相较于OpenA等同类模型幅下降。DeepSeek-R1在继承了V3的创新架构的基础上,在后训练阶段大规模使用了强化学习技术,自动选择有价值的数据进行标注和训练,减少数据标注量和计算资源浪费,并在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,DeepSeek在 AIME2024测评中上获得79.8%的pass@1得分,略微超过OpenAI-o1;在MATH-500上,获得了97.3%的得分,与OpenAl-o1性能相当,并且显著优于其他模型。

      DeepSeek驱动模型平价化,建议关注算力、Al应用和端侧的投资机会

    1)算力:随着更多用户对DeepSeek的使用,以及未来更多AI应用的不断涌现,对算力的需求呈现出几何级增长趋势。AI技术的进步,虽然模型效率提高了,但不断增长的用户和应用数量,却对算力资源提出了更高要求,消耗也随之剧增。2)B端应用:AlAgent正在对传统SaaS应用进行全面重构。与传统知识库结构化管理模式相比,AIAgent的向量数据库具备强大的自主学习能力,能够自动理解文档内容,实现更加高效的知识管理,为企业的数字化转型提供了有力支持。C端应用:作为生成式Al的重要商业化应用,AIAgent在电商、教育、旅游、酒店以及客服等多个行业得到了厂泛应用。3)端侧:Al正在内容、应用、硬件、生态上影响世界,AIAgent已从“数字”走向“具身”;随着市场发展,大模型更广泛地接入硬件产品,做好软硬件协同发展是未来竞争的关键。

    投资建议

    1)建议关注以国产算力和A推理需求为核心的算力环节,尤其是IDC、服务器、国产芯片等算力配套产业,推荐海光信息、浪潮信息。2)DeepSeek迅速集成进各云厂商的平台中,直接拉高模型能力下限,A应用开发提速升级。建议关注:B端:鼎捷数智、用友网络;C端:金山办公。3)小模型能力提升促进了端侧模型部署,我们看好A终端作为新一代计算平台爆发可能。建议关注:科大讯飞、立讯精密、歌尔股份。

    风险提示

      AI产业商业化落地不及预期的风险、市场竞争加剧风险、政策不确定性风险。

声明:
  1. 风险提示:以上内容仅来自互联网,文中内容或观点仅作为原作者或者原网站的观点,不代表本站的任何立场,不构成与本站相关的任何投资建议。在作出任何投资决定前,投资者应根据自身情况考虑投资产品相关的风险因素,并于需要时咨询专业投资顾问意见。本站竭力但不能证实上述内容的真实性、准确性和原创性,对此本站不做任何保证和承诺。
  2. 本站认真尊重知识产权及您的合法权益,如发现本站内容或相关标识侵犯了您的权益,请您与我们联系删除。
最新发布
广告位招租
今日焦点
广告位招租