电子行业周观点:国产模型迅速破圈 重视国产算力、端侧机遇
DeepSeek 携三款创新模型强势入场,以卓越成就掀起行业变革浪潮。
DeepSeek 在2024 年底后接连发布V3、R1 和Janus-Pro,它们在多项评测中胜过主流开源模型,且具有成本优势。V3 创新架构提升推理效率、降低训练成本且性能卓越;R1 专注提升推理能力,多领域表现优异,蒸馏模型效果良好;Janus-Pro 改进架构、策略、数据和规模,多模态与视觉生成能力突出。DeepSeek 推动AI 大模型降本,我们认为其低成本,高性能的表现将推动大模型革新,促使AI 服务更加普及和实惠,有望驱动更多厂商入局推理端大模型布局,提升后续AI 模型的需求及AI 应用的加速爆发,长期或将大幅提升推理侧算力需求,且其对算力芯片要求相对较低,国产算力芯片迎新发展机遇,高度重视算力底座中芯国际、昇腾910 产业链等。
除DeepSeek 之外,1 月20 日,月之暗面发布k1.5 多模态思考模型,性能对标OpenAI o1 正式版;1 月22 日,字节跳动发布豆包大模型1.5 Pro版本,采用大规模稀疏MoE 架构,全面提升了多模态能力;1 月28 日,通义两大模型正式开源,Qwen2.5-VL 和Qwen2.5-1M 分别在视觉理解和长文本理解方面实现突破;1 月29 日,通义千问旗舰版Qwen2.5-Max 升级发布,综合性能强劲。可以看到,国内大模型迎来了密集的发布潮,正处于技术进步迅速、市场规模快速增长的爆发式发展阶段,有望推动AI 技术在各个领域落地开花。
DeepSeek-R1 蒸馏小模型性能卓越且为开源,有望推动端侧部署,带动AI 终端时代来临。微软宣布专为神经处理单元(NPU)优化的DeepSeekR1 模型即将登陆Copilot+ PC(Windows 11 AI+ PC)。英特尔2023 年启动AI PC 加速计划,推动AI PC 生态的快速发展,目前支持包括DeepSeek在内的超过500 个AI 模型,DeepSeek-R1-1.5B 模型能够顺利运行在最新发布的酷睿Ultra 200H 平台。除蒸馏模型之外,目前通过针对性的量化技术压缩体积,完整的671B MoE 模型有望消费级硬件上(如单台MacStudio)运行,大幅降低本地部署门槛,我们认为未来更大规模的模型有望在个人电脑上运行,带动个人超级电脑时代来临,进一步带动PC 换新需求以及相关部件,如内存、散热、结构件等的升规升配。
周观点:相关标的见尾页。
风险提示:下游需求不及预期、研发进展不及预期、地缘政治风险。
声明:
- 风险提示:以上内容仅来自互联网,文中内容或观点仅作为原作者或者原网站的观点,不代表本站的任何立场,不构成与本站相关的任何投资建议。在作出任何投资决定前,投资者应根据自身情况考虑投资产品相关的风险因素,并于需要时咨询专业投资顾问意见。本站竭力但不能证实上述内容的真实性、准确性和原创性,对此本站不做任何保证和承诺。
- 本站认真尊重知识产权及您的合法权益,如发现本站内容或相关标识侵犯了您的权益,请您与我们联系删除。
推荐文章: