通信行业前沿科技双周谈系列9:MANUS、QWQ32B等推动AI爆发 重视庆阳等国家算力节点部署

证券之星 2025-03-10 09:25:53
股市要闻 2025-03-10 09:25:53 阅读

  事件:2025 年国产大模型接踵而至,LLM+多模态持续迭代。

      事件1:3 月6 日,由中国创业公司 Monica 开发的全球首款通用 AI Agent(自主智能体)产品Manus 正式发布。Manus 集成了 Claude 3.5、DeepSeek 等多个大模型,通过 Chain of Thought 技术和多智能体协作架构(规划代理+执行代理+验证代理)实现任务流程自动化。

      事件2:3 月6 日,阿里公布开源大型推理模型QwQ-32B(Qwen-with-Questions),这款仅有320 亿参数的模型通过强化学习技术,在多项基准测试中展现出与拥有6710 亿参数(激活参数37B)的 DeepSeek-R1 相媲美的性能。

      评论:

      1、Manus 多模态数据处理带来高tokens 消耗

      Manus 可对文本、图像、音频等多模态数据进行综合分析。处理多模态数据需要不同类型的算力资源协同工作,例如处理图像和音频需要专门的图形处理单元(GPU)或数字信号处理器(DSP),文本处理也需要CPU 和GPU 的配合,以实现高效的特征提取、模型推理等操作。

      Manus 对算力需求呈两个数量级提升。Manus 每次回答在 5 分钟左右,会产生巨量的Token。据测算,Manus 单个任务需要的流量是100k Tokens,而传统的GPT 模式下单次对话仅需 1k Tokens。

      2、QwQ-32B 有望快速带动中小企业本地化部署QwQ-32B 参数小性能高,部署成本低。QwQ-32B 的成功表明,将强大的基础模型与大规模强化学习相结合,能够在较小的参数规模下实现卓越性能。此外,QwQ-32B 的另外一个亮点是大幅降低了部署使用成本,开发者和企业可以在消费级硬件上轻松将其部署到本地设备中,4 张RTX 4090 显卡即可实现QwQ-32B本地化部署。

      QwQ-32B VS DeepSeek:

      1)尽管DeepSeek-R1 拥有6710 亿的巨型参数量,但由于DeepSeek 创新性地使用了MoE(混合专家模型)架构以及MLA(多头潜在注意力机制)的方法,每次推理仅激活370 亿参数(占总量的5.5%)。

      2)应用场景:QwQ-32B 在实时性要求高的场景(如客服对话、网络梗生成)和长文本处理(法律合同审查、小说续写)中表现突出,而 DeepSeek-R1 更偏向科研、工业级系统的深度推理任务。

      3)使用客群:QwQ-32B 吸引中小企业和个人开发者,而 DeepSeek-R1 仍主导高端科研机构与资源充足的大型企业。

      3、国产大模型推动AI 爆发,国家算力集群节点重点关注自全国一体化算力网络国家枢纽节点(甘肃)庆阳数据中心集群21 年12 月批复建设以来,庆阳充分依托独特的地理区位优势、可再生资源禀赋及政策红利,以数字产业的闭环带动算力规模的持续扩大。

      1)国内半数人工智能头部企业落户庆阳

      月之暗面、阶跃星辰、百度等大模型企业,燧原、沐曦等芯片企业,金山云、京东、燧弘、亚信等云服务企业落地庆阳,与北上广深等地形成“前店后厂”模式。

      2)打造国家中部算力大通道

      24 年庆阳数据中心集群算力规模从年初5000P 快速突破50000P。根据“庆阳发布”,25 年将继续建设7 个国产万卡集群,到年底实现10 万P 算力,建设全国最大的人工智能算力保障基地和绿色普惠算力保障基地。

      3)庆阳建设推理集群优势分析

      A. 网络资源:到25 年底,“1ms 时延城市算力网、5ms 时延区域算力网、20ms时延跨国家枢纽节点算力网在示范区域内初步实现”建设目标。

      一是构建1-3-8-15 时延圈,启动建设庆阳经兰州、西安、郑州、太原、重庆等地直达东部重点地区的光缆线路工程,着力打造至西安、兰州、西部枢纽节点和东部枢纽节点的1-3-8-15 时延圈。

      二是全光骨干网建设,启动庆阳至重点地区400G 全光骨干传输建设,降低网络传输时延,提升庆阳至重点省市的网络运载能力。

      三是网络一跳直达,建设庆阳至京津冀、长三角、粤港澳、成渝等国内重点地区的直达链路,实现网络一跳直达。

      B. 地理位置:庆阳地处陕甘宁三省交汇,与京津冀、长三角、粤港澳大湾区等主要经济发达地区的距离相对均衡,有利于数据的传输和企业的入驻。

      C. 产业基础:1)国家数据中心集群(甘肃·庆阳)“东数西算”产业园区已建成投运6 个智算中心,10 多个智算中心项目正在建设,3.1 万机架投入运行,算力规模超过5.1 万PFLOPS。2)国内一大半的人工智能头部企业云集庆阳,如中国电信、中国移动、中国联通、中国能建等,形成集聚效应。

      D. 能源资源:1)传统能源丰富:庆阳石油、煤炭等传统能源储量丰富,能够为数据中心提供稳定的能源支撑,保障数据中心持续运行;2)可再生能源充足:当地风能、太阳能资源充足。2024 年,全市新能源发电量达36 亿千瓦时,可满足数据中心绿色用能需求,降低运营成本。

      5)投资建议:

      1、Manus 等多模态模型Tokens 调用量高增,系语言问答大模型后新的AI 大模型模式,后续伴随更多多模态产品出现,有望直接拉动底层算力基础设施需求;同时,互联网及大模型厂商对于“大卡”以租代采,建议关注算力基础设施供应商及配套算力租赁厂商:【润泽科技】、【光环新网】、【奥飞数据】、【海南华铁】、【大位科技】、【盈峰环境】等;

      2、QwQ-32B 等推理模型降低部署成本及端侧应用渗透率,建议关注:【美格智能】、【广和通】、【涂鸦智能】等;

      3、国家中部算力集群-庆阳算力规模持续扩大。24 年庆阳数据中心集群算力规模从年初5000P 快速突破50000P。25 年将继续建设7 个国产万卡集群,到年底实现10 万P 算力。1)庆阳当地部署IDC 及配套供应商持续关注;2)推理集群重点关注和国产卡资源深度绑定的算力服务供应商。建议关注:【中国移动】、【中国电信】、【中国联通】、【弘信电子】(电子组覆盖)、【亚康股份】、【超讯通信】、【奥飞数据】等。

      风险提示:大模型技术发展不及预期,底层算力基础客户上架及订单不及预期。

声明:
  1. 风险提示:以上内容仅来自互联网,文中内容或观点仅作为原作者或者原网站的观点,不代表本站的任何立场,不构成与本站相关的任何投资建议。在作出任何投资决定前,投资者应根据自身情况考虑投资产品相关的风险因素,并于需要时咨询专业投资顾问意见。本站竭力但不能证实上述内容的真实性、准确性和原创性,对此本站不做任何保证和承诺。
  2. 本站认真尊重知识产权及您的合法权益,如发现本站内容或相关标识侵犯了您的权益,请您与我们联系删除。
最新发布
今日焦点