算力周跟踪:AI推理需求走出明显上行趋势 互联网大厂AI大模型建设卓有成效

陈海进/徐巡 2024-08-29 18:47:09
机构研报 2024-08-29 18:47:09 阅读 293

  投资要点:

      本周算力芯片板块和云计算板块出现回调。(1)CPU/GPU 板块:本周(0826-0828)海内外股均有承压,其中英伟达-2.91%,英特尔-4.53%,AMD-5.56%,国产算力链中,龙芯中科-6.89%,寒武纪-5.07%,海光信息-2.02%。(2)云计算板块:除商汤科技+1.82%外,其他标的均出现回调,微软-1.49%,亚马逊-3.52%,Meta -2.13%。

      一、从国内互联网大厂财报看AI 大模型落地

      百度智能云业务营收亮眼,文心大模型日调用量超6 亿次。8 月22 日,百度发布24Q2 财报,财报显示,公司云业务实现营收51 亿元,同比增长14%,其中AI 收入占比9%,环比增长30.43%。云业务增长主要原因在于以千帆平台为代表的一站式企业级大模型平台使用量显著增长。据量子位援引Q2 财报电话会信息,千帆App Builder 构建应用量已超数十万。此外,据IDC 数据,百度智能云大模型平台产品市场份额达到19.9%,位居第一。

      文心大模型热度不减,据量子位援引Q2 财报电话会信息,文心大模型日调用量超过6 亿次,日均处理Tokens 文本超1 万亿,相较23Q4 的5000万次日均调用量,半年增长超10 倍。

      百度“含AI 量”持续提升,持续推进AI 应用落地。(1)百度搜索:

      据Q2 财报电话会,24Q2 由AI 生成的百度搜索结果占比18%,相较于Q1的11%提高7 个百分点。相比谷歌、微软等仅增加“AI 生成内容”的搜索,百使用智能体重构AI 搜索。智能体在百度生态的7 月日均分发量超800 万次,为5 月的两倍。(2)百度文库:在大模型加持之下,百度文库从一款纯粹的“内容工具”转变为“生产力工具”,拥有智能PPT、智能文档等上百项多模态AI 功能。24Q2 百度文库的订阅收入同比增长超15%。目前百度文库累计AI 用户数已突破1.8 亿,AI 功能使用次数已突破22 亿次。(3)文心快码:目前百度80%的工程师已深度使用文心快码,百度30%的代码由文心快码生成。

      阿里云“AI 驱动,公共云优先”显成效。据财报数据,阿里云季度营收增长至265.49 亿元人民币,同比增长6%。其中,AI 相关产品收入实现三位数增长,公共云业务实现两位数增长。财报称,这一增长在于阿里云专注于公共云战略,并提升运营效率。阿里云已获明确认可为中国首选的用于AI 训练和应用的云服务提供商,是在全球同业中唯一获提及来自亚洲的云服务提供者。阿里表示将继续对客户和技术进行投入,尤其是在AI基建方面,以提升AI 领域的云采用量。此前,通义千问GPT-4 级主力模型Qwen-Long 的API 输入价格降至1 元200 万tokens,仅为GPT-4 价格的1/400。降价策略极大激发了阿里云AI 产品的使用量,使得AI 平台(百炼)的付费用户数在短短一个季度内增长超过200%。

      腾讯持续推动AI 与业务结合,包括游戏、元宝、广告等多个板块。

      (1)游戏业务:使用AI 弥合PvE 和PvP 间的差距,通过AI 技术加持,越来越多用户将参与到与机器对战的游戏当中。(2)广告业务:利用AI进行个性化推荐,提升转化率。受益于视频号广告、AI 提效等因素,24Q2广告实现营收299 亿元,同比增长19%。(3)AI 助手元宝:基于腾讯混元模型,腾讯在24Q2 推出AI 助手元宝。元宝允许用户以多种方式与大语言模型进行交互,如增强搜索功能可根据搜索结果为用户提供直接答案。

      (4)协作SaaS 产品:企业微信、腾讯会议和腾讯文档等已全面接入腾讯混元大模型,加速智能化升级。

      “讯飞星火”大模型持续推广落地,赋能公司核心业务增长。科大讯飞在推出“讯飞星火”后,几乎将其应用在了旗下所有业务中。24H1 公司加快了大模型的落地推广力度,大模型对业务增长拉动明显。据公司8 月22 日公布的半年报,24H1 公司实现营收93.25 亿元,同比增长19%。分业务来看,教育产品和服务/医疗业务/开放平台/智能硬件/汽车业务分别实现营收28.60/2.28/23.45/9.00/3.5 亿元,同比增速为25.14%/18.80%/47.92%/56.61%/65.49%。在AI 投入方面,24H1 公司在大模型研发、核心技术自主可控和产业链可控以及大模型产业落地拓展等方面新增投入超6.5 亿元。目前,“讯飞星火”是全民可下载大模型中唯一基于全国产算力训练的大模型技术成果,其APP 在安卓端的下载量已达到1.4 亿次,在国内工具类通用大模型APP 中排名第一。

      二、数据中心算力

      国内最大智算中心将于8 月30 日在哈尔滨投用,建议持续关注国产算力需求释放。中国移动黑龙江公司在哈尔滨智算中心共计部署1.8 万张AI加速卡。该智算中心具有单集群算力规模最大、国产化网络设备组网规模最大、融合分级存储规模最大和国内智能融合分级存储规模最大的特点,可实现集群故障的分钟级定界定位,提供算力6.6EFLOPS,为万亿级模型训练提供高效、稳定的算力底座。

      三、AI 大模型跟踪

      本周Runway 和Midjourney 访问量突破历史新高。据similarweb 最新数据(0816-0822):(1)OpenAI 和Gemini 本周访问量均有所上升。

      8 月21 日,GPT-4o 正式上线微调功能。同日,谷歌更新Gemini,用户可在免费版Gemini 中访问1.5 Flash,响应质量和速度全面提升。(2)豆包自8 月8 日推出一键写歌功能以来,访问量持续攀升。(3)Midjourney本周访问量增量明显。8 月22 日,Midjourney 全面开放网站,附赠25 次免费生成额度。8 月21 日,Ideogram 2.0 版本正式发布,图片生成质量和语义理解能力显著提升,同时支持中文提示。(4)Runway 本周访问量达160 万,突破历史新高。8 月15 日,Runway 发布Gen-3 Alpha Turbo 图像转视频功能,生成效率比Gen-3 Alpha 快7 倍,而价格仅为其一半,带动本周访问量上升。

      传OpenAI “草莓”和猎户座(Orion)模型即将问世。据AIHub 援引The Information 报道,OpenAI 计划最早今年秋季推出“草莓”推理AI 模型。

      “草莓”主要用于解决复杂推理任务,可以解决以前从未见过的数学问题。

      猎户座作为现有旗舰大语言模型GPT-4 的升级版,其预训练数据由草莓模型生成。此外,OpenAI 正考虑将“草莓”的精简版本以聊天机器人的形态推向市场,以帮助降低成本。

      浪潮源2.0-M32 大模型量化版性能比肩LLaMA3-70B,Meta 相继推出Imagine Yourself &Sapiens 大模型。(1)浪潮源2.0-M32 大模型量化版:8 月22 日,浪潮信息发布源2.0-M32 大模型4bit 和8bit 量化版,4bit量化版推理运行显存仅需23.27GB,处理每token 所需算力约1.9 GFLOPs,算力消耗仅为同等当量大模型LLaMA3-70 的1/80。(2)AI 图像模型ImagineYourself:8 月23 日,Meta 发布Imagine Yourself 模型,无需为特定对象进行微调,在个性化图像生成领域取得突破。(3)AI 视觉模型Sapiens:8月24 日,Meta 推出AI 视觉模型Sapiens,该模型专注于解决包括二维姿态估计、人体部位划分、深度感知及表面法向量预测四大应用领域相关视觉任务。其模型参数规模覆盖3 亿至20 亿区间,具备原生1K 高分辨率推理能力。

      建议关注

      国产算力链:寒武纪、海光信息、龙芯中科、盛科通信等。

      数据中心硬件:中际旭创、工业富联、新易盛、天孚通信、沃尔核材、英维克、沪电股份、胜宏科技。

      风险提示

      技术发展及落地不及预期;下游终端出货不及预期;下游需求不及预期;市场竞争加剧风险;地缘政治风险。

声明:
  1. 风险提示:以上内容仅来自互联网,文中内容或观点仅作为原作者或者原网站的观点,不代表本站的任何立场,不构成与本站相关的任何投资建议。在作出任何投资决定前,投资者应根据自身情况考虑投资产品相关的风险因素,并于需要时咨询专业投资顾问意见。本站竭力但不能证实上述内容的真实性、准确性和原创性,对此本站不做任何保证和承诺。
  2. 本站认真尊重知识产权及您的合法权益,如发现本站内容或相关标识侵犯了您的权益,请您与我们联系删除。