软件与服务点评报告:英伟达发布桌面端AI超算 或重塑端侧推理范式

证券之星 2025-01-11 09:11:50
股市要闻 2025-01-11 09:11:50 阅读

事件描述

    北京时间1 月7 日,国际消费电子展(CES 2025)开幕前夕,英伟达创始人兼CEO 黄仁勋发表主题演讲,发布Project Digits 桌面端AI 超算硬件。Project Digits 整体只有一本字典大小,可使用标准家用电源插座供电。Project Digits 能让全世界开发者能够在自己的办公桌上,运行超大规模的AI 模型,补充了现有的云计算资源,极大地降低了端侧AI 落地的算力门槛。ProjectDigits 将于今年五月正式推出,起售价为3000 美元。

    事件评论

    Project Digits 允许用户在端侧运行LLaMA 3 级别的大模型。Project Digits 桌面级系统可以处理高达2000 亿参数的AI 模型;同时,对于需要更强大算力的应用,用户可以通过ConnectX 网络芯片将2 台Project Digits 超级计算机互联,获得足以处理高达4050亿参数模型的性能,在本地运行LLaMA 3.1 405B 模型。

    英伟达为Project Digits 完善了生态适配,降低了使用门槛。Project Digits 预装了NvidiaDGX 基础操作系统(基于Ubuntu Linux)和Nvidia AI 软件栈,为开发者提供了一个开箱即用的AI 开发环境。英伟达还为Project Digits 用户提供了各种AI 软件,包括开发工具包、编排工具,以及通过英伟达NGC 目录提供的预训练模型,并支持PyTorch、Python和 Jupyter 等主流框架。用户可以在Project Digits 上本地开发和测试AI 模型,然后使用相同的Grace Blackwell 架构和Nvidia AI Enterprise 软件平台将其部署到云服务或数据中心基础设施。

    Project Digits 的核心是新一代GB10 芯片。GB10 芯片基于Grace Blackwell 架构,在FP4 精度下可以提供1 PFlops 的AI 性能。在CPU 部分,Project Digits 采用英伟达自家的Grace CPU,采用定制20 核心ARM 架构。在信息传输方面,GB10 通过 NVLink-C2C芯片到芯片互连连接到高性能Grace CPU。在存储方面,每台系统配备了128GB 的统一内存以及高达4TB 的NVMe 存储空间。

    Project Digits 有望重塑端侧AI 推理范式。随着AI 应用的陆续落地,端侧算力需求在持续增长,因此算力已成为端侧AI 落地的核心瓶颈。为解决问题,AI 应用厂商一方面蒸馏端侧模型,降低端侧模型参数量;一方面把部分推理需求传导至云端。本次Project Digits推出有望颠覆端侧AI 推理范式,重塑端侧AI 落地思路。

    投资建议:国内AI 应用有望在2025 年大规模落地。在上游基础设施层面,建议关注推理侧算力芯片标的寒武纪;建议关注AI 基础模型相关厂商进展。在下游产品层面,建议关注AI 眼镜主机厂,以及上游端侧模型、芯片、镜片相关产业链。建议关注AIPC 落地节奏和上游芯片相关产业链;建议关注具身智能技术进展,运控相关标的,以及异构芯片、传感器相关标的。

    风险提示

    1、端侧 AI 技术推进不及预期;

    2、端侧 AI 产品下游需求不及预期。

声明:
  1. 风险提示:以上内容仅来自互联网,文中内容或观点仅作为原作者或者原网站的观点,不代表本站的任何立场,不构成与本站相关的任何投资建议。在作出任何投资决定前,投资者应根据自身情况考虑投资产品相关的风险因素,并于需要时咨询专业投资顾问意见。本站竭力但不能证实上述内容的真实性、准确性和原创性,对此本站不做任何保证和承诺。
  2. 本站认真尊重知识产权及您的合法权益,如发现本站内容或相关标识侵犯了您的权益,请您与我们联系删除。
最新发布
今日焦点