英伟达跌超3%!黄仁勋GTC演讲来了:Blackwell芯片全面投产 下一代Rubin将于2026年推出

证券之星 2025-03-20 09:36:14
市场资讯 2025-03-20 09:36:14 阅读 291

  将迎来代理式AI时代

  黄仁勋介绍了AI研发的发展历程,从最初的意识AI(Perception AI),到现在的生成式AI(Generative AI),他预计我们将进入代理式AI(Agentic AI)的时代,接下来将是物理AI(Physical AI)、也就是机器人的时代。

图片来源:视频截图

  黄仁勋说,现在我们正在了解如何扩展AI,未来必须关注训练和扩展构建的AI模型。他介绍AI的扩展定律(scaling law)发展演化,从预训练扩展、训练后扩展到测试时间扩展,即“长思维”。

  英伟达周二当天发布针对开发者和企业的开源AI模型系列,帮助他们打造Agentic AI平台,并针对企业发布Blackwell Ultra DGX SuperPOD。

  黄仁勋表示,Blackwell芯片推出一年来,AI行业取得了巨大进展,AI功能越来越强大了。2024年全球前四云服务提供商共采购130万片Hopper架构芯片。2025年,它们又购买了360万Blackwell芯片。预计到2028年数据中心建设支出将达1万亿美元。

图片来源:视频截图

  黄仁勋展示了英伟达简化加速平台处理与数据和AI等领域采用的CUDA-X库,称AI加速服务于多种行业各行各业都可应用CUDA-X库,称这只是实现加速计算的库的一小部分。

  黄仁勋预测,每家公司未来都将有两个工厂,一是用于生产产品,另一个用于AI数学。黄仁勋称,AI将进入所有行业。

图片来源:视频截图

  黄仁勋还宣布,英伟达将扩大与通用汽车的合作。通用汽车将运用英伟达的技术帮助开发自动驾驶汽车,用英伟达的技术训练AI制造模型。

  英伟达推出了专注于汽车安全的AI解决方案,名为英伟达Halos。黄仁勋说:“我相信,我们是世界上第一家对每一行代码都进行安全评估的公司。”

图片来源:视频截图

  黄仁勋还宣布,英伟达将与思科和T-Mobile等公司合作,研究和开发用于下一代无线网络6G的AI原生网络。

  黄仁勋宣布英伟达周二发布两款AI电脑,分别名为DGX Spark和DGX Station,称它们是“AI时代的计算机”。这两款电脑都使用Blackwell架构的芯片。DGX Spark采用GB10 Grace Blackwell超级芯片,外形类似Mac-Mini。DGX Station体积更大,由GB300 Grace Blackwell Ultra Desktop芯片驱动。

  Blackwell架构全面投产

  谈到数据中心,黄仁勋称,Blackwell架构的芯片已经全面投产,“客户需求令人难以置信。”

  他再次展示了今年1月CES上他演示的超级芯片Grace Blackwell NVLink 72。它在一个晶圆上集成了72个Blackwell GPU,并且有18个NVLink Switch,实现4位浮点数FP4上1.4 EFLOPS的计算性能。

  英伟达推出号称未来“AI工厂操作系统”的新开源软件Dynamo。它是一个“分布式推理服务库”,基本上是一个开源解决方案,用于解决无法提供足够用户所需token的问题。微软和Perplexity是Dynamo的首批合作伙伴。

图片来源:视频截图

  黄仁勋展示了Blackwell架构如何超越Hopper超级计算机。用Grace Blackwell NVLink72芯片搭载Dynamo,Blackwell架构相比Hopper架构可将性能提升25倍。“在推理模型中,Blackwell的性能是Hopper的40倍。”

图片来源:视频截图

  黄仁勋开玩笑说,Hopper足以胜任一些任务,而出了Blackwell,“我是破坏收入的头子。”有了Blackwell等最新技术加持,搭建AI工厂的厂商“无论如何,你买得越多,就省得越多。”

  下一代Vera Rubin一年后出货

  黄仁勋宣布英伟达芯片新品的消息,Blackwell系列的新品Blackwell Ultra NVL72平台将于今年下半年出货,它的带宽是前代GB200的两倍,内存速度是前代的1.5倍。Blackwell Ultra有两个版本,一是基于Arm设计的CPU,名为GB300,另一个是名为B300的GPU。

  英伟达称,Blackwell Ultra平台为AI推理时代铺路。GB300 NVL72采用机架级设计,连接72块Blackwell Ultra GPU。相比Hopper架构,B300 NVL16在大语言模型(LLM)上的推理速度提高了11倍,计算能力提高了7倍,内存增加了4倍,可为AI推理等最复杂的工作负载提供突破性的性能。

  黄仁勋还公布了Blackwell之后下一代GPU架构Rubin AI数据中心芯片的计划面世时间。

图片来源:视频截图

  英伟达预计,名为Vera Rubin的平台将于2026年下半年开始出货,它得到NVLink 144技术加持,包括名为Vera的英伟达首款定制CPU设计和名为Rubin的GPU设计。Vera Rubin NVLink 144的性能将是GB300 NVL 72的3.3倍。

  相比三年前英伟达在GTC大会首次发布的前代Grace CPU,Vera芯片的性能提高一倍。Vera基于Olympus核心设计,Vera设计的速度将是去年采用Blackwell架构CPU的两倍。

  Rubin在进行推理时可以达到每秒50千万亿次浮点运算(petaflops)的速度,比当前Blackwell芯片每秒20 petaflops的速度高出一倍多。Rubin还可以支持高达288 GB的快速内存。Rubin实际上是两块GPU,从Rubin开始,英伟达会将两个或多个芯片组合成一个芯片,将它们成为一个单独的GPU。

  Vera Rubin之后,英伟达预计,下一代Rubin Ultra NVL576将于2027年下半年推出,其性能将是GB 300 NVL72的14倍。

图片来源:视频截图

  黄仁勋称,Rubin之后的下一代架构名为Feynman,名门来自著名物理学家理查德·费曼,该架构将于2028年亮相。

  英伟达推出Isaac GR00T N1

  黄仁勋高度评价机器人市场的潜力,称它“很可能是最大的产业。”

  英伟达宣布推出通用的机器人基础模型GR00T N1,它是全球首款开源的人形机器人功能模型。

  黄仁勋透露,英伟达与谷歌的DeepMind和迪士尼在合作开发机器人模拟用的开源、可扩展物理引擎,名为Newton,预计今年晚些时候完成开发。英伟达称,Newton旨在推动机器人的学习和发展。

图片来源:视频截图

  黄仁勋演讲的现场出现了一部英伟达、谷歌与迪士尼合作研发的机器人,名为Blue,由英伟达最新的GR00T N1模型加持。

  英伟达称,在研发受《星球大战》电影启发的BDX机器人。迪士尼将成为首批使用Newton改进其机器人角色平台的公司之一,该平台为下一代娱乐机器人提供动力。黄仁勋表示:“通用机器人时代已经到来。借助英伟达Isaac GR00T N1和新的数据生成以及机器人学习框架,世界各地的机器人开发人员将开辟AI时代的下一个前沿。”

声明:
  1. 风险提示:以上内容仅来自互联网,文中内容或观点仅作为原作者或者原网站的观点,不代表本站的任何立场,不构成与本站相关的任何投资建议。在作出任何投资决定前,投资者应根据自身情况考虑投资产品相关的风险因素,并于需要时咨询专业投资顾问意见。本站竭力但不能证实上述内容的真实性、准确性和原创性,对此本站不做任何保证和承诺。
  2. 本站认真尊重知识产权及您的合法权益,如发现本站内容或相关标识侵犯了您的权益,请您与我们联系删除。
最新发布
广告位招租
为您推荐
广告位招租