计算机行业周报：英伟达推出全新CPU和GPUAI处理器 IDEA研究院发布通用视觉大模型DINO-X

宝幼琛 2024-11-27 08:03:20

2024-11-27 08:03:20 阅读

　　算力：算力租赁价格平稳，英伟达推出全新 CPU和 GPU AI 处理器

    　　Nvidia 发布了两款产品：具有两个 Grace CPU 的四通道B200 GPU 模块——GB200 NVL4，以及针对风冷数据中心的H200 NVL PCIe GPU。具体介绍如下：

    　　1 ） GB200 Grace Blackwell NVL4 超级芯片是标准（非NVL4 ）双 GPU 变体的更有效的变体，具有多达四个与NVLink 相连的 B200 Blackwell GPU 和两个基于 Grace ARM的 CPU，全部位于一个主板上。该解决方案针对 HPC 和 AI混合工作负载，具有高达 1.3TB 的一致性内存。Nvidia 宣传 GB200 NVL4 的模拟性能是 Nvidia GH200 NVL4 的 2.2倍，训练是 1.8 倍，推理性能是 Nvidia GH200 NVL4 的1.8 倍，是其直接前身。英伟达表示，GB200 NVL4 超级芯片将于 2024 年下半年从各种供应商处提供，例如微星、华硕、技嘉、纬创资通、和硕、华擎机架、联想、惠普企业等。

    　　2）H200 NVL 是一款双插槽风冷 GPU，具有 PCIe 5.0 连接（128 GB/s）。该冷却器针对机架安装解决方案进行了优化，采用流通式设计，其中进气从右向左流动;没有鼓风机式风扇。其性能比 Nvidia 即将推出的 SXM 外形尺寸的 H200略差。H200 NVL 的额定 FP64 为 30 TFLOPS，FP32 的额定值为 60 TFLOPS。Tensor 核心性能的额定值为 FP64 的 60TFLOPS、TF32 的 835 TFLOPS、BFLOAT16 的 1671 TFLOPS、FP16 的 1671 TFLOPS 、FP8 的 3341 TFLOPS 和 INT8 的3341 TFLOP。但Nvidia 表示 H200 NVL 比它所取代的 H100NVL 快得多。它具有 1.5 倍的内存容量和 1.2 倍的内存带宽，为 HPC 工作负载提供高达 1.7 倍的推理性能和 1.3 倍的性能。Nvidia 还快速与 Ampere 进行了比较，指出 H200NVL 比 Ampere 的同等 GPU 快 2.5 倍。

    IDEA 研究院发布通用视觉大模型DINO-X

    　　IDEA 研究院发布最新成果通用视觉大模型DINO-X。它实现视觉任务大一统，支持各种开发世界感知和目标理解任务，包括开放世界对象检测与分割、短语定位、视觉提示计数、姿态估计、无提示对象检测与识别、密集区域字幕等。这背后得益于，他们构建了超过一亿高质量样本的大型数据集Grounding-100M。与之前DINO 家族中Grounding DINO 1.5类似，DINO-X 也分为DINO-X Pro 模型和DINO-X Edge 模型。前者可为各种场景提供更强的感知能力，后者经过优化，推理速度更快，更适合部署在边缘设备上。

    　　实验结果表明，DINO-X Pro 模型在 COCO、LVIS-minival 和LVIS-val 零镜头物体检测基准测试中分别获得了 56.0 AP、59.8 AP 和 52.4 AP 的成绩。尤其是在 LVIS-minival 和LVIS-val 这两个罕见类别的基准测试中实现新SOTA——分别获得了 63.3 AP 和 56.5 AP 的成绩，都比之前的SOTA 性能提高了 5.8 AP。

    　　DINO-X 的万物识别能力，让其拥有了对开放世界（ OpenWorld）的视觉感知，可以轻松应对真实世界中的众多不确定性和开放环境。IDEA 研究院创院理事长沈向洋提到了具身智能、大规模多模态数据的自动标注、视障人士服务等这几个场景。

    　　目前，IDEA 研究院与多家企业联合开展视觉大模型及应用场景的探索研究工作，在视觉大模型的落地方面取得了实质性进展。一方面，有别于市场上的以语言为基础的多模态大模型基于全图理解的方法，通过在物体级别的理解上加入语言模块优化大模型幻觉问题。另一方面结合自研的“视觉提示优化”方法，无需更改模型结构，不用重新训练模型，实现小样本下的场景化定制。

    AI 融资动向: xAI 获50 亿美元融资，目前估值达500 亿美元

    　　本期AI 初创公司的融资中，xAI 融资额排名第一，获50 亿美元融资。xAI 成立于2023 年的7 月12 日，虽然成立的时间不长，但xAI 在人工智能领域已有不错的进展，在成立次月的18 日，他们就宣布完成了首个旗舰模型Grok-0 的训练，有330 亿参数；两个多月后的11 月3 日，他们宣布了Grok-1 模型；在今年的3 月17 日，他们宣布将Grok-1 的权重和架构开源；3 月28 日宣布的Grok-1.5 模型，增加了长文本能力；4 月12 日推出的Grok-1.5V，则是增加了视觉能力，可以根据交错的自然语言和图像进行推理；而在今年8月15 日，他们推出了推理能力更强的大语言模型Grok-2，更小但能力不俗的Grok-2 mini 也在当天一并推出，Grok-2和Grok-2 mini 在测试中的部分能力，超过了Anthropic 旗下的Claude 3.5 Sonnet 和OpenAI 旗下的GPT-4 Turbo。

    　　xAI 截至今年已打造有10 万块英伟达H100 的算力集群，是当前全球最大的AI 训练系统。

    投资建议

    　　海外应用侧最重要场景已具雏形，国内政策持续支持。海外方面，当地时间11 月19 日，在“Microsoft ignite 2024”全球开发者大会上，围绕AI Agent/AI 智能体，微软更新了多款AI 产品。微软的目的在于建立完善的AI 智能体生态，自推出以来，该生态联盟已有超过10 万家组织通过其Copilot Studio 创建或编辑过AI 助理。国内方面，近日，人工智能辅助诊断首次被列入价格构成。国家医保局分析人工智能潜在的应用场景，在放射检查、超声检查、康复类项目中设立“人工智能辅助”扩展项，即同样的价格水平下，医院可以选择培养医务人员进行诊疗，也可以选择使用人工智能参与诊疗行为，但现阶段不重复收费。预计该政策将大幅加快人工智能辅助技术进入临床应用速度。

    　　我们坚定持续看好AI 软硬件机会，建议关注以AI 为核心的龙头厂商科大讯飞（002230.SZ）、有望迎来需求爆发的AI应用金桥信息（603918.SH）、高速通信连接器业务或显著受益于 GB200 放量的鼎通科技（688668.SH）。

    风险提示

    　　1）AI 底层技术迭代速度不及预期。2）政策监管及版权风险。3）AI 应用落地效果不及预期。4）推荐公司业绩不及预期风险。

英伟周报

声明：

风险提示：以上内容仅来自互联网，文中内容或观点仅作为原作者或者原网站的观点，不代表本站的任何立场，不构成与本站相关的任何投资建议。在作出任何投资决定前，投资者应根据自身情况考虑投资产品相关的风险因素，并于需要时咨询专业投资顾问意见。本站竭力但不能证实上述内容的真实性、准确性和原创性，对此本站不做任何保证和承诺。

本站认真尊重知识产权及您的合法权益，如发现本站内容或相关标识侵犯了您的权益，请您与我们联系删除。

计算机行业周报：英伟达推出全新CPU和GPUAI处理器 IDEA研究院发布通用视觉大模型DINO-X

推荐文章：

上港集团: 关于收到中国证监会《关于同意上海国际港务（集团）股份有限公司向专业投资者公开发行公司债券注册的批复》的公告

利亚德: 关于利德转债赎回实施的第七次提示性公告

本钢板材: 本钢板材股份有限公司关于预计触发可转换公司债券转股价格向下修正条件的提示性公告

利元亨: 广东利元亨智能装备股份有限公司关于实施“利元转债”赎回暨摘牌的第十一次提示公告

利元亨: 广东利元亨智能装备股份有限公司关于“利元转债”转股数额累计达到转股前公司已发行股份总额10%的公告

飞凯材料: 关于“飞凯转债”恢复转股的提示性公告

天汽模: 关于汽模转2赎回结果的公告

天汽模: 关于汽模转2摘牌的公告