计算机行业周报:英伟达推出全新CPU和GPUAI处理器 IDEA研究院发布通用视觉大模型DINO-X
算力:算力租赁价格平稳,英伟达推出全新 CPU和 GPU AI 处理器
Nvidia 发布了两款产品:具有两个 Grace CPU 的四通道B200 GPU 模块——GB200 NVL4,以及针对风冷数据中心的H200 NVL PCIe GPU。具体介绍如下:
1 ) GB200 Grace Blackwell NVL4 超级芯片是标准( 非NVL4 ) 双 GPU 变体的更有效的变体, 具有多达四个与NVLink 相连的 B200 Blackwell GPU 和两个基于 Grace ARM的 CPU,全部位于一个主板上。该解决方案针对 HPC 和 AI混合工作负载,具有高达 1.3TB 的一致性内存。Nvidia 宣传 GB200 NVL4 的模拟性能是 Nvidia GH200 NVL4 的 2.2倍,训练是 1.8 倍,推理性能是 Nvidia GH200 NVL4 的1.8 倍,是其直接前身。英伟达表示,GB200 NVL4 超级芯片将于 2024 年下半年从各种供应商处提供,例如微星、华硕、技嘉、纬创资通、和硕、华擎机架、联想、惠普企业等。
2)H200 NVL 是一款双插槽风冷 GPU,具有 PCIe 5.0 连接(128 GB/s)。该冷却器针对机架安装解决方案进行了优化,采用流通式设计,其中进气从右向左流动;没有鼓风机式风扇。其性能比 Nvidia 即将推出的 SXM 外形尺寸的 H200略差。H200 NVL 的额定 FP64 为 30 TFLOPS,FP32 的额定值为 60 TFLOPS。Tensor 核心性能的额定值为 FP64 的 60TFLOPS、TF32 的 835 TFLOPS、BFLOAT16 的 1671 TFLOPS、FP16 的 1671 TFLOPS 、FP8 的 3341 TFLOPS 和 INT8 的3341 TFLOP。但Nvidia 表示 H200 NVL 比它所取代的 H100NVL 快得多。它具有 1.5 倍的内存容量和 1.2 倍的内存带宽,为 HPC 工作负载提供高达 1.7 倍的推理性能和 1.3 倍的性能。Nvidia 还快速与 Ampere 进行了比较,指出 H200NVL 比 Ampere 的同等 GPU 快 2.5 倍。
IDEA 研究院发布通用视觉大模型DINO-X
IDEA 研究院发布最新成果通用视觉大模型DINO-X。它实现视觉任务大一统,支持各种开发世界感知和目标理解任务,包括开放世界对象检测与分割、短语定位、视觉提示计数、姿态估计、无提示对象检测与识别、密集区域字幕等。这背后得益于,他们构建了超过一亿高质量样本的大型数据集Grounding-100M。与之前DINO 家族中Grounding DINO 1.5类似,DINO-X 也分为DINO-X Pro 模型和DINO-X Edge 模型。前者可为各种场景提供更强的感知能力,后者经过优化,推理速度更快,更适合部署在边缘设备上。
实验结果表明,DINO-X Pro 模型在 COCO、LVIS-minival 和LVIS-val 零镜头物体检测基准测试中分别获得了 56.0 AP、59.8 AP 和 52.4 AP 的成绩。尤其是在 LVIS-minival 和LVIS-val 这两个罕见类别的基准测试中实现新SOTA——分别获得了 63.3 AP 和 56.5 AP 的成绩,都比之前的SOTA 性能提高了 5.8 AP。
DINO-X 的万物识别能力,让其拥有了对开放世界( OpenWorld)的视觉感知,可以轻松应对真实世界中的众多不确定性和开放环境。IDEA 研究院创院理事长沈向洋提到了具身智能、大规模多模态数据的自动标注、视障人士服务等这几个场景。
目前,IDEA 研究院与多家企业联合开展视觉大模型及应用场景的探索研究工作,在视觉大模型的落地方面取得了实质性进展。一方面,有别于市场上的以语言为基础的多模态大模型基于全图理解的方法,通过在物体级别的理解上加入语言模块优化大模型幻觉问题。另一方面结合自研的“视觉提示优化”方法,无需更改模型结构,不用重新训练模型,实现小样本下的场景化定制。
AI 融资动向: xAI 获50 亿美元融资,目前估值达500 亿美元
本期AI 初创公司的融资中,xAI 融资额排名第一,获50 亿美元融资。xAI 成立于2023 年的7 月12 日,虽然成立的时间不长,但xAI 在人工智能领域已有不错的进展,在成立次月的18 日,他们就宣布完成了首个旗舰模型Grok-0 的训练,有330 亿参数;两个多月后的11 月3 日,他们宣布了Grok-1 模型;在今年的3 月17 日,他们宣布将Grok-1 的权重和架构开源;3 月28 日宣布的Grok-1.5 模型,增加了长文本能力;4 月12 日推出的Grok-1.5V,则是增加了视觉能力,可以根据交错的自然语言和图像进行推理;而在今年8月15 日,他们推出了推理能力更强的大语言模型Grok-2,更小但能力不俗的Grok-2 mini 也在当天一并推出,Grok-2和Grok-2 mini 在测试中的部分能力,超过了Anthropic 旗下的Claude 3.5 Sonnet 和OpenAI 旗下的GPT-4 Turbo。
xAI 截至今年已打造有10 万块英伟达H100 的算力集群,是当前全球最大的AI 训练系统。
投资建议
海外应用侧最重要场景已具雏形,国内政策持续支持。海外方面,当地时间11 月19 日,在“Microsoft ignite 2024”全球开发者大会上,围绕AI Agent/AI 智能体,微软更新了多款AI 产品。微软的目的在于建立完善的AI 智能体生态,自推出以来,该生态联盟已有超过10 万家组织通过其Copilot Studio 创建或编辑过AI 助理。国内方面,近日,人工智能辅助诊断首次被列入价格构成。国家医保局分析人工智能潜在的应用场景,在放射检查、超声检查、康复类项目中设立“人工智能辅助”扩展项,即同样的价格水平下,医院可以选择培养医务人员进行诊疗,也可以选择使用人工智能参与诊疗行为,但现阶段不重复收费。预计该政策将大幅加快人工智能辅助技术进入临床应用速度。
我们坚定持续看好AI 软硬件机会,建议关注以AI 为核心的龙头厂商科大讯飞(002230.SZ)、有望迎来需求爆发的AI应用金桥信息(603918.SH)、高速通信连接器业务或显著受益于 GB200 放量的鼎通科技(688668.SH)。
风险提示
1)AI 底层技术迭代速度不及预期。2)政策监管及版权风险。3)AI 应用落地效果不及预期。4)推荐公司业绩不及预期风险。
声明:
- 风险提示:以上内容仅来自互联网,文中内容或观点仅作为原作者或者原网站的观点,不代表本站的任何立场,不构成与本站相关的任何投资建议。在作出任何投资决定前,投资者应根据自身情况考虑投资产品相关的风险因素,并于需要时咨询专业投资顾问意见。本站竭力但不能证实上述内容的真实性、准确性和原创性,对此本站不做任何保证和承诺。
- 本站认真尊重知识产权及您的合法权益,如发现本站内容或相关标识侵犯了您的权益,请您与我们联系删除。
推荐文章: