20万块英伟达芯片练出Grok 3:测试得分均高于竞争对手 运算能力是上代10倍

证券之星 2025-02-19 06:24:29
市场资讯 2025-02-19 06:24:29 阅读


  马斯克说,计划在每次发布新版本时,对上一版本进行开源,也就是说,几个月后Grok 2即将开源。

  xAI工程师介绍,虽然Grok起步较晚,但在MMLU(大规模多任务语言理解基准测试)得分上以超快地速度追上了ChatGPT,Grok 3和轻量化的Grok 3 mini在多方面性能上都超过或媲美Gemini、DeepSeek和GPT-4o等对手。

  据介绍,Grok 3在数学推理、科学逻辑推理和代码写作等项目的Benchmark测试(基准测试)中均取得了比DeepSeek-v3、GPT-4o、Gemini-2 Pro更优的效果。Grok 3分别得分为52、75和57。Grok 3 mini分别得分为40、65和41。这两个模型的得分都高于Gemini、DeepSeek、Claude和GPT。

  工程师说,“大约五天前,AIME2025竞赛结束了,高中生们在一个特定的基准上竞争。然后我们让两个模型在同一场考试中在同一基准上竞争。有趣的是,更大的Grok3推理模型在这场考试中表现更好。这表明,与较小的模型相比,较大的模型具有更强的泛化能力。然而,在去年的考试中,较小的模型表现更好,因为它更有效地学习了以前的考试。”

  在加州大学伯克利分校推出的Chatbot Arena (LMSYS)盲测中,早期版本的Grok 3化名“巧克力”打榜,一举夺魁并成为唯一一个得分超1400的模型,其在代码、指令响应等各个方面排名均为第一。

  据马斯克此前介绍,Grok 3是在大量的合成数据上训练的。它会反复检查数据,试图达到逻辑一致性。如果有错误的数据,它会反思并删除错误数据。

  值得一提的是,有工程师还透露了xAI旗下超算中心算力已经翻倍,英伟达GPU数量已达到20万块。

  据介绍,去年4月,马斯克认为xAI若想成功打造出最佳AI,唯一途径是自建数据中心。由于想尽快推出Grok 3,时间紧迫,于是决定在四个月内建成数据中心。最终,团队耗时122天让第一批10万个GPU启动并运行。

  不过要构建理想中的AI需将集群规模翻倍。发布会上透露,这也是团队首次公开谈论此事,团队仅用92天就已经实现了超算集群的算力翻倍,也就是GPU数量已达20万块。如今,xAI正利用这些强大的计算能力持续改进产品。

  团队还透露,xAI已经开始研究下一个集群,为了能够带动更为强大的AI,其功率将提高约五倍,达到大约1.2千兆瓦。

  现场,马斯克和工程师们演示了Grok 3的多种能力。在演示中,Grok 3为太空发射生成动画3D,以及开发了一款将俄罗斯方块和宝石迷阵结合的游戏。

Grok 3为太空发射生成动画3D

Grok 3开发的游戏

  此外,xAI的游戏工作室也正式得到官宣。马斯克表示,“我们将在xAI推出一个人工智能游戏工作室。如果你有兴趣加入我们并开发人工智能驱动的游戏,请加入我们。”

声明:
  1. 风险提示:以上内容仅来自互联网,文中内容或观点仅作为原作者或者原网站的观点,不代表本站的任何立场,不构成与本站相关的任何投资建议。在作出任何投资决定前,投资者应根据自身情况考虑投资产品相关的风险因素,并于需要时咨询专业投资顾问意见。本站竭力但不能证实上述内容的真实性、准确性和原创性,对此本站不做任何保证和承诺。
  2. 本站认真尊重知识产权及您的合法权益,如发现本站内容或相关标识侵犯了您的权益,请您与我们联系删除。
最新发布
为您推荐