20万块英伟达芯片练出Grok 3：测试得分均高于竞争对手运算能力是上代10倍

证券之星 2025-02-19 06:24:29

2025-02-19 06:24:29 阅读

　　马斯克说，计划在每次发布新版本时，对上一版本进行开源，也就是说，几个月后Grok 2即将开源。

　　xAI工程师介绍，虽然Grok起步较晚，但在MMLU（大规模多任务语言理解基准测试）得分上以超快地速度追上了ChatGPT，Grok 3和轻量化的Grok 3 mini在多方面性能上都超过或媲美Gemini、DeepSeek和GPT-4o等对手。

　　据介绍，Grok 3在数学推理、科学逻辑推理和代码写作等项目的Benchmark测试（基准测试）中均取得了比DeepSeek-v3、GPT-4o、Gemini-2 Pro更优的效果。Grok 3分别得分为52、75和57。Grok 3 mini分别得分为40、65和41。这两个模型的得分都高于Gemini、DeepSeek、Claude和GPT。

　　工程师说，“大约五天前，AIME2025竞赛结束了，高中生们在一个特定的基准上竞争。然后我们让两个模型在同一场考试中在同一基准上竞争。有趣的是，更大的Grok3推理模型在这场考试中表现更好。这表明，与较小的模型相比，较大的模型具有更强的泛化能力。然而，在去年的考试中，较小的模型表现更好，因为它更有效地学习了以前的考试。”

　　在加州大学伯克利分校推出的Chatbot Arena (LMSYS)盲测中，早期版本的Grok 3化名“巧克力”打榜，一举夺魁并成为唯一一个得分超1400的模型，其在代码、指令响应等各个方面排名均为第一。

　　据马斯克此前介绍，Grok 3是在大量的合成数据上训练的。它会反复检查数据，试图达到逻辑一致性。如果有错误的数据，它会反思并删除错误数据。

　　值得一提的是，有工程师还透露了xAI旗下超算中心算力已经翻倍，英伟达GPU数量已达到20万块。

　　据介绍，去年4月，马斯克认为xAI若想成功打造出最佳AI，唯一途径是自建数据中心。由于想尽快推出Grok 3，时间紧迫，于是决定在四个月内建成数据中心。最终，团队耗时122天让第一批10万个GPU启动并运行。

　　不过要构建理想中的AI需将集群规模翻倍。发布会上透露，这也是团队首次公开谈论此事，团队仅用92天就已经实现了超算集群的算力翻倍，也就是GPU数量已达20万块。如今，xAI正利用这些强大的计算能力持续改进产品。

　　团队还透露，xAI已经开始研究下一个集群，为了能够带动更为强大的AI，其功率将提高约五倍，达到大约1.2千兆瓦。

　　现场，马斯克和工程师们演示了Grok 3的多种能力。在演示中，Grok 3为太空发射生成动画3D，以及开发了一款将俄罗斯方块和宝石迷阵结合的游戏。

Grok 3为太空发射生成动画3D

Grok 3开发的游戏

　　此外，xAI的游戏工作室也正式得到官宣。马斯克表示，“我们将在xAI推出一个人工智能游戏工作室。如果你有兴趣加入我们并开发人工智能驱动的游戏，请加入我们。”

20万块英伟达芯片练出Grok 3：测试得分均高于竞争对手运算能力是上代10倍

声明：

风险提示：以上内容仅来自互联网，文中内容或观点仅作为原作者或者原网站的观点，不代表本站的任何立场，不构成与本站相关的任何投资建议。在作出任何投资决定前，投资者应根据自身情况考虑投资产品相关的风险因素，并于需要时咨询专业投资顾问意见。本站竭力但不能证实上述内容的真实性、准确性和原创性，对此本站不做任何保证和承诺。

本站认真尊重知识产权及您的合法权益，如发现本站内容或相关标识侵犯了您的权益，请您与我们联系删除。

20万块英伟达芯片练出Grok 3：测试得分均高于竞争对手运算能力是上代10倍

推荐文章：

20万块英伟达芯片练出Grok 3：测试得分均高于竞争对手运算能力是上代10倍

马斯克查账“美国社保”声称发现360岁老人这是怎么回事？

华尔街顶级投行：万亿资金或买中国股票

中信建投：腾讯接入DeepSeek 有望带动API调用量增加和本地化部署需求

华泰证券：看好环卫电动化提速带来的业绩增量

中国顶流私募曝光“美股成绩单”：减持阿里、拼多多中概股仍占半壁江山

比互联网泡沫还严重？美银：“新经济”泡沫戳破恐导致标普暴跌40%

争夺人机交互标准制定权多厂商宣布大模型免费开放使用

美股最强50——Meta：两年翻10倍的秘密

腾讯创三年多新高！百度大跌！阿里巴巴高位回调

【业绩会直击】百度：第四季度营收341亿元超出预期

马斯克查账“美国社保”声称发现360岁老人这是怎么回事？

华泰证券：科技引领下中国资产重估有望迈入新阶段

马斯克重大宣布！就在本周二发布“地球上最聪明的AI”

八部门印发《新型储能制造业高质量发展行动方案》

华为确认L3级自动驾驶今年将逐步开启商用化极氪、岚图等竞相布局

中信证券：多云共推Agent落地继续看好两条主线

银河证券：全球AI+行业应用、端侧AI预计将迎来新一轮繁荣期

高盛最新发声！人工智能或为中国股市吸引2000亿美元净流入

美俄谈判即将来袭！俄外长摆出强硬姿态：绝不可能放弃领土

国泰君安：腾讯全面接入DeepSeek 未来或将实现全民AI普及

比互联网泡沫还严重？美银：“新经济”泡沫戳破恐导致标普暴跌40%

20万块英伟达芯片练出Grok 3：测试得分均高于竞争对手 运算能力是上代10倍

20万块英伟达芯片练出Grok 3：测试得分均高于竞争对手运算能力是上代10倍