计算机行业快报:GROK 3正式发布 头部模型推理性能进一步提升
事件描述:
2 月18 日,Grok 3(Beta 版)正式发布,并面向X 的Premium Plus 订阅用户率先开放,同时推出了每月30 美元或每年300 美元的Super Grok 单独订阅服务,订阅用户可解锁深度搜索等先进功能,而语音交互功能将在约一周后上线。
事件点评:
Grok 3 和Grok 3 mini 在多方面性能上均超过或媲美Gemini、DeepSeek和ChatGPT 等对手。根据官方公布的测试数据,Grok 3 和Grok 3 mini 在数学推理(AIME)、科学逻辑推理(GPQA)和代码写作(LCB)的基准测试上性能表现优于DeepSeek V3、GPT-4o、Gemini 2 Pro 及Claude 3.5 Sonnet,其中,Grok 3 性能较DeepSeek V3 提升了27%-43%。而在推理能力测试中,Grok 3 和Grok 3 mini 推理模型的性能再次刷新了sota,其中,相较于DeepSeek R1,Grok 3 的性能表现提升了16%-22%。
得益于思维链推理能力的引入,Grok 3 在解决复杂任务方面的表现较为突出。Grok 3 在发布会的演示上完成了多个复杂任务,包括正确编码并实现飞船从地球发射、登陆火星、到在下一个发射窗口返回地球的3D 动画,其中Grok 3 经过114 秒的思考成功求解了开普勒定律,以及Grok 3 融合俄罗斯方块和宝石迷阵的规则成功创作出新游戏。可以预计,未来Grok 3 有望在医疗诊断、法律分析等复杂推理场景中得到深度应用。
Grok 3 总训练成本预计高达DeepSeek V3 模型的数倍乃至数百倍。xAI公司为Grok 3 配备了拥有20 万个H100 GPU 的Colossus 超级计算机进行训练,Grok 3 累计训练时长达2 亿GPU 小时,根据vast ai 最新数据,H100 租赁价格大约在1-3 美元每GPU 小时,因此估算Grok 3 的训练成本预计可达数亿美元,而DeepSeek V3 论文中披露的模型正式训练阶段的成本仅557.6万美元。虽然Grok 3 的发布预示着预训练阶段的Scaling Law 仍在推动大模型的持续进步,但相较于DeepSeek,可以明显看出大模型在算法层面具备更大的进步空间。
投资建议:Grok 3 推理能力大幅提升将加速AI 应用落地,重点关注AI 应用相关标的:1)AI+企业服务:金蝶国际、泛微网络、致远互联,用友网络等;2)AI+办公:金山办公、福昕软件等;3)多模态:万兴科技、美图公司等;4)AI+金融:新致软件、同花顺等;5)AI+教育:科大讯飞、佳发教育等;6)AI+医疗:润达医疗、卫宁健康等;7)其他:彩讯股份、金桥信息、焦点科技等。同时,应用快速落地也将刺激推理算力需求,重点关注AI 算力相关标的:1)国产算力芯片:海光信息、寒武纪等;2)服务器/一体机:四川长虹、神州数码、拓维信息、浪潮信息、中科曙光、华勤技术、云从科技等;3)算力租赁:青云科技、优刻得、并行科技等。
风险提示:AI 产品落地不及预期,行业竞争加剧风险,技术研发进展不及预期。
声明:
- 风险提示:以上内容仅来自互联网,文中内容或观点仅作为原作者或者原网站的观点,不代表本站的任何立场,不构成与本站相关的任何投资建议。在作出任何投资决定前,投资者应根据自身情况考虑投资产品相关的风险因素,并于需要时咨询专业投资顾问意见。本站竭力但不能证实上述内容的真实性、准确性和原创性,对此本站不做任何保证和承诺。
- 本站认真尊重知识产权及您的合法权益,如发现本站内容或相关标识侵犯了您的权益,请您与我们联系删除。
推荐文章: