OPENAI系列追踪DAY3:GPTO3学会看图说话 SCALINGLAWS验证“大算力=大能力”
事件
2025 年4 月16 日,OpenAI 发布GPTo3 和o4-mini,多项跑分击败Gemini2.5 Pro。GPT-o3 在强化学习中践行ScalingLaw,再次验证“大算力带来大能力”。
点评
OpenAI 表示,o3 是他们目前最强大的推理模型,在编程、数学、科学、视觉感知等多个维度的基准测试中都刷新了SOTA,在分析图像、图表和图形等视觉任务中表现尤为出色。而o4-mini 则是一款专为快速、经济高效的推理而优化的小模型。在专家评估中,o4-mini 在非STEM 任务以及数据科学领域都超过了前代的o3-mini。
值得关注的是:
1)首次实现视觉深度推理,推理路径更接近人类思维方。GPT-o3 不仅支持图文输入,更在多模态任务中引入“视觉推理路径”,能分析图像细节、空间结构乃至手绘笔迹,实现真正意义上的跨模态理解。其在手写板书、图表分析等任务中展现出类人水平的推理能力,是通用人工智能迈出的关键一步。
2)原生工具使用能力,推动智能体应用落地。GPT-o3 具备自动调用浏览器、Python、图像生成、文件解析等工具的能力,无需外部插件或用户提示即可自主判断并触发工具执行任务。这一能力使其在复杂任务处理(如信息检索+图表生成)中表现出极强的自治性,是构建下一代AI Agent 平台的核心能力。
3)成本大幅下降,运行效率优于上一代。尽管推理能力更强,GPT-o3 在执行相同任务时的token 消耗更少,整体运行成本比GPT-o1 更低,展现出出色的计算优化能力。GPT-4o mini 在性能上接近主流高端模型,但API 调用成本仅为每百万输入tokens 0.15 美元,是目前OpenAI 最具性价比的产品。
4)Codex CLI 推动AI 编程助手本地化落地。OpenAI 同步开源由GPT-o3 与GPT-4o mini 驱动的本地编程智能体——Codex CLI。另外,OpenAI 正在洽谈以约 30 亿美元收购 AI 编程工具公司 Windsurf(前身为 Codeium),这将成为其迄今最大规模的并购交易。Windsurf 是一款广受开发者欢迎的 AI 编程助手,能够基于自然语言提示生成代码、解释现有代码并执行相关任务。此次收购若达成,将标志着 OpenAI 在 AI 驱动的开发者工具市场迈出重要一步再次验证Scaling Law,AI 算力投入仍将持续提升。OpenAI 观察到,大规模强化学习同样呈现出与预训练阶段一致的趋势——“更大计算量 = 更好性能”。GPT-o3 正是通过在强化学习中践行Scaling Law,在推理能力、工具调用与交互稳定性等多个维度实现了显著提升。这进一步印证了一个关键假设:模型性能可以随着思考时间和训练资源的投入持续提升。
我们认为,这一发现也强化了此前我们对DeepSeek 等新兴模型的判断——DeepSeek 带来的训练效率提升并不意味着总算力投入减少,反而提升了单位算力的产出回报率,推动需求持续上升。目前GPT-o3 的表现已验证了在RL 阶段延续Scaling Law 的可行性,未来模型训练对高算力的依赖预计将长期维持。另外,推理效率的提升有助于降低单位任务的使用成本,我们预计AI 基础设施建设的投入仍会维持在较高的水平。
风险提示:1)AI 需求不及预期;2)地缘政治环境干扰供应链;3)AI 数据中心建造放缓
声明:
- 风险提示:以上内容仅来自互联网,文中内容或观点仅作为原作者或者原网站的观点,不代表本站的任何立场,不构成与本站相关的任何投资建议。在作出任何投资决定前,投资者应根据自身情况考虑投资产品相关的风险因素,并于需要时咨询专业投资顾问意见。本站竭力但不能证实上述内容的真实性、准确性和原创性,对此本站不做任何保证和承诺。
- 本站认真尊重知识产权及您的合法权益,如发现本站内容或相关标识侵犯了您的权益,请您与我们联系删除。
推荐文章: