OPENAI系列追踪DAY3：GPTO3学会看图说话 SCALINGLAWS验证“大算力=大能力”

证券之星 2025-04-18 10:13:16

2025-04-18 10:13:16 阅读

　　事件

    　　2025 年4 月16 日，OpenAI 发布GPTo3 和o4-mini,多项跑分击败Gemini2.5 Pro。GPT-o3 在强化学习中践行ScalingLaw，再次验证“大算力带来大能力”。

    　　点评

    　　OpenAI 表示，o3 是他们目前最强大的推理模型，在编程、数学、科学、视觉感知等多个维度的基准测试中都刷新了SOTA，在分析图像、图表和图形等视觉任务中表现尤为出色。而o4-mini 则是一款专为快速、经济高效的推理而优化的小模型。在专家评估中，o4-mini 在非STEM 任务以及数据科学领域都超过了前代的o3-mini。

    　　值得关注的是：

    　　1）首次实现视觉深度推理，推理路径更接近人类思维方。GPT-o3 不仅支持图文输入，更在多模态任务中引入“视觉推理路径”，能分析图像细节、空间结构乃至手绘笔迹，实现真正意义上的跨模态理解。其在手写板书、图表分析等任务中展现出类人水平的推理能力，是通用人工智能迈出的关键一步。

    　　2）原生工具使用能力，推动智能体应用落地。GPT-o3 具备自动调用浏览器、Python、图像生成、文件解析等工具的能力，无需外部插件或用户提示即可自主判断并触发工具执行任务。这一能力使其在复杂任务处理（如信息检索+图表生成）中表现出极强的自治性，是构建下一代AI Agent 平台的核心能力。

    　　3）成本大幅下降，运行效率优于上一代。尽管推理能力更强，GPT-o3 在执行相同任务时的token 消耗更少，整体运行成本比GPT-o1 更低，展现出出色的计算优化能力。GPT-4o mini 在性能上接近主流高端模型，但API 调用成本仅为每百万输入tokens 0.15 美元，是目前OpenAI 最具性价比的产品。

    　　4）Codex CLI 推动AI 编程助手本地化落地。OpenAI 同步开源由GPT-o3 与GPT-4o mini 驱动的本地编程智能体——Codex CLI。另外，OpenAI 正在洽谈以约 30 亿美元收购 AI 编程工具公司 Windsurf（前身为 Codeium），这将成为其迄今最大规模的并购交易。Windsurf 是一款广受开发者欢迎的 AI 编程助手，能够基于自然语言提示生成代码、解释现有代码并执行相关任务。此次收购若达成，将标志着 OpenAI 在 AI 驱动的开发者工具市场迈出重要一步再次验证Scaling Law，AI 算力投入仍将持续提升。OpenAI 观察到，大规模强化学习同样呈现出与预训练阶段一致的趋势——“更大计算量 = 更好性能”。GPT-o3 正是通过在强化学习中践行Scaling Law，在推理能力、工具调用与交互稳定性等多个维度实现了显著提升。这进一步印证了一个关键假设：模型性能可以随着思考时间和训练资源的投入持续提升。

    　　我们认为，这一发现也强化了此前我们对DeepSeek 等新兴模型的判断——DeepSeek 带来的训练效率提升并不意味着总算力投入减少，反而提升了单位算力的产出回报率，推动需求持续上升。目前GPT-o3 的表现已验证了在RL 阶段延续Scaling Law 的可行性，未来模型训练对高算力的依赖预计将长期维持。另外，推理效率的提升有助于降低单位任务的使用成本，我们预计AI 基础设施建设的投入仍会维持在较高的水平。

    　　风险提示：1）AI 需求不及预期；2）地缘政治环境干扰供应链；3）AI 数据中心建造放缓

说话能力

声明：

风险提示：以上内容仅来自互联网，文中内容或观点仅作为原作者或者原网站的观点，不代表本站的任何立场，不构成与本站相关的任何投资建议。在作出任何投资决定前，投资者应根据自身情况考虑投资产品相关的风险因素，并于需要时咨询专业投资顾问意见。本站竭力但不能证实上述内容的真实性、准确性和原创性，对此本站不做任何保证和承诺。

本站认真尊重知识产权及您的合法权益，如发现本站内容或相关标识侵犯了您的权益，请您与我们联系删除。

OPENAI系列追踪DAY3：GPTO3学会看图说话 SCALINGLAWS验证“大算力=大能力”

推荐文章：

地方政府债供给及交易跟踪：交易5至10年地方债？

OPENAI系列追踪DAY3：GPTO3学会看图说话 SCALINGLAWS验证“大算力=大能力”

北交所定期报告：商务部：将加快出台优化离境退税等政策措施

东航物流(601156)：24盈利小幅提升高关税业绩或承压

经济热力图：基建高频指标改善

经济触角：原油价格今年以来表现疲弱

九阳股份(002242)2024年报点评：内销收入表现稳健盈利有所承压

皖新传媒(601801)：安徽省内出版发行龙头出版产业链布局+数字化创新双轮驱动发展

北交所定期报告：国家统计局：一季度我国国民经济实现良好开局

固定收益点评

固收信用月报：供给监管趋严信用均衡配置

债市基本面高频数据跟踪报告：外贸型行业生产放缓

宏观动态点评：一季度GDP超预期的背后

捷捷微电(300623)：2024年归母净利润同比翻倍看好8寸线产能扩充带动业绩成长

经济触角：原油价格今年以来表现疲弱

建筑与工程：3月基建投资提速实物工作量有所恢复

东航物流(601156)：24盈利小幅提升高关税业绩或承压

军工行业双周报：北斗自主筑基军工国产突围

一季度及 3 月经济数据点评：内需“接力”外需的迹象或已进一步显现

华创农业4月USDA农产品跟踪报告：USDA 上调全球玉米产量预测下调全球大豆产量预测