计算机行业周报:OPENAI O1如何指引未来AI投资

刘高畅 2024-09-17 17:15:13
机构研报 2024-09-17 17:15:13 阅读

  OpenAI 发布o1 模型,数学、代码等领域大幅进步。2024 年9 月12 日,OpenAI 发布新的o1 系列模型,包括OpenAI o1-preview 和OpenAI o1-mini,旨在花更多时间思考后再做出反应。它们可以处理复杂的任务,解决比以前的科学、编码和数学模型更难的问题。OpenAI 在一系列不同的人工考试和ML 基准上的测试表明,在绝大多数推理能力较强的任务中,o1 的表现明显优于GPT-4o。

      强化学习+思维链推理,大模型Scaling Law 开启新范式。与人类在回答难题之前会长时间思考的方式类似,o1 在解决问题时会使用思维链。通过强化学习,o1 学会训练其思维链并改进其使用的策略。随着强化学习的计算量增加和思考时间的增加,o1 的性能会持续提高。此前基于ScalingLaw 的思想,扩大预训练模型大小、数据集大小和训练计算量,就能得到性能更强的模型,但幂律关系在数学上也意味着性能的提升边际回报将会放缓。我们认为o1 成功验证了在后训练和推理阶段提升模型能力的新方向,其技术思路可能被业界其他大模型效仿,成为一种新的重要技术范式。

      算力需求再度强化,模型准确度提升有望促进应用创新。o1 模型在训练端增加了对强化学习的计算量,在推理端增加了模型进行思维链思考的计算量,进一步强化了大模型对算力的需求。o1 系列模型在代码和数学能力方面准确率有较大提升,利好AI 编程、AI 解题等领域应用。同时我们认为AI 应用在各领域的创新进展与大模型在具体领域完成任务的准确度密切相关,例如需要完成长任务的Agent。智能助理很可能是AI 时代的超级应用。

      o1 仍存在局限性,期待GPT-5 准确度全面提升推动产业。o1 目前提升较大的主要在数学、编程等有比较准确评判标准的领域,强化学习应用于其他领域或有一定难度。同时o1 推理侧的思维链运算带来的较慢响应速度也会对应用场景造成限制。目前预训练阶段的Scaling Law 仍然有效,o1 探索出了在后训练和推理阶段能优化部分任务的准确度的方案,这令我们更期待未来的GPT-5 系列模型是否能带来全面的准确度提升。若GPT-的准确度大幅上升,则可以乐观预期AI 应用的创新和落地速度将会大幅加快,如各垂直行业的Copilot,能代替用户进行具体操作的AI Agent 等。

      建议关注

      1)算力侧:寒武纪、中际旭创、新易盛、中科曙光、海光信息、浪潮信息、工业富联、神州数码、软通动力、协创数据、云赛智联、高新发展等。

      2)端侧AI:立讯精密、东山精密、传音控股、鹏鼎控股、中科创达、漫步者。

      风险提示:AI 技术迭代不及预期风险;经济下行超预期风险;行业竞争加剧风险。

声明:
  1. 风险提示:以上内容仅来自互联网,文中内容或观点仅作为原作者或者原网站的观点,不代表本站的任何立场,不构成与本站相关的任何投资建议。在作出任何投资决定前,投资者应根据自身情况考虑投资产品相关的风险因素,并于需要时咨询专业投资顾问意见。本站竭力但不能证实上述内容的真实性、准确性和原创性,对此本站不做任何保证和承诺。
  2. 本站认真尊重知识产权及您的合法权益,如发现本站内容或相关标识侵犯了您的权益,请您与我们联系删除。