传媒:OPENAI O1发布 复杂推理能力大幅提升

姚蕾/丁子然 2024-09-17 11:07:07
机构研报 2024-09-17 11:07:07 阅读

  行业事件

      9 月13 日凌晨,OpenAI 发布新系列模型o1。该系列目前包括已部分开放测试的o1 preview、o1-mini,以及尚未开放的o1 正式版。

      技术层面,有望引领scaling law 新范式

      从2020 年发布相关论文,到后续推出GPT 系列,OpenAI 公司持续执行其核心理念“scaling law”,即随着模型大小、数据集大小等的增加,模型性能会持续提升。

      此前,在已发布的GPT 系列模型中,“scaling law”主要应用于模型的前期预训练环节。而随着o1 新系列模型的公布,OpenAI 团队也同时宣布发现了“新范式”,即scaling law 在预训练之后的环节(强化学习以及测试阶段)的应用。据公司公布的材料,随着强化学习(训练阶段)、思考时间(测试阶段)计算量的提升,o1 模型的性能有望持续提高;且相较于在预训练阶段进行scaling,新方式中模型性能的提升曲线更为陡峭。

      复杂任务处理、数理逻辑能力大幅提升

      从实际表现来看,o1 相较于GPT 等前系列模型,处理复杂问题的能力实现大幅提升,尤其擅长数学、编码等逻辑推理。在OpenAI 内部测试中,该系列后续模型在物理、化学、生物等复杂任务中的表现达到博士生水平。OpenAI 表示,所有专业领域的开发人员可用o1 构建、执行多步骤工作流程,例如可以帮医疗保健研究人员来注释细胞测序数据,助力物理学家生成量子光学所需的复杂数学公式等。

      强化学习赋能“链式思考”,回答精准度显著提升聚焦语言对话场景、快速响应的GPT 系列不同,o1 在响应用户之前会产生较长的“思维链”,通过尝试不同的策略、认识到错误并修正,最终生成精准度更高的答案。在官网示例中,针对用户提出的复杂编程问题,GPT-4o 响应时间短,但得到错误答案;而o1-preview 则会先用自己的理解复述要求,再逐步拆解要求、明确最终目标,接着分析限制条件、选择具体方法、拆解步骤,最后才开始编译代码,并一次性得出正确结果。整体来看,o1 的回答方式更接近于人类面对复杂问题时的分步思维逻辑,响应时长变长,但精准度显著提升。

      投资建议

      我们认为,从应用角度,AI 有望从目前以文字、图片类生成、交互的简单场景,拓展至更为广泛、复杂度更高、容错率更低的应用场景,包括学术科研、工业流程、游戏影视等复杂内容的生产创作等。随着OpenAI 引领的AI 大模型技术持续迭代,AI 应用落地速度也有望加速提升。建议关注:1)AI 模型&应用:昆仑万维、巨人网络、盛天网络、美图公司;2)IP 及内容:三七互娱、恺英网络等。

      风险提示:技术发展缓慢,AI 应用落地缓慢,政策监管趋严的风险。

声明:
  1. 风险提示:以上内容仅来自互联网,文中内容或观点仅作为原作者或者原网站的观点,不代表本站的任何立场,不构成与本站相关的任何投资建议。在作出任何投资决定前,投资者应根据自身情况考虑投资产品相关的风险因素,并于需要时咨询专业投资顾问意见。本站竭力但不能证实上述内容的真实性、准确性和原创性,对此本站不做任何保证和承诺。
  2. 本站认真尊重知识产权及您的合法权益,如发现本站内容或相关标识侵犯了您的权益,请您与我们联系删除。