传媒：OPENAI O1发布复杂推理能力大幅提升

姚蕾/丁子然 2024-09-17 11:07:07

2024-09-17 11:07:07 阅读

　　行业事件

    　　9 月13 日凌晨，OpenAI 发布新系列模型o1。该系列目前包括已部分开放测试的o1 preview、o1-mini，以及尚未开放的o1 正式版。

    　　技术层面，有望引领scaling law 新范式

    　　从2020 年发布相关论文，到后续推出GPT 系列，OpenAI 公司持续执行其核心理念“scaling law”，即随着模型大小、数据集大小等的增加，模型性能会持续提升。

    　　此前，在已发布的GPT 系列模型中，“scaling law”主要应用于模型的前期预训练环节。而随着o1 新系列模型的公布，OpenAI 团队也同时宣布发现了“新范式”，即scaling law 在预训练之后的环节（强化学习以及测试阶段）的应用。据公司公布的材料，随着强化学习（训练阶段）、思考时间（测试阶段）计算量的提升，o1 模型的性能有望持续提高；且相较于在预训练阶段进行scaling，新方式中模型性能的提升曲线更为陡峭。

    　　复杂任务处理、数理逻辑能力大幅提升

    　　从实际表现来看，o1 相较于GPT 等前系列模型，处理复杂问题的能力实现大幅提升，尤其擅长数学、编码等逻辑推理。在OpenAI 内部测试中，该系列后续模型在物理、化学、生物等复杂任务中的表现达到博士生水平。OpenAI 表示，所有专业领域的开发人员可用o1 构建、执行多步骤工作流程，例如可以帮医疗保健研究人员来注释细胞测序数据，助力物理学家生成量子光学所需的复杂数学公式等。

    　　强化学习赋能“链式思考”，回答精准度显著提升聚焦语言对话场景、快速响应的GPT 系列不同，o1 在响应用户之前会产生较长的“思维链”，通过尝试不同的策略、认识到错误并修正，最终生成精准度更高的答案。在官网示例中，针对用户提出的复杂编程问题，GPT-4o 响应时间短，但得到错误答案；而o1-preview 则会先用自己的理解复述要求，再逐步拆解要求、明确最终目标，接着分析限制条件、选择具体方法、拆解步骤，最后才开始编译代码，并一次性得出正确结果。整体来看，o1 的回答方式更接近于人类面对复杂问题时的分步思维逻辑，响应时长变长，但精准度显著提升。

    　　投资建议

    　　我们认为，从应用角度，AI 有望从目前以文字、图片类生成、交互的简单场景，拓展至更为广泛、复杂度更高、容错率更低的应用场景，包括学术科研、工业流程、游戏影视等复杂内容的生产创作等。随着OpenAI 引领的AI 大模型技术持续迭代，AI 应用落地速度也有望加速提升。建议关注：1）AI 模型&应用：昆仑万维、巨人网络、盛天网络、美图公司；2）IP 及内容：三七互娱、恺英网络等。

    　　风险提示：技术发展缓慢，AI 应用落地缓慢，政策监管趋严的风险。

大幅能力

声明：

风险提示：以上内容仅来自互联网，文中内容或观点仅作为原作者或者原网站的观点，不代表本站的任何立场，不构成与本站相关的任何投资建议。在作出任何投资决定前，投资者应根据自身情况考虑投资产品相关的风险因素，并于需要时咨询专业投资顾问意见。本站竭力但不能证实上述内容的真实性、准确性和原创性，对此本站不做任何保证和承诺。

本站认真尊重知识产权及您的合法权益，如发现本站内容或相关标识侵犯了您的权益，请您与我们联系删除。

传媒：OPENAI O1发布复杂推理能力大幅提升

推荐文章：

上港集团: 关于收到中国证监会《关于同意上海国际港务（集团）股份有限公司向专业投资者公开发行公司债券注册的批复》的公告

利亚德: 关于利德转债赎回实施的第七次提示性公告

本钢板材: 本钢板材股份有限公司关于预计触发可转换公司债券转股价格向下修正条件的提示性公告

利元亨: 广东利元亨智能装备股份有限公司关于实施“利元转债”赎回暨摘牌的第十一次提示公告

利元亨: 广东利元亨智能装备股份有限公司关于“利元转债”转股数额累计达到转股前公司已发行股份总额10%的公告

飞凯材料: 关于“飞凯转债”恢复转股的提示性公告

天汽模: 关于汽模转2赎回结果的公告

天汽模: 关于汽模转2摘牌的公告

传媒：OPENAI O1发布 复杂推理能力大幅提升

传媒：OPENAI O1发布复杂推理能力大幅提升