计算机行业周报:OPENAI十二日发布会点燃AI应用
OpenAI 为期12 天发布会正在举行,预计新版模型、智能体应用或为重要方向。
12 月5 日,OpenAI CEO San Altman 在X 平台宣布,自12 月6 日太平洋时间上午10 点开始,OpenAI 将启动为期12 天的活动。在每一个工作日将进行直播,展示一些新发布的内容或演示。
满血o1 亮相Day1 发布会,推理速度更强更快且支持多模态。1)在多项基准测试中,满血o1 性能直接暴涨,在数学、代码、博士级别科学问题中,拿下了最优的成绩。相较于o1-preview,o1 数学性能提升了近30%,代码能力提升了27%;o1 在GPQA Diamond 基准测试中,表现完全超越了人类专家。2)响应速度更快,更智能地思考。对于日常简单问题能快速回应,而在面对复杂的数学和编程问题时则会投入更多时间深度分析,错误率减少34%,推理速度提升50%。3)支持多模态,满血o1 不仅能理解图像,还可以结合文本进行联合推理。目前,Plus 和Team用户即可使用o1,企业版和教育版用户预计将在一周后获得访问权限,o1 未来或支持Web 浏览和文件上传工具以及上线API。
OpenAI 推出ChatGPT Pro,每月定价200 美元,模型性能更佳且无限制访问。
OpenAI 在12 月6 日上线了ChatGPT Pro 订阅计划,售价$200/月。提供对OpenAI 全部模型和工具的扩展访问,包括o1、o1-mini、GPT-4o 和高级语音模式的无限制使用(Plus 用户用o1 还是50 条消息/周),同时新增了专属的o1 pro 模型,允许用户调用更多算力来解决最困难的问题,能够通过更多的思考时间生成最可靠的答案,未来还将加入更多计算资源支持。与o1 和o1-preview 相比,o1 pro在数据科学、编程和案例分析等领域表现更加出色,且稳定性更高。在数据竞赛(AIME 2024)、竞赛代码(Codeforces)、博士级科学推理问题GPQA Diamond测试中,o1 pro 分别达到86、90、79,而满血o1 分别为78、89、76。同时,OpenAI 采用了严格的"4/4 可靠性"标准(模型连续四次给出正确答案),o1 pro 相较o1 和o1-preview 表现更加,模型准确性和稳定性均有提升。
Day2 面向企业机构和开发者推出强化微调,增强推理能力使得高质量数据可训练出专家助手。12 月7 日,OpenAI 推出了强化微调(Reinforcement Fine-Tuning,RFT),一种新型模型定制技术,能够帮助企业构建高专业性的AI 模型,应对复杂、领域专属的任务。具体来看,不同于传统监督微调(SFT),RFT 专注于教AI 学会推理与解决问题,而非简单地模仿输入数据。借助强化学习,RFT 通过“评估器(graders)”对模型输出进行评分,指导模型优化推理能力,仅需少量示例(约十几个)就能训练出专家级模型。这一过程能够帮助模型掌握复杂问题的处理方法,应对需要高精准度的任务场景,例如法律、医疗和工程领域均可受益于RFT 赋能。
OpenAI 的Alpha 项目已开启,计划在2025 年初正式面向公众推出RFT。
投资建议。我们认为,OpenAI 连续两日发布会都与模型推理相关,满血o1 实现更智能的思考,推理能力大幅提升;强化微调也有望降低定制化AI 的开发门槛,预计连续十二日的开发会将强化AI 应用热潮。建议关注1)AI Agent:金山办公、万兴科技、泛微网络、金蝶国际、福昕软件、彩讯股份、致远互联、鼎捷软件、汉得信息、用友网络、科大讯飞、焦点科技、金证股份、华策影视、中国软件国际;2)AI 多模态:万兴科技、虹软科技、当虹科技、中科创达、大华股份、海康威视、漫步者、萤石网络、汉仪股份、美图公司、云从科技等。
风险提示:技术迭代不及预期、AI 商业化落地不及预期、AI 数据安全问题等。
声明:
- 风险提示:以上内容仅来自互联网,文中内容或观点仅作为原作者或者原网站的观点,不代表本站的任何立场,不构成与本站相关的任何投资建议。在作出任何投资决定前,投资者应根据自身情况考虑投资产品相关的风险因素,并于需要时咨询专业投资顾问意见。本站竭力但不能证实上述内容的真实性、准确性和原创性,对此本站不做任何保证和承诺。
- 本站认真尊重知识产权及您的合法权益,如发现本站内容或相关标识侵犯了您的权益,请您与我们联系删除。
推荐文章: