计算机行业投资周报:KIMI发布多模态思考模型K1.5 对标OPENAIO1

证券之星 2025-01-26 09:09:56
股市要闻 2025-01-26 09:09:56 阅读

  Kimi 发布多模态思考模型k1.5。2025 年1 月20 日,Kimi 发布了多模态思考模型k1.5,并且模型性能直接对标OpenAI 满血版o1,在数学、代码、多模态推理能力等方面全方面追平,是OpenAI 之外首个多模态o1 模型。这是继去年11 月他们发布k0-math 数学模型,12 月发布k1 视觉思考模型之后,连续第三个月带来k 系列强化学习模型的升级。根据Kimi 发布的技术报告,在LongCoT 模式下,Kimik1.5 的数学、代码、多模态推理能力,达到了长思考SOTA 模型OpenAIo1 满血版的水平。这也是全球范围内,首次有OpenAI之外的公司达到。而在ShortCoT 模式下,Kimik1.5 大幅领先GPT-4o 和Claude3.5 的水平。

      通过强化学习,实现高效长上下文RL 训练。传统语言模型的预训练依赖“下一个词预测”范式,其性能受限于高质量静态数据的规模。尽管计算资源的扩展遵循Scaling Law,但数据瓶颈日益显著。为此,Kimi 提出通过强化学习(Reinforment Learning,后文简称RL)解锁新维度:模型通过探索生成数据并基于奖励信号优化,突破静态数据限制。Kimi k1.5 的核心目标是通过RL和多模态训练,构建一个兼具长上下文推理能力与高效部署潜力的模型。

      引入Partial rollout 技术,优化复杂推理能力。Kimi 团队在模型训练中引入了“部分展开(Partial Rollout)”技术,该技术有效地提高了训练效率,通过复用训练轨迹(存储在replay buffer 中),减少了计算资源的浪费。每一次训练迭代不仅包括模型的展开和储存,还能在下次迭代中继续利用之前的计算结果,确保效率的同时降低了资源消耗。这样的设计在需要处理长序列任务时,表现尤其突出。特别地,Kimi 团队还在奖励模型中单独加入了代码执行服务,以提升编码领域的任务能力。

      投资建议:建议重点关注基础设施领域的公司,如英伟达、海光信息、寒武纪、协创数据、英维克、中科曙光、浪潮信息、润泽科技、欧陆通、曙光数创、申菱环境、东阳光等,同时持续关注全球各大模型厂商、学界的创新进展。

      风险提示:技术迭代不及预期的风险;商业化落地不及预期的风险;政策支持不及预期风险;全球宏观经济风险。

声明:
  1. 风险提示:以上内容仅来自互联网,文中内容或观点仅作为原作者或者原网站的观点,不代表本站的任何立场,不构成与本站相关的任何投资建议。在作出任何投资决定前,投资者应根据自身情况考虑投资产品相关的风险因素,并于需要时咨询专业投资顾问意见。本站竭力但不能证实上述内容的真实性、准确性和原创性,对此本站不做任何保证和承诺。
  2. 本站认真尊重知识产权及您的合法权益,如发现本站内容或相关标识侵犯了您的权益,请您与我们联系删除。
最新发布
今日焦点