业界首次!腾讯,重大发布!

证券之星 2025-03-23 09:31:00
基金 2025-03-23 09:31:00 阅读

3月21日深夜,腾讯混元大模型团队正式推出了自研深度思考模型混元T1正式版。该模型具有效果好、速度快的特点,多项指标达到业界领先推理水平,吐字速度达到每秒60—80tokens,在实际生成效果表现中远快于DeepSeek-R1推理模型。

01

能秒回的深度思考模型

目前,用户在使用DeepSeek-R1等推理模型时,由于模型需要进行深度思考,并在提供回答前列出详细的思维链,虽然能够体现较高的智能化水平,但存在响应速度慢、不够高效的短板。

混元T1正式版则致力于解决这一问题,不仅吐字快、能秒回,还擅长超长文处理。在体现推理模型基础能力的常见基准测试上,如大语言模型评估增强数据集MMLU-PRO中,混元T1取得87.2分,超越了DeepSeek-R1,仅次于o1。

值得注意的是,混元T1正式版沿用了混元TurboS的创新架构,采用Hybrid-Mamba-Transformer融合模式。这一架构有效降低了传统Transformer结构的计算复杂度,减少了KV-Cache的内存占用,从而显著降低了训练和推理成本。

这也意味着,腾讯摒弃了传统及主流的纯Transformer架构,首次将混合Mamba架构无损应用于超大型推理模型。

目前,混元T1已在腾讯云官网上线。价格方面,输入价格为1元/每百万tokens,输出价格为4元/每百万tokens,输出价格为DeepSeek标准时段的1/4,与DeepSeek优惠时段一致。

02

腾讯大模型业务动作频频

作为大模型的“后发者”,腾旭今年以来动作频频,不仅快速地将旗下十余款产品接入了DeepSeek,自研的混元模型系列也进入快速迭代期。同时,腾讯也在加大对C端产品元宝的投入,积极抢占大模型用户入口。

腾讯3月19日发布的最新财报显示,腾讯2024年全年实现营收6603亿元,同比增长8%;净利润为1940.7亿元,比上年增长68%。腾讯董事会主席兼首席执行官马化腾在业绩会上表示,在过去一两个月里,AI得到了很大发展,尤其是在DeepSeek横空出世后,腾讯在云业务、“元宝”(AI应用)上都积极拥抱DeepSeek。

据腾讯官方微信号发布,自今年2月来,腾讯元宝接入DeepSeek满血版和全新混元模型,双核驱动元宝高速进化、日更级迭代,35天版本已经更新30次。除此以外,目前腾讯已有元宝、微信、腾讯文档、QQ浏览器、QQ音乐、微信读书等数十款产品及业务接入DeepSeek。

业内人士分析,作为拥有强大生态和用户基础的公司,腾讯如今通过走混元模型+DeepSeek模型结合的路径,致力于在AI应用领域构建起自身的竞争优势。

马化腾在业绩会上还表示:“数月前,我们重组了AI团队以聚焦于快速的产品创新及深度的模型研发,增加了AI相关的资本开支,并加大了我们对原生AI产品的研发和营销力度。我们相信这些增加的投资,会通过提升广告业务的效率及游戏的生命周期而带来持续的回报,并随着我们个人AI应用的加速普及和更多企业采用我们的AI服务,创造更长远的价值。”

财报显示,2024年第四季度,腾讯资本开支同比增长386%至365.8亿元,2024年全年资本开支达到767.6亿元,同比增长221%,创历史新高,占总营收的11.6%。研发投入方面,2024年全年的AI研发投入达到706.9亿元,2018年至今累计投入3403亿元。腾讯总裁刘炽平表示,第四季度的资本支出增加非常显著,这是由于这一季度公司购买了更多GPU以满足推理需求,计划在2025年进一步增加资本支出。

MACD金叉信号形成,这些股涨势不错!
声明:
  1. 风险提示:以上内容仅来自互联网,文中内容或观点仅作为原作者或者原网站的观点,不代表本站的任何立场,不构成与本站相关的任何投资建议。在作出任何投资决定前,投资者应根据自身情况考虑投资产品相关的风险因素,并于需要时咨询专业投资顾问意见。本站竭力但不能证实上述内容的真实性、准确性和原创性,对此本站不做任何保证和承诺。
  2. 本站认真尊重知识产权及您的合法权益,如发现本站内容或相关标识侵犯了您的权益,请您与我们联系删除。
最新发布
今日焦点