深夜重磅发布!腾讯混元自研深度思考模型T1正式推出
在体现推理模型基础能力的常见benchmark上,如大语言模型评估增强数据集MMLU-PRO中,混元T1取得87.2分,仅次于o1。在CEval、AIME、Zebra Logic等中英文知识及竞赛级数学、逻辑推理的公开基准测试中,混元T1的成绩也达到业界领先推理模型的水平。
此前,腾讯宣布,混元大模型首次登上 Chatbot Arena 榜单,跻身全球 Top 15。用户在该平台上以匿名方式与多个模型互动,投票决定何种模型更佳,从而根据分数生成排行榜。这种测评也被看成是大模型直接 PK 的竞技场,简单直接。
去年 9 月 5 日,腾讯发布了新一代大模型混元 Turbo,采用 MoE 架构,比上一代产品推理效率提升 100%,推理成本降低 50%。
在本月 1 日发布的腾讯元宝电脑版 App 中则是内置了混元和 DeepSeek 两种模型,支持双模切换。
部分内容综合自:腾讯等
声明:
- 风险提示:以上内容仅来自互联网,文中内容或观点仅作为原作者或者原网站的观点,不代表本站的任何立场,不构成与本站相关的任何投资建议。在作出任何投资决定前,投资者应根据自身情况考虑投资产品相关的风险因素,并于需要时咨询专业投资顾问意见。本站竭力但不能证实上述内容的真实性、准确性和原创性,对此本站不做任何保证和承诺。
- 本站认真尊重知识产权及您的合法权益,如发现本站内容或相关标识侵犯了您的权益,请您与我们联系删除。
推荐文章: