信息服务行业跟踪报告:DEEPSEEKV3完成小版本升级 推理/开发/中文/搜索等多领域能力均有增强
DeepSeek-V3 完成小版本升级。近日, DeepSeek-V3 模型完成小版本升级,目前版本号DeepSeek-V3-0324,用户登录官方网页、APP、小程序进入对话界面后,关闭深度思考即可体验。API 接口和使用方式保持不变。DeepSeek建议,如果是非复杂推理任务,用户可以使用新版本V3 模型,即刻享受速度更加流畅、效果全面提升的对话体验。
新版DeepSeek-V3 多领域任务能力均有提升。新版DeepSeek V3 主要有以下能力提升:(1)推理任务表现提高。V3 模型借鉴DeepSeek-R1 模型训练过程中所使用的强化学习技术,大幅提高了在推理类任务上的表现水平,在数学、代码类相关评测集上取得了超过GPT-4.5 的得分成绩。(2)前端开发能力增强。在HTML 等代码前端任务上,新版V3 模型生成的代码可用性更高,视觉效果也更加美观、富有设计感。(3)中文写作升级。在中文写作任务方面,新版 V3 模型基于 R1 的写作水平进行了进一步优化,同时特别提升了中长篇文本创作的内容质量。(4)中文搜索能力优化。新版 V3 模型可以在联网搜索场景下,对于报告生成类指令输出内容更为详实准确、排版更加清晰美观的结果。此外,新版 V3 模型在工具调用、角色扮演、问答闲聊等方面也得到了一定幅度的能力提升。
新版 DeepSeek-V3 保持高度开源,支持用户利用V3 模型训练其他模型。
DeepSeek-V3-0324 与之前的DeepSeek-V3 使用同样的base 模型,仅改进了后训练方法。私有化部署时只需要更新checkpoint 和tokenizer_config.json(tool calls 相关变动)。模型参数约660B,开源版本上下文长度为128K(网页端、App 和API 提供64K 上下文)。与DeepSeek-R1 保持一致,此次DeepSeek-V3 的开源仓库(包括模型权重)统一采用MIT License,并允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。
DeepSeek 已官宣 API 错峰优惠政策,进一步推动AI 落地。在2 月底,DeepSeek 还宣布了DeepSeek API 错峰优惠政策。北京时间每日00:30 至08:30 的夜间空闲时段,DeepSeek 开放平台推出错峰优惠活动。在此期间,API 调用价格大幅下调:DeepSeek-V3 降至原价的50%,DeepSeek-R1 更低至25%。DeepSeek 鼓励用户充分利用这一时段,享受更经济更流畅的服务体验。
我们认为。新版DeepSeek-V3 的发布,代表DeepSeek 目前仍在稳定的更新迭代当中,这也说明目前AI 的发展远远没有到停滞的阶段,伴随各大科技公司对AI 技术的持续投入,AI 模型也有望持续发展,从而带来更强的能力和更好的落地性,DeepSeek API 的错峰优惠政策则进一步助推了AI 的落地,使得用户能够以更加便宜更加有性价比的价格,使用到最先进的大模型之一,未来AI 在各领域的落地也有望持续加速。
风险提示:AI 技术发展不及预期,AI 商业落地不及预期的风险。
声明:
- 风险提示:以上内容仅来自互联网,文中内容或观点仅作为原作者或者原网站的观点,不代表本站的任何立场,不构成与本站相关的任何投资建议。在作出任何投资决定前,投资者应根据自身情况考虑投资产品相关的风险因素,并于需要时咨询专业投资顾问意见。本站竭力但不能证实上述内容的真实性、准确性和原创性,对此本站不做任何保证和承诺。
- 本站认真尊重知识产权及您的合法权益,如发现本站内容或相关标识侵犯了您的权益,请您与我们联系删除。
推荐文章: