人工智能行业动态报告:DEEPSEEK-V3-0324更新 多项能力接近或超过GPT4.5及CLAUDE3.7

证券之星 2025-03-31 10:42:33
股市要闻 2025-03-31 10:42:33 阅读

  核心观点

      1. 3 月24 日,Deepseek-V3 深夜版本更新,新模型版本为DeepSeek-V3-0324,参数量为6850 亿,开源版本上下文长度为 128K,可以在消费级设备运行。

      2. DeepSeek-V3-0324 各项性能显著提升,在数学方面,V3- 0 3 24超过GPT4.5 和claude3.7,在代码生成能力方面,以极低的成本超过claude3.5,并达到接近Claude-Sonnet-3.7 的能力。

      在百科知识(MMLU-Pro, GPQA)、数学(MATH-500, AIME2024)和代码任务(LiveCodeBench)上的表现均有提升,在数学推理和代码生成方面实现巨大提升,在测试中一举超过Claude-Sonnet-3.7。

      3. DeepSeek-V3 的能力显著提高,证明了深度求索团队不仅在推理模型上的先发优势,在预训练基模型的能力同样出众,其优秀的工程化能力保证了以极低的成本达到目前大模型的顶尖水平。

      产业要闻

      【澳大利亚国立大学团队提出了ARINAR 模型】、【Nvidia 发布多模态世界生成模型】、【斯坦福团队提出块离散去噪扩散语言模型】、【苹果开发者大会将于6 月份举行】、【华为将推出鸿蒙电脑】、【蔚来与宁德时代宣布合作】、【比亚迪海洋网新车型上市】

      持续关注:

      GPU:英伟达、超威半导体、海光信息等;

      FPGA:安路科技-U 等;

      SoC:高通、全志科技等;

      自然语言处理:科大讯飞等;

      自动驾驶:德赛西威、中科创达、均胜电子;

      智慧交通:千方科技、万集科技;

      AI+工业:中控技术、华大九天、广立微、柏楚电子、理工能科等。

      风险提示:北美经济衰退预期逐步增强,宏观环境存在较大的不确定性,国际环境变化影响供应链及海外拓展;芯片紧缺可能影响相关公司的正常生产和交付,公司出货不及预期。

声明:
  1. 风险提示:以上内容仅来自互联网,文中内容或观点仅作为原作者或者原网站的观点,不代表本站的任何立场,不构成与本站相关的任何投资建议。在作出任何投资决定前,投资者应根据自身情况考虑投资产品相关的风险因素,并于需要时咨询专业投资顾问意见。本站竭力但不能证实上述内容的真实性、准确性和原创性,对此本站不做任何保证和承诺。
  2. 本站认真尊重知识产权及您的合法权益,如发现本站内容或相关标识侵犯了您的权益,请您与我们联系删除。
最新发布
今日焦点