一口气读懂DeepSeek

证券之星 2025-03-08 09:36:00

2025-03-08 09:36:00 阅读

（来源：华安基金）

DeepSeek，这个在春节期间热度比哪吒还高的名词，这家在华尔街重挫英伟达、脚踢美股、拳打硅谷、掀翻全球舆论的AI公司，这个迅速登顶全球所有App平台、被用户用到宕机、被对手疯狂攻击、让马斯克和奥尔特曼破防的AI产品，究竟是真正的变革者，还是又一次虚晃一枪的泡沫？究竟是“国运级别”的突破，还是我国AI最后的高光时刻？

算力崩塌了吗？

美国资本市场之所以反应这么剧烈，原因无非是意识到深度求索这家被技术封锁的中国“小作坊”，用十分之一的算力成本（GPU小时数），就训练出接近OpenAI“大力出奇迹”才训练出来的o1模型的效果。

这是何等的炸裂？我相信大洋彼岸的从业者的震惊程度，不亚于有个人拿了把刻刀，就手搓出来一台光刻机。

在之前很长一段时间里，整个AGI（通用人工智能）行业，都是沿着Scaling Law（模型规模定律）的路径向前演进，这也是大模型训练当之无愧的“第一性原理”和“真理”，也就是模型性能与规模呈正相关——参数越多、计算资源越大，模型的性能就越强。

通俗来讲就是一个中学生，你给他提供更多学习资料、更长的学习时间和更好的老师搞题海战术，他的学习成绩肯定会更好。也就是你给孩子投入越多，花钱越大方，孩子越能成才。

但DeepSeek的出现，通过模型架构和工程优化的突破，掀开了无脑堆硬件的遮羞布，打破了这一定律，或者至少让以英伟达为代表的硬件城墙撕开了一道裂痕，就像中学生掌握了更高效的学习方法和捷径，领悟了学习的窍门。

当“大力出奇迹”的堆显卡、建数据中心这条路似乎被证伪，英伟达也被夹在了火上炙烤，各家大模型公司纷纷效仿DeepSeek的MLA和MOE架构，并用蒸馏技术（Distillation）来训练模型，这也意味着在短期根本用不到那么多显卡和设备了，也用不着英伟达画的那么多大饼了，所以市场慌了，英伟达一度也崩了。

但是，这里一定要记住我说的一个词——短期。正如我想问你几个问题，手机智能了你是买的多了还是少了？电车功能多了你是换的是勤了还是慢了？餐厅美食丰富了你是吃的复杂了还是简单了？

一个道理，当生产效率优化以后，我们可能只在短期内原材料用得少了，但这种技术进步带来的低成本能迸发出更多应用场景，并带来对底层资源的更多需求。也就是说，DeepSeek的出现只会让显卡越用越多，而非越用越少。

这样反常识的原理，在经济学中叫做杰文斯（Jevons）悖论。经济学家杰文斯在1865年发现，蒸汽机的出现以及效率的提高并没有让煤炭的需求变少，而是持续暴增，因为效率让蒸汽机进入到社会的每一个角落和每一户人家。

后来，这个悖论也出了一个衍生版本——安迪比尔定律。也就是每当摩尔定律给Intel带来更高效的处理器，Windows和其他新软件都能把性能压榨光。或者可以这么看，就是你无论换多大内存的手机，早晚有一天都会不够用。这也印证了技术的升级是有限的，而人的需求和欲望是无限的这一基本原理。

这也意味着，DeepSeek如果能带来10倍的效率提升，根本就不意味着大家都去改用10倍小的GPU算力来继续训练模型，大家大概率是会把节省下来的那9倍模型全部再投入训练，把功率打满，来争取更领先的技术。而不选择这么做的玩家们，会比过去快10倍的速度被远远甩下，甚至连车灯都看不到。

所以，我们看到DeepSeek-V3发布后，Meta大幅增加资本支出至600亿至650亿美元扩大AI基础设施，以及美国倾举国之力拟投资5000亿美元建设AI数据中心和能源基础设施。虽然我们不知道这事能不能成，但这样的态度也似乎表明“算力崩塌”是个伪命题正在成为所有人的共识。

当然，杰文斯悖论在长期可能有效，但资本市场有时候更多还是看中短期的叙事。是“算力成本压缩”的更快，还是“算力使用”的增长更快，或许是解答“英伟达到没到顶”这个谜题的最终答案。

奇点到来了吗？

DeepSeek的四两拨千斤，可不仅仅是通过节省成本刺激更大规模的硬件投资这么简单。这件事更大的意义，可以在于我们正在接近AI下游应用大规模爆发的“奇点”。

我们都知道，AI产业从产业链角度，可以分为上游基础层、中游模型层、下游应用层。

其中上游硬件基础设施，包括英伟达这样的GPU、储存设备、服务器、数据中心，当然也包括台积电这种半导体制造企业和亚马逊这样的云服务商（IaaS）；中游包括深度学习框架、GPT这样的大模型研发和训练、数据链等软件模型；而下游则是像豆包这样的互联网服务、智能制造、金融风控、医疗影像分析、自动驾驶这样的最终消费解决方案，以及像智能家居、人形机器人、智能眼镜这样的可穿戴设备和硬件。

目前，整个AI产业最赚钱的就是上游了，比如英伟达最新财季（2024Q3）净利润同比增长了93%，这也让它的总市值也达到了3.15万亿美元，5年翻了38倍，10年翻了344倍（2025.2.7）。

所以，英伟达就代表着AI行业蓬勃发展了吗？当然不是。在某种意义上，英伟达如此赚钱就是最大的问题。毕竟在一个成熟的行业中，只有上游赚钱是不可持续的。就像一个旅游景点花了很多钱建设小吃街、豪华楼梯和登山索道，目的是为了吸引更多人来，但如果没有游客，那之前建设的一切都会功亏一篑，景区的建造商们说不定工程款都收不回来。

而只有下游赚钱，有更多应用层面的东西爆发，让AI触及每一户家庭和每一个个体，才会让AI的需求真正释放出来，进而反哺上游硬件的生态。就像最开始的智能手机非常昂贵，后来iPhone4的出现让手机产业链越来越成熟，小米的出现让手机本身越来越便宜，最终全世界几乎每人都用得起智能手机了，下游的谷歌、Meta、字节、腾讯、阿里、百度也成长为了巨头，整个移动互联网产业才真正成就了万亿市场。

现在想想，正是当所有人都用得起智能手机的那一刻，才是移动互联网时代真正的爆发原点，而苹果、小米以及无数手机厂商，都曾是搅动整个市场的那条鲶鱼。

而DeepSeek，就是搅动AI产业利润链从上游向下游传导的那条鲶鱼，让AI产业下游出现腾讯、茅台、伊利这样的消费龙头成为了可能。

有人说，你这过于神话DeepSeek了，其实不然，因为有三个趋势正在逐渐清晰，足以让我们相信未来的无限可能。

第一是实现相同效果所用的GPU算力等基础设越来越少，成本越来越低。这个我刚才提过一嘴，毕竟铲子便宜了挖金矿才有利可图嘛，只有上游成本降下来，大家才都买得起AI服务，买得起智能硬件。甚至我们可以想的长远一点，只有尽可能节省算力，我们才不会因为能源的瓶颈被限制住，或许不需要实现可控核聚变仅用有限的算力就能实现AGI的终极目标，这也是美股AI叙事从英伟达转移到下游应用的主要逻辑。

第二是揭示了推理模型的重要性。如果说大模型可以看成是一个全知全能的知识百科全书，那么像DeepSeek-R1这样的推理模型利用好这些知识产生更好的智能，用推理思维来解决实际问题肯定是必然道路。毕竟知识不能吃不能喝，它的威力全靠如何驾驭。

第三我觉得DeepSeek出现最重要的意义在于它的开源和平权。当中游的算法层面开源，意味着下游应用的成本再一次减小，企业接入的门槛也再一步降低，随便一个中小企业甚至一台电脑都可以在本地部署自己的AI业务系统，并创造出繁荣的生态，有多少新的商业场景会因此打开，就像安卓的开源也让其成为全世界最大操作系统那样，一个开源的系统总有机会战胜哪怕再聪明的闭源。

在这样的背景下，像DeepSeek或许将成为未来AI民主化基础设施不可分离的基石，成为新的标准制定者，帮助万千企业实现AI平权。正如人们耳熟能详的那句话——我将无我，而我无处不在。这是OpenAI曾经远离的初心，更是DeepSeek们赖以生存的生态位。

就连OpenAI创始人奥尔特曼也承认，在开闭源这个问题上站在了历史的错误一方。随着OpenAI免费开放o3-mini模型，一场AI算法开源大战近在眼前。当Ai封神榜打开的那一刻，AI应用的奇点还会远吗？

竞争转折了吗？

市场对DeepSeek的认可和追捧，的确意味着之前一个阶段美国“小院高墙”遏制策略的失效，以及芯片禁运措施的适得其反，毕竟这些动作反而加速了我们在AI效率优化上的创新和开源上的更加激进，让我们用有限的H800显卡甚至华为昇腾显卡就能实现差不多的效果。

但我们用实事求是的态度来看，弯道超车的路途似乎并没有那么顺畅。

毕竟，DeepSeek开源策略下的效率提升思路，拥有更多算力的美国AI巨头们可以直接拿去借鉴；即便是现阶段被网上“封神”的DeepSeek-R1模型，水平也赶不上OpenAI去年发布的o3模型；更重要的是，之前中美两国的AI竞争还算友好，两国的科技企业还愿意互相做做生意。但DeepSeek出现后，硅谷巨头们大概率都会支持更严苛的技术禁运，我们仅凭英伟达的阉割版H20是真的难堪大任。

在可以预见的未来，我们或许真的只能使用国产GPU，国内的产业政策或许也会持续跟上，自主可控和信创的故事或许还没有结束。

从这个角度看，DeepSeek R1的春节攻势就像抗日战争八年抗战的百团大战，虽然狠狠出了一口恶气，并提升了国民的士气，但也暴露了八路军在敌后的弱点。未来我国的AI会走向何方无人知晓，更多人也害怕DeepSeek绚烂的烟花会转瞬即逝。

如果你这样想的，那就真的格局小了。

因为在我得知DeepSeek开源的那一刻，这场战争已经走向了另一个层面——不是什么中美竞争的狭隘叙事，而是开源对闭源的胜利。

正如DeepSeek的API可能会被欧美封锁，但开源的力量就像滚滚东流的长江之水，吸引着一批又一批开发者顺流而下，乘风破浪，而这样的AI民主化，也在逐渐撼动AI巨头们的AI霸权。

当大洋彼岸的OpenAI们幻想着早日实现AGI后的一骑绝尘以及绝对实力的碾压之时，当硅谷精英幻想着有一个全知全能的AI真神可以替人类做一切决策实现进化终局之时，当我们的自由意志逐渐被AI瓦解就像《西部世界》里“雷荷波”以及《终结者》里的天网操控一切之时，能解救人类本身的选择，似乎只能是那个无限平权的AI梦想——让每个人类个体，都拥有自己的AI模型，并应用于无限的场景之中。

而这个场景，并不在星际之门宏大的叙事愿景中，或许会在像DeepSeek这样的开源世界里。

尾声

利用后发优势做追赶者，用低成本开发好产品、普及新技术，实现物美价廉，是我国在资源匮乏、技术落后的历史条件下实现工业化和现代化形成的独特文化和惯性；而美国，善于通过所谓的“范佛里特弹药量”，倚仗超大规模的投入和饱和式打击获得超级领先的地位。

在过去很多年里，我们的家电、光伏和新能源汽车，正是通过这样的高性价比策略攻城略地，但DeepSeek的横空出世，突然以一种搅局者甚至颠覆者的姿态出现，让世界大为吃惊，也让我们所有科技行业的关注者和投资研究者为之一振，胜利似乎就在眼前，但我们依旧需要保持冷静和谦卑。

就像DeepSeek梁文锋所说：

“

在美国每天发生的大量创新里，这是非常普通的一个。他们之所以惊讶，是因为这是一个中国公司，以创新贡献者的身份，加入到他们的游戏里去。

”

或许英伟达的噩梦远未结束，或许这场战役刚刚开始，但我们需要明白的是，我们的敌人从来都不是竞争本身，开放、包容和AI民主平权，才是每一个AI参与者需要坚守的信念，是人类自身赖以自由生存的永恒。

参考文献：

关于DeepSeek，Lex Fridman播客

DeepSeek是“国运”级的突破吗? 格局可以更大些，风声OPINION

“算力崩塌”，是真是假，巨潮WAVE

DeepSeek策略三问，天风证券

DeepSeek：技术颠覆or创新共赢，中国银河

DeepSeek：模型效率的革命，算力基建的新起点，国盛证券

DeepSeek惊艳世界，算力与应用将迎来结构性变化，东方证券

Deepseek R1是AGI的里程碑，中长期利好算力硬件，信达证券

DeepSeek-R1颠覆性在于实现AI平权，重估资产价值，浙商证券

一文读懂DeepSeek，浙商证券

DeepSeek核心十问十答，中信建投

DeepSeek是否会撼动“星际之门”的投资逻辑？，华泰证券

算力平权运动，西部证券

MACD金叉信号形成，这些股涨势不错！

口气

声明：

风险提示：以上内容仅来自互联网，文中内容或观点仅作为原作者或者原网站的观点，不代表本站的任何立场，不构成与本站相关的任何投资建议。在作出任何投资决定前，投资者应根据自身情况考虑投资产品相关的风险因素，并于需要时咨询专业投资顾问意见。本站竭力但不能证实上述内容的真实性、准确性和原创性，对此本站不做任何保证和承诺。

本站认真尊重知识产权及您的合法权益，如发现本站内容或相关标识侵犯了您的权益，请您与我们联系删除。

一口气读懂DeepSeek

推荐文章：

女神节｜自由逐梦以爱为光邂逅人生万般精彩

SEC 确认 CANARY HBAR ETF 与 GRAYSCALE POLKADOT ETF 19b-4 文件进入公众意见征求阶段

一口气读懂DeepSeek

鹏华碳中和主题混合A

【华泰小课堂】培养孩子的“财商”，从压岁钱理财规划开始

【女神节】勇敢无畏踏浪前行

研选 | 光大研究每周重点报告 20250301-20250307

【格林财经早报0308】

公募2月选证能力榜揭晓股票型和混合型榜冠军均花落博道基金

中证500ETF鹏华（159982）开盘涨0.20%，重仓股光启技术涨0.68%，江淮汽车涨0.06%

ETF融资榜 | 港股互联网ETF(513770)融资净买入551.15万元，居可比基金第一

深交所推出ETF定投策略投教品牌活动

Manus刷屏，科创浪潮推动中国资产价值重估！“硬科技”代表科创50ETF基金(588180)近1周新增份额高居同类产品第一

浙商基金高管变更：纪士鹏离任新任楼羿南为督察长

漂亮50ETF（561500）开盘涨0.91%，重仓股恒瑞医药涨0.70%，迈瑞医疗涨0.68%

Manus再次引爆AI热点！科创板人工智能ETF(588930)早盘调整，成交持续火热

尚正正鑫混合发起A基金经理段吉华离任，关凯瀛接任，段吉华2022H1至2024H1给基民亏778.09万收管理费233.03万

ETF融资榜 | 人工智能ETF(159819)融资净买入1532.45万元，居可比基金第一

ETF融资榜 | 恒生互联网ETF(513330)融资净买入5221.69万元，居可比基金第一

鹏扬景升混合A基金经理赵世宏离任，戴杰接任，赵世宏2019H2至2024H1给基民赚5322.88万收管理费3044.73万