一口气读懂DeepSeek
(来源:华安基金)
DeepSeek,这个在春节期间热度比哪吒还高的名词,这家在华尔街重挫英伟达、脚踢美股、拳打硅谷、掀翻全球舆论的AI公司,这个迅速登顶全球所有App平台、被用户用到宕机、被对手疯狂攻击、让马斯克和奥尔特曼破防的AI产品,究竟是真正的变革者,还是又一次虚晃一枪的泡沫?究竟是“国运级别”的突破,还是我国AI最后的高光时刻?

算力崩塌了吗?
美国资本市场之所以反应这么剧烈,原因无非是意识到深度求索这家被技术封锁的中国“小作坊”,用十分之一的算力成本(GPU小时数),就训练出接近OpenAI“大力出奇迹”才训练出来的o1模型的效果。

这是何等的炸裂?我相信大洋彼岸的从业者的震惊程度,不亚于有个人拿了把刻刀,就手搓出来一台光刻机。
在之前很长一段时间里,整个AGI(通用人工智能)行业,都是沿着Scaling Law(模型规模定律)的路径向前演进,这也是大模型训练当之无愧的“第一性原理”和“真理”,也就是模型性能与规模呈正相关——参数越多、计算资源越大,模型的性能就越强。
通俗来讲就是一个中学生,你给他提供更多学习资料、更长的学习时间和更好的老师搞题海战术,他的学习成绩肯定会更好。也就是你给孩子投入越多,花钱越大方,孩子越能成才。
但DeepSeek的出现,通过模型架构和工程优化的突破,掀开了无脑堆硬件的遮羞布,打破了这一定律,或者至少让以英伟达为代表的硬件城墙撕开了一道裂痕,就像中学生掌握了更高效的学习方法和捷径,领悟了学习的窍门。
当“大力出奇迹”的堆显卡、建数据中心这条路似乎被证伪,英伟达也被夹在了火上炙烤,各家大模型公司纷纷效仿DeepSeek的MLA和MOE架构,并用蒸馏技术(Distillation)来训练模型,这也意味着在短期根本用不到那么多显卡和设备了,也用不着英伟达画的那么多大饼了,所以市场慌了,英伟达一度也崩了。
但是,这里一定要记住我说的一个词——短期。正如我想问你几个问题,手机智能了你是买的多了还是少了?电车功能多了你是换的是勤了还是慢了?餐厅美食丰富了你是吃的复杂了还是简单了?
一个道理,当生产效率优化以后,我们可能只在短期内原材料用得少了,但这种技术进步带来的低成本能迸发出更多应用场景,并带来对底层资源的更多需求。也就是说,DeepSeek的出现只会让显卡越用越多,而非越用越少。


这样反常识的原理,在经济学中叫做杰文斯(Jevons)悖论。经济学家杰文斯在1865年发现,蒸汽机的出现以及效率的提高并没有让煤炭的需求变少,而是持续暴增,因为效率让蒸汽机进入到社会的每一个角落和每一户人家。
后来,这个悖论也出了一个衍生版本——安迪比尔定律。也就是每当摩尔定律给Intel带来更高效的处理器,Windows和其他新软件都能把性能压榨光。或者可以这么看,就是你无论换多大内存的手机,早晚有一天都会不够用。这也印证了技术的升级是有限的,而人的需求和欲望是无限的这一基本原理。
这也意味着,DeepSeek如果能带来10倍的效率提升,根本就不意味着大家都去改用10倍小的GPU算力来继续训练模型,大家大概率是会把节省下来的那9倍模型全部再投入训练,把功率打满,来争取更领先的技术。而不选择这么做的玩家们,会比过去快10倍的速度被远远甩下,甚至连车灯都看不到。
所以,我们看到DeepSeek-V3发布后,Meta大幅增加资本支出至600亿至650亿美元扩大AI基础设施,以及美国倾举国之力拟投资5000亿美元建设AI数据中心和能源基础设施。虽然我们不知道这事能不能成,但这样的态度也似乎表明“算力崩塌”是个伪命题正在成为所有人的共识。
当然,杰文斯悖论在长期可能有效,但资本市场有时候更多还是看中短期的叙事。是“算力成本压缩”的更快,还是“算力使用”的增长更快,或许是解答“英伟达到没到顶”这个谜题的最终答案。


奇点到来了吗?
DeepSeek的四两拨千斤,可不仅仅是通过节省成本刺激更大规模的硬件投资这么简单。这件事更大的意义,可以在于我们正在接近AI下游应用大规模爆发的“奇点”。
我们都知道,AI产业从产业链角度,可以分为上游基础层、中游模型层、下游应用层。

其中上游硬件基础设施,包括英伟达这样的GPU、储存设备、服务器、数据中心,当然也包括台积电这种半导体制造企业和亚马逊这样的云服务商(IaaS);中游包括深度学习框架、GPT这样的大模型研发和训练、数据链等软件模型;而下游则是像豆包这样的互联网服务、智能制造、金融风控、医疗影像分析、自动驾驶这样的最终消费解决方案,以及像智能家居、人形机器人、智能眼镜这样的可穿戴设备和硬件。
目前,整个AI产业最赚钱的就是上游了,比如英伟达最新财季(2024Q3)净利润同比增长了93%,这也让它的总市值也达到了3.15万亿美元,5年翻了38倍,10年翻了344倍(2025.2.7)。
所以,英伟达就代表着AI行业蓬勃发展了吗?当然不是。在某种意义上,英伟达如此赚钱就是最大的问题。毕竟在一个成熟的行业中,只有上游赚钱是不可持续的。就像一个旅游景点花了很多钱建设小吃街、豪华楼梯和登山索道,目的是为了吸引更多人来,但如果没有游客,那之前建设的一切都会功亏一篑,景区的建造商们说不定工程款都收不回来。
而只有下游赚钱,有更多应用层面的东西爆发,让AI触及每一户家庭和每一个个体,才会让AI的需求真正释放出来,进而反哺上游硬件的生态。就像最开始的智能手机非常昂贵,后来iPhone4的出现让手机产业链越来越成熟,小米的出现让手机本身越来越便宜,最终全世界几乎每人都用得起智能手机了,下游的谷歌、Meta、字节、腾讯、阿里、百度也成长为了巨头,整个移动互联网产业才真正成就了万亿市场。
现在想想,正是当所有人都用得起智能手机的那一刻,才是移动互联网时代真正的爆发原点,而苹果、小米以及无数手机厂商,都曾是搅动整个市场的那条鲶鱼。
而DeepSeek,就是搅动AI产业利润链从上游向下游传导的那条鲶鱼,让AI产业下游出现腾讯、茅台、伊利这样的消费龙头成为了可能。
有人说,你这过于神话DeepSeek了,其实不然,因为有三个趋势正在逐渐清晰,足以让我们相信未来的无限可能。
第一是实现相同效果所用的GPU算力等基础设越来越少,成本越来越低。这个我刚才提过一嘴,毕竟铲子便宜了挖金矿才有利可图嘛,只有上游成本降下来,大家才都买得起AI服务,买得起智能硬件。甚至我们可以想的长远一点,只有尽可能节省算力,我们才不会因为能源的瓶颈被限制住,或许不需要实现可控核聚变仅用有限的算力就能实现AGI的终极目标,这也是美股AI叙事从英伟达转移到下游应用的主要逻辑。




第二是揭示了推理模型的重要性。如果说大模型可以看成是一个全知全能的知识百科全书,那么像DeepSeek-R1这样的推理模型利用好这些知识产生更好的智能,用推理思维来解决实际问题肯定是必然道路。毕竟知识不能吃不能喝,它的威力全靠如何驾驭。
第三我觉得DeepSeek出现最重要的意义在于它的开源和平权。当中游的算法层面开源,意味着下游应用的成本再一次减小,企业接入的门槛也再一步降低,随便一个中小企业甚至一台电脑都可以在本地部署自己的AI业务系统,并创造出繁荣的生态,有多少新的商业场景会因此打开,就像安卓的开源也让其成为全世界最大操作系统那样,一个开源的系统总有机会战胜哪怕再聪明的闭源。


在这样的背景下,像DeepSeek或许将成为未来AI民主化基础设施不可分离的基石,成为新的标准制定者,帮助万千企业实现AI平权。正如人们耳熟能详的那句话——我将无我,而我无处不在。这是OpenAI曾经远离的初心,更是DeepSeek们赖以生存的生态位。
就连OpenAI创始人奥尔特曼也承认,在开闭源这个问题上站在了历史的错误一方。随着OpenAI免费开放o3-mini模型,一场AI算法开源大战近在眼前。当Ai封神榜打开的那一刻,AI应用的奇点还会远吗?

竞争转折了吗?
市场对DeepSeek的认可和追捧,的确意味着之前一个阶段美国“小院高墙”遏制策略的失效,以及芯片禁运措施的适得其反,毕竟这些动作反而加速了我们在AI效率优化上的创新和开源上的更加激进,让我们用有限的H800显卡甚至华为昇腾显卡就能实现差不多的效果。
但我们用实事求是的态度来看,弯道超车的路途似乎并没有那么顺畅。
毕竟,DeepSeek开源策略下的效率提升思路,拥有更多算力的美国AI巨头们可以直接拿去借鉴;即便是现阶段被网上“封神”的DeepSeek-R1模型,水平也赶不上OpenAI去年发布的o3模型;更重要的是,之前中美两国的AI竞争还算友好,两国的科技企业还愿意互相做做生意。但DeepSeek出现后,硅谷巨头们大概率都会支持更严苛的技术禁运,我们仅凭英伟达的阉割版H20是真的难堪大任。
在可以预见的未来,我们或许真的只能使用国产GPU,国内的产业政策或许也会持续跟上,自主可控和信创的故事或许还没有结束。

从这个角度看,DeepSeek R1的春节攻势就像抗日战争八年抗战的百团大战,虽然狠狠出了一口恶气,并提升了国民的士气,但也暴露了八路军在敌后的弱点。未来我国的AI会走向何方无人知晓,更多人也害怕DeepSeek绚烂的烟花会转瞬即逝。
如果你这样想的,那就真的格局小了。
因为在我得知DeepSeek开源的那一刻,这场战争已经走向了另一个层面——不是什么中美竞争的狭隘叙事,而是开源对闭源的胜利。
正如DeepSeek的API可能会被欧美封锁,但开源的力量就像滚滚东流的长江之水,吸引着一批又一批开发者顺流而下,乘风破浪,而这样的AI民主化,也在逐渐撼动AI巨头们的AI霸权。
当大洋彼岸的OpenAI们幻想着早日实现AGI后的一骑绝尘以及绝对实力的碾压之时,当硅谷精英幻想着有一个全知全能的AI真神可以替人类做一切决策实现进化终局之时,当我们的自由意志逐渐被AI瓦解就像《西部世界》里“雷荷波”以及《终结者》里的天网操控一切之时,能解救人类本身的选择,似乎只能是那个无限平权的AI梦想——让每个人类个体,都拥有自己的AI模型,并应用于无限的场景之中。
而这个场景,并不在星际之门宏大的叙事愿景中,或许会在像DeepSeek这样的开源世界里。

尾声
利用后发优势做追赶者,用低成本开发好产品、普及新技术,实现物美价廉,是我国在资源匮乏、技术落后的历史条件下实现工业化和现代化形成的独特文化和惯性;而美国,善于通过所谓的“范佛里特弹药量”,倚仗超大规模的投入和饱和式打击获得超级领先的地位。
在过去很多年里,我们的家电、光伏和新能源汽车,正是通过这样的高性价比策略攻城略地,但DeepSeek的横空出世,突然以一种搅局者甚至颠覆者的姿态出现,让世界大为吃惊,也让我们所有科技行业的关注者和投资研究者为之一振,胜利似乎就在眼前,但我们依旧需要保持冷静和谦卑。
就像DeepSeek梁文锋所说:
“
在美国每天发生的大量创新里,这是非常普通的一个。他们之所以惊讶,是因为这是一个中国公司,以创新贡献者的身份,加入到他们的游戏里去。
”
或许英伟达的噩梦远未结束,或许这场战役刚刚开始,但我们需要明白的是,我们的敌人从来都不是竞争本身,开放、包容和AI民主平权,才是每一个AI参与者需要坚守的信念,是人类自身赖以自由生存的永恒。
参考文献:
关于DeepSeek,Lex Fridman播客
DeepSeek是“国运”级的突破吗? 格局可以更大些,风声OPINION
“算力崩塌”,是真是假,巨潮WAVE
DeepSeek策略三问,天风证券
DeepSeek:技术颠覆or创新共赢,中国银河
DeepSeek:模型效率的革命,算力基建的新起点,国盛证券
DeepSeek惊艳世界,算力与应用将迎来结构性变化,东方证券
Deepseek R1是AGI的里程碑,中长期利好算力硬件,信达证券
DeepSeek-R1颠覆性在于实现AI平权,重估资产价值,浙商证券
一文读懂DeepSeek,浙商证券
DeepSeek核心十问十答,中信建投
DeepSeek是否会撼动“星际之门”的投资逻辑?,华泰证券
算力平权运动,西部证券
MACD金叉信号形成,这些股涨势不错!声明:
- 风险提示:以上内容仅来自互联网,文中内容或观点仅作为原作者或者原网站的观点,不代表本站的任何立场,不构成与本站相关的任何投资建议。在作出任何投资决定前,投资者应根据自身情况考虑投资产品相关的风险因素,并于需要时咨询专业投资顾问意见。本站竭力但不能证实上述内容的真实性、准确性和原创性,对此本站不做任何保证和承诺。
- 本站认真尊重知识产权及您的合法权益,如发现本站内容或相关标识侵犯了您的权益,请您与我们联系删除。
推荐文章: