英伟达的万亿野心:AI推理真能撑起下一个黄金时代吗?

当黄仁勋在GTC开发者大会上第36次说出“推理”这个词时,整个硅谷都竖起了耳朵。这位英伟达的掌门人,穿着他标志性的皮衣,向世界抛出了一个惊人的预测:到2027年,公司的AI处理器将驱动1万亿美元的营收机会。
当黄仁勋在GTC开发者大会上第36次说出“推理”这个词时,整个硅谷都竖起了耳朵。这位英伟达的掌门人,穿着他标志性的皮衣,向世界抛出了一个惊人的预测:到2027年,公司的AI处理器将驱动1万亿美元的营收机会。
这个数字有多大?相当于苹果公司2023年全年营收的3倍多,或者整个沙特阿拉伯2023年的GDP。但问题来了:在AI训练市场几乎被英伟达垄断之后,竞争更加激烈、技术路径更分散的AI推理市场,真能成为这家芯片巨头通往万亿帝国的下一张门票吗?
从“健身房”到“应用场”:AI的重心转移
要理解这个万亿机会,得先搞懂AI产业链的两个核心环节:训练和推理。
想象一下,训练就像是建造一个超级大脑的过程。你需要海量的数据(比如互联网上所有的文本、图片)、庞大的算力(成千上万的GPU),花费数周甚至数月时间,耗资数百万美元,才能训练出一个像GPT-4这样的大模型。这个阶段,英伟达的H100、B200芯片几乎是唯一选择,市占率一度超过90%。
但推理完全不同。它更像是这个超级大脑开始工作——用户问ChatGPT一个问题,它几秒钟内给出回答;你让Midjourney画一幅画,它几分钟内生成图像。推理不需要训练时那种集中式的、暴风骤雨般的算力,但它需要的是持续、稳定、高效的计算能力,而且要同时服务全球数亿用户。
关键转变正在发生:根据最新的行业数据,2025年全球AI推理工作负载的算力需求预计将首次超过训练。这意味着什么?AI的“基建狂魔”阶段(疯狂建数据中心、买芯片训练模型)正在接近顶峰,而“应用爆发”阶段(各种AI应用真正被用户使用)才刚刚开始。
黄仁勋显然看到了这个拐点。他在GTC上宣布的一系列新产品——从采用Groq技术的LPU(语言处理协处理器),到Rubin和未来的Feynman级芯片,再到进军CPU领域的Vera处理器——都在传递一个明确信号:英伟达不仅要继续统治AI训练的“健身房”,还要拿下AI推理的“应用场”。
生态战争:从卖芯片到卖“整个世界”
英伟达最聪明的一步棋,可能不是某个具体的芯片,而是它的平台化战略。
黄仁勋在长达140分钟的主题演讲中,开场就谈CUDA——这个免费的软件生态,如今已经成为AI开发者的“空气和水”。根据最新统计,全球超过400万开发者在使用CUDA,建立在CUDA之上的AI模型、工具和服务构成了一个庞大的护城河。
这让我想起2010年左右投资苹果的经历。当时很多人只把苹果看作硬件公司,但我看到的是它通过iOS生态建立的统治力。今天的英伟达正在走类似的路:硬件是入口,软件是护城河,生态才是真正的利润池。
看看GTC上宣布的合作就知道了:IBM、HPE、Adobe、Uber……这些巨头都在深度整合英伟达的AI生态。三星甚至宣布将为英伟达代工基于4nm工艺的芯片,并推出新一代HBM4E内存。这已经不是简单的供应商-客户关系,而是命运共同体。
但平台化也有代价。为了维持生态,英伟达去年与Groq达成了昂贵的授权协议,让这家专注于推理芯片的竞争对手的技术,能够与英伟达自己的芯片在数据中心里“和平共处”。这有点像微软当年拥抱开源——有时候,为了统治整个战场,你得先学会与曾经的敌人共舞。
万亿营收的数学题:算得过来吗?
1万亿美元营收是什么概念?我们来算笔账。
英伟达2024财年(截至2024年1月)数据中心营收为475亿美元,同比增长217%。如果按照黄仁勋的预测,到2027年要实现万亿级别的机会,意味着未来三年数据中心业务需要保持年复合增长率超过50%。
这可能吗?看看驱动因素:
第一,推理芯片的单价可能更高。训练芯片追求的是峰值算力,而推理芯片在能效比、延迟、成本上要求更苛刻。根据行业分析,同样算力水平的推理专用芯片,其每瓦性能可能是通用GPU的2-3倍,这意味着溢价空间。
第二,市场从云向边扩展。AI推理不仅发生在谷歌、微软的巨型数据中心里,还会发生在工厂、医院、汽车、手机上。英伟达的Jetson系列边缘AI芯片已经开始布局这个万亿设备市场。
第三,软件和服务的货币化。CUDA、AI Enterprise等软件订阅,以及通过DGX Cloud提供的AI算力服务,毛利率可能高达80%以上,远高于硬件的60%左右。
但硬币的另一面是竞争。AMD的MI300系列正在快速追赶,英特尔也在重整旗鼓。更可怕的是大客户自研芯片:谷歌有TPU,亚马逊有Trainium和Inferentia,微软据说也在开发自己的AI芯片。这些云巨头既想用英伟达的芯片,又不想被“卡脖子”,这种若即若离的关系最是微妙。
我记得2021年投资特斯拉时,市场最担心的是传统车企的觉醒。但马斯克用一句话点醒了很多人:“竞争不是偷走你的午餐,而是把整个餐厅做大。”AI推理市场可能也是如此——英伟达的竞争对手们,首先是在共同把AI推理的蛋糕做大,然后才是分蛋糕的问题。

技术面:股价在等待什么?
GTC大会后,英伟达股价一度冲高至188.88美元,最终收涨1.6%至183.19美元。这个走势很有意思——有利好,但不够“炸”。
从技术图形看,NVDA自2025年12月以来,一直在171.50-196美元的矩形区间内震荡。183.50美元像是一个磁力中心,股价涨上去会被拉回,跌下去也会被吸上来。

这种横盘整理通常意味着两件事:要么是在积蓄力量准备突破,要么是在等待新的催化剂。从期权市场的隐含波动率来看,交易员们似乎预期未来1-2个月会有较大波动。
历史季节性数据提供了一些线索:自2007年以来,NVDA在3月份有55%的概率收涨,平均涨幅2.6%;4月份有58%的概率收涨,平均涨幅0.8%。但历史只是参考,今年的关键变量是4月下旬的财报。

我个人会关注几个关键位:如果股价能强势突破196美元的上轨阻力,下一个目标可能在210-220美元区间;但如果跌破171.50美元的支撑,可能会测试160美元的关键心理关口。
投资启示:推理时代的赢家与陷阱
对于投资者来说,英伟达的推理故事既充满诱惑,又布满陷阱。
机会在于:如果AI推理真的如黄仁勋预测的那样爆发,英伟达凭借其完整的硬件-软件-生态优势,很可能继续维持主导地位。推理市场的碎片化(不同应用需要不同的优化)反而有利于平台型公司,因为客户不想管理十几个不同供应商的芯片。
风险在于:推理市场的技术路径远未统一。除了英伟达的GPU,还有Groq的LPU、谷歌的TPU、亚马逊的Inferentia,以及各种初创公司的专用芯片。这个市场可能不会像训练市场那样出现“赢家通吃”的局面。
更微妙的是定价权问题。在训练市场,因为需求爆炸性增长、供应严重不足,英伟达可以享受近乎垄断的定价权。但在推理市场,客户有更多选择,而且对成本更敏感(毕竟推理是持续发生的成本),英伟达的毛利率可能会面临压力。
我记得2023年初和一位对冲基金朋友讨论英伟达时,他说了一句很深刻的话:“投资NVDA,你不是在投资一家芯片公司,而是在投资AI时代的‘卖水人’。”无论AI的淘金者们最后谁挖到金子,英伟达都在那里卖铲子、卖水、甚至卖地图。
现在,黄仁勋告诉我们:淘金热的第一阶段(训练)可能接近高潮,但第二阶段(推理)的规模可能是第一阶段的数倍。而且这次,英伟达不仅要卖工具,还要帮淘金者建营地、开商店、甚至提供金融服务。
最后的思考:万亿是目标,不是终点
在GTC的尾声,黄仁勋透露了一个更有野心的计划:为太空数据中心设计处理器。这听起来像是科幻,但仔细想想很合理——如果未来全球的AI推理需求真的爆炸,地球上的数据中心可能不够用,或者延迟太高。把数据中心建在近地轨道上,通过卫星网络提供全球低延迟的AI服务,这可能是解决“最后一公里”问题的终极方案。
这让我意识到,英伟达的野心可能远远超出我们的想象。1万亿美元营收不是终点,而是通往“AI无处不在”世界的一个里程碑。
当然,投资永远是关于概率和赔率的游戏。英伟达的推理故事很美好,但需要一系列假设成立:AI应用真的爆发式增长、推理算力需求持续指数级上升、英伟达能维持技术领先和生态控制、竞争不会过度侵蚀利润……
市场会用真金白银投票。而作为投资者,我们需要做的不是盲目相信某个预测,而是持续跟踪几个关键指标:季度财报中的推理业务占比、毛利率变化、大客户自研芯片的进展、以及竞争对手产品的实际采用情况。
毕竟,在AI这个变化比翻书还快的行业里,唯一不变的就是变化本身。黄仁勋的皮衣可以穿20年不变,但英伟达的商业模式,可能每3年就要 reinvent 一次。











