「行业研究」AI 算力栈系列·第一篇。存储那条链,我们是从下往上看(HBM 如何卡住 GPU)。这个系列,我们换个视角——把整个算力栈摊开,看钱正在沿着它流向哪里。
先把「算力栈」摊开
谈 AI 投资,大多数人眼里只有一个词:英伟达。但英伟达只是一座冰山的尖。要看清这一轮的钱往哪流,得先把整个**算力栈(compute stack)**摊开。
从下到上,一个 AI 数据中心大致是这样一个栈:
| 层 | 内容 | 代表 |
|---|---|---|
| 芯片层 | GPU、HBM、CPU | 英伟达、AMD、美光、海力士 |
| 系统/网络层 | 服务器、互连、光模块、交换机 | 英伟达(NVLink)、博通、光通信厂商 |
| 数据中心层 | 机房、机柜、液冷、土地 | 数据中心 REITs、Neocloud |
| 能源层 | 电力、变电、冷却、电网接入 | 公用事业、独立电厂、核电、燃气轮机 |
这四层,共同构成了「把电变成 AI 算力」的完整链条。芯片再强,也得插在服务器上;服务器要靠高速网络互连成集群;集群要装进数据中心;而数据中心,要喝掉海量的电。
理解这个栈,关键在一句话——这条链上,真正稀缺的环节,会随时间移动。而每一次移动,都是一次利润的重新分配。
瓶颈的第一次移动:从「算力」到「带宽」
第一个瓶颈,大家都熟悉:GPU。
2023-2024 年,AI 投资最稀缺的就是英伟达的 GPU。谁能搞到 H100、GB200,谁就掌握了算力。利润高度集中在芯片层,英伟达赚走了这条链上绝大部分的钱。
但瓶颈很快开始移动。第一次移动,是从「算力」到「带宽」——也就是我前面存储系列讲的 HBM 的崛起。当 GPU 不再是唯一稀缺品、当数据「喂不喂得进 GPU」成了新瓶颈,价值就从纯算力流向了 HBM。这是瓶颈的第一次下移,海力士、美光吃到了这波红利。
紧接着,瓶颈又移到了网络互连。当 AI 训练要把成千上万张 GPU 连成一个集群协同工作时,GPU 之间的通信速度成了新瓶颈。一张 GPU 算得再快,如果和隔壁 GPU 的数据交换慢,整个集群效率就上不去。于是价值又流向了高速互连和光通信——这正是我之前写光纤那篇的核心逻辑:在 AI 数据中心里,光模块、交换机、未来的 CPO(光电共封装),是连接千万张 GPU 的「血管」,而血管,在集群规模爆炸时,成了卡脖子的环节。
看到这个模式了吗?瓶颈像一个沿着栈往下游移动的光标:GPU → HBM → 网络互连 → ……每移动一步,就有一批新的公司,从配角变成主角。
而现在,这个光标移到了最底层、也是这一轮最反直觉的一个瓶颈——电力。
瓶颈的最新落点:电,成了 AI 最硬的约束
这是这一篇我最想讲透的一点——AI 这一轮扩张,正在撞上一堵谁都没料到会这么硬的墙:电不够。
听起来荒诞:全世界最前沿、最高科技的产业,居然被一个最「土」的东西——电——卡住了脖子。但这是正在发生的现实。
逻辑链条是这样的:
第一,AI 数据中心是「电老虎」。 一个大型 AI 数据中心的耗电量,可以相当于一座中型城市。训练和运行大模型,本质上是把海量的电,通过 GPU,转化成算力。模型越大、集群越大,吃电越狠。
第二,电网跟不上。 美国的电网,过去二十年增长缓慢——因为此前电力需求基本平稳(能效提升抵消了增长)。结果是,当 AI 数据中心突然提出天量的、集中的用电需求时,电网没有准备好:发电不够、输电线路不够、变电站不够、并网审批要排队数年。在一些数据中心聚集的地区,「能不能搞到电」已经取代「能不能搞到 GPU」,成了建设的第一约束。
第三,这把矛盾逼出了一系列前所未有的操作。 当公用电网喂不饱 AI 时,科技巨头开始自己解决电的问题——直接去买电厂、签核电长约、甚至投资小型模块化核反应堆(SMR)。微软签下重启三里岛核电站的协议、亚马逊和谷歌投资 SMR、各家抢购燃气轮机……当世界上最有钱的科技公司开始亲自下场买电、建电,你就知道电这个瓶颈有多真实了。
这就是瓶颈移动的最新落点。价值的光标,从芯片,一路下移到了整个栈的最底层——电子(electron)本身。在 AI 时代,电,第一次成了一种战略稀缺资源。
为什么「电力」可能是下一个十年最确定的故事之一
我对 AI 投资一向保持警惕(后面会讲风险)。但在整个 AI 叙事里,「电力」这条线,是我觉得确定性相对最高的一条。原因有三:
第一,它的需求是「派生」的、且滞后的。 电力需求,派生自数据中心的建设——而数据中心的建设已经是板上钉钉的、未来几年的资本开支。也就是说,即使 AI 应用层的故事还很虚(谁会赢、能不能赚钱都没定),但「这些已经在建的数据中心需要电」是确定的。电力需求,某种程度上是 AI 资本开支里最不依赖「AI 最终能不能赚钱」的那部分——因为机房只要建了,就要喝电。
第二,供给端极度刚性,涨价弹性大。 发电厂、输电线、电网设备,建设周期以年甚至十年计,供给没法快速增加。当需求突然暴涨而供给刚性,结果就是:发电资产的价值重估、电价上行、电力设备(变压器、电缆、燃气轮机)的订单爆满。这是一个典型的「需求突变 + 供给刚性」的格局,和存储 HBM 的逻辑异曲同工——稀缺的环节,定价权最强。
第三,它受益于一个「跨叙事」的需求。 电力不只服务 AI。电动车、再制造业回流、整体电气化,都在抬升电力需求(还记得我写能源转型那篇)。AI 只是这股电力需求浪潮里,最猛、最集中的那一波。所以哪怕 AI 单独的故事降温,电气化这个更大的趋势仍在托底电力需求。 这让电力这条线,比纯 AI 的标的多了一层安全垫。
落到美股,这条线上的卡位大致是:独立电厂 / 公用事业(尤其手握核电、能签数据中心长约的)、电力设备(变压器、电网设备——这是真正的「卖铲子」)、燃气轮机制造、以及核电与 SMR 这个高弹性、高不确定的前沿。这些,是「不赌哪个 AI 模型赢,只赌 AI 要喝电」的卡位。
我的警惕:别把「卖铲子」当成无风险
讲了这么多电力的确定性,我必须泼一盆冷水——「卖水给淘金者」这套逻辑,本身藏着一个被滥用的陷阱。
「淘金时卖铲子最稳」是句被说烂的投资格言。它的问题在于:当所有人都知道「卖铲子最稳」时,铲子也会被买贵。 今天市场已经充分意识到了「AI 缺电」这个故事,电力、电网设备、核电相关的标的,很多已经price in 了大量乐观预期。一个正确的逻辑,加上一个过高的价格,依然是一笔糟糕的投资(还记得我在《市场先生》和估值那些笔记里反复讲的——再好的公司,买贵了也是亏)。
更深一层的风险是——电力需求的「确定性」,终究还是建立在 AI 资本开支持续的假设上。我前面说电力是「最不依赖 AI 赚不赚钱」的一环,那是相对的。如果 AI 资本开支整体大幅放缓、在建的数据中心被砍单,那「确定的电力需求」也会跟着打折。已经签的长约能托一阵,但新增需求会熄火。电力这条线的安全垫比纯 AI 厚,但它不是绝缘的。
还有一个具体风险:周期与超建。历史上每一次「需求暴涨 → 疯狂建产能」的故事,最后往往以产能过剩收场(存储业就是活教材)。如果电力和数据中心被过度建设,几年后可能出现局部过剩。今天的瓶颈,会催生明天的过剩——这是产能型行业逃不掉的宿命。
所以我的立场是:电力是 AI 算力栈里确定性相对最高的一条线,值得重点研究;但「确定性高」不等于「现在买就对」。逻辑对、价格贵、且仍系于 AI 资本开支这个总开关——这三点要一起看。
写在最后
把整个 AI 算力栈摊开,你会看到一幅清晰的、正在移动的图景:价值,像一个光标,沿着栈从上往下移动——从 GPU,到 HBM,到网络,到数据中心,到电力。每移动一步,就有一批新公司从配角变主角,也有一批旧主角的超额利润开始被稀释。
这个「瓶颈移动」的视角,比死盯着英伟达,能让你看到更完整的机会地图。它告诉你:这一轮 AI 的红利,从来不只在芯片层,它在沿着整条链分配,而且分配的重心在不断下移。今天它移到了那个最「土」、却最硬的约束上——电。
但这个视角也提醒我一件事:瓶颈会移动,意味着没有哪个环节的超额利润是永久的。 今天卡脖子的电力,会吸引天量的投资去解决它,而解决它的过程,本身就在为下一次过剩埋种子。看懂一条链,不只是看清当下的瓶颈在哪,更是看清这个瓶颈会怎么被填平、然后下一个瓶颈会冒在哪里。
所以,如果只留一句——
在 AI 这条算力链上,别只盯着最亮的那个环节(芯片)。盯着瓶颈,因为利润跟着瓶颈走;但也别忘了,瓶颈一旦被看见,就开始被填平——今天的稀缺,正在制造明天的过剩。
下一篇,我们回到这条链最亮的那个环节——英伟达,聊一个所有人都在问、却很少被认真回答的问题:它的护城河,到底还能守多久。
——
风险提示:本文为产业链研究,所涉行业与公司仅作分析示例,不构成任何投资建议。市场有风险,投资需谨慎。