跳到正文 · Skip to content
内容
关于与合作
订阅与会员
★ 查看会员权益
外观与设置
外观
主题色
版本 · 深色 / 减动搜索⌘K

HBM:AI 算力链上,那堵谁也绕不过去的「带宽墙」

GPU 决定了算力能跑多快,HBM 决定了数据能喂多快。而当模型大到一定程度,瓶颈就不再是「算得快不快」,是「喂得上喂不上」。

2026.06.1417 分钟原创
HBM:AI 算力链上,那堵谁也绕不过去的「带宽墙」

「行业研究」存储系列·第二篇。上一篇讲了存储为什么这一轮不像周期,反复点到一个词——HBM。这一篇把它单独拆开,因为理解了 HBM,你才真正理解这轮存储的权力从哪来。

先搞清楚:HBM 到底解决什么问题

要理解 HBM 为什么突然这么重要,得先理解 AI 算力的一个反直觉事实——很多时候,GPU 不是被「算力」卡住的,是被「带宽」卡住的

一颗英伟达的旗舰 GPU,理论算力极其惊人。但算力要发挥,前提是数据能及时喂进去。训练或推理一个大模型时,要反复地把海量参数和数据,从存储搬进计算单元、再搬出来。如果这个「搬运」的速度跟不上,那再强的算力也只是空转——计算单元在那里干等数据。

这就是芯片业讲了几十年的**「内存墙」(memory wall)**:算力每年涨得飞快,但数据从内存搬到计算单元的速度,涨得慢得多。两者的差距越拉越大,到了 AI 大模型时代,这堵墙成了决定性的瓶颈。

HBM(High Bandwidth Memory,高带宽存储)就是为了砸穿这堵墙而生的。它的核心思路简单粗暴——既然单条通道带宽不够,那就把很多层 DRAM 芯片垂直堆叠起来,用极宽的通道,紧贴着 GPU 并排放,让数据「并行地、近距离地」涌进计算单元

打个比方:普通 DRAM 像是一条双车道公路通向工厂;HBM 则是把几十条车道并排铺开、而且把仓库直接搬到工厂隔壁。运的还是同样的货(数据),但吞吐量是数量级的差别。

所以 HBM 的本质,不是「更大的内存」,是「更快的喂数据管道」。在 AI 这个「算力过剩、带宽稀缺」的时代,谁能造出最快的管道,谁就掌握了整条算力链的咽喉。这就是存储——一个三十年的配角——第一次坐到主位的物理原因。

为什么它这么贵、这么难造

如果 HBM 只是「把 DRAM 叠起来」这么简单,那它不会有今天的壁垒。它真正的难,在于三件事,而这三件事共同决定了它的高价和高门槛。

第一,垂直堆叠 + 硅通孔(TSV),是制造工艺的噩梦。

HBM 要把 8 层、12 层、未来 16 层的 DRAM 芯片垂直叠在一起,层与层之间用一种叫**硅通孔(TSV)**的技术,在硅片上打成千上万个微观的垂直孔洞来导通信号。这意味着每一层的良率要极高——因为任何一层出问题,整个堆叠就废了。12 层堆叠的综合良率,是 12 层各自良率的连乘,这是一个对制造精度极度残酷的数学。这也是为什么 HBM 是存储里最考验「制造内功」的产品,不是有钱建厂就能做好。

第二,它三倍地消耗晶圆,挤压了一切。

我在上一篇点过这个数字,这里讲透它的含义——制造同样容量的 HBM,消耗的晶圆面积大约是普通 DRAM 的 3 倍(因为堆叠、TSV、更大的裸片面积都要占地方)。这带来一个连锁后果:厂商每把产能转去做 HBM,就要从普通 DRAM 那里抽走约 3 倍的产能。结果是 HBM 自己贵,还顺手造成了普通 DRAM 的结构性短缺、跟着涨价。HBM 不只是一个高价产品,它是一个会「吸干」整个 DRAM 产能池的黑洞。

第三,先进封装是另一道关,而这道关把台积电拉进了存储的牌局。

HBM 造出来还不够,它要和 GPU 封装在一起——通过台积电的 CoWoS 这类先进封装技术,把 HBM 和 GPU 裸片并排「焊」在同一个基板上。这意味着 HBM 的产能,还受制于先进封装的产能。过去两年 AI 芯片的一个隐形瓶颈,就是 CoWoS 封装产能不够。所以 HBM 的供给,卡在三个环节上:DRAM 晶圆、TSV 堆叠良率、先进封装产能——任何一个不够,GPU 就出不来货。

把这三点合起来你就明白:HBM 的高价不是炒作,是它真实地难造、真实地稀缺、真实地卡在多个瓶颈上。它的定价也反映了这点——HBM3E 大约 $300 一个 36GB 的 stack,HBM4 估计要 $500 一个 stack,是普通 DRAM 颗粒单位价值的几十倍。

份额格局:一个被 HBM4 重新洗牌的牌桌

HBM 的竞争格局,和普通 DRAM 不一样。普通 DRAM 是三星领先(约 38% 份额),但在 HBM 这个高端战场,座次完全不同,而且正在被 HBM4 这一代重新洗牌

看最新(2026 Q2 口径)的 HBM 份额:

厂商HBM 份额身位与动向
SK海力士62%绝对领先,HBM4 率先完成开发(能效 +40%、10Gbps),与英伟达深度绑定
美光(MU)21%已反超三星,HBM4 拿下英伟达 Vera Rubin 平台量产,HBM 年化收入跑向 ~$80亿
三星17%曾经的存储老大,在 HBM 上一度掉队(HBM4 良率推迟),正全力追赶

这张表里藏着这一轮最值得玩味的故事——存储行业的总老大三星,在 HBM 这个最关键的高端战场上,反而是落后的那个;而 SK海力士,这个过去在三星阴影下的「老二」,靠着 HBM 的先发,第一次坐上了主位。

这是技术代差的力量。SK海力士在 HBM 上的领先不是营销,是它更早地、更狠地押注了这个方向,把良率和客户协同的内功练到了别人追不上。而三星这种体量的巨头,反而因为转身慢、HBM4 良率卡壳,在这一波里吃了亏。这是一个绝佳的案例:在技术快速迭代的窗口期,「规模最大」不等于「赢」,「转身最快、押注最准」才是。

而 HBM4 是下一个决胜点。谁的 HBM4 良率先爬上来、先拿到英伟达下一代平台(Vera Rubin)的大单,谁就锁定未来两三年的份额。目前看,SK海力士领先、美光紧咬、三星追赶——但良率这种东西,一旦突破可能很快放量,所以三星没有出局,这场仗还没打完。

HBM4 的一个关键变化:台积电正式入局

HBM4 这一代,有一个容易被忽视、但影响深远的技术变化,值得单独讲——「base die(基础芯片)」开始改用逻辑工艺制造,而这把台积电直接拉进了 HBM 的牌局。

HBM 的堆叠底部,有一颗叫 base die 的芯片,负责管理整个堆叠和 GPU 之间的通信。过去这颗 base die 用存储厂自己的工艺做。但到了 HBM4,为了塞进更多逻辑功能、提升性能,base die 开始改用先进逻辑工艺(类似做 CPU/GPU 的工艺)制造——而这种工艺,存储厂自己没有,得找台积电这样的逻辑代工厂做。

这个变化的含义很大:

第一,HBM 从「纯存储产品」变成了「存储 + 逻辑的混合体」。 它的技术栈更复杂了,壁垒更高了,也更贵了。

第二,台积电成了 HBM 链上的新玩家。 谁能拿到台积电的先进逻辑产能做 base die,谁的 HBM4 就更有竞争力。SK海力士和台积电的合作,某种程度上是它 HBM4 领先的一个原因。

第三,它进一步固化了寡头格局。 当 HBM 需要「顶级存储工艺 + 顶级逻辑代工 + 顶级先进封装」三者协同时,能玩这个游戏的玩家只会更少,不会更多。这对在位的三家是好事——它们的护城河又深了一层。

换句话说,HBM4 不只是「更快的 HBM」,它是一次技术栈的升维,把这门生意从「存储厂的内部游戏」变成了「存储 + 逻辑代工 + 先进封装的联合作战」。理解这一点,你才能理解为什么这条链的壁垒在变厚,而不是变薄。

对美股投资者:这条链怎么卡位

讲了这么多产业逻辑,落到一个现实问题——面向美股,这条 HBM 链怎么卡位?

我把这条链上美股可投的标的,按「直接 → 间接」梳理一下(这是产业链分析,不是推荐,具体配置看你自己的判断):

最直接:美光(MU)。 三巨头里唯一在美股直接可投的纯存储玩家(海力士、三星是韩股)。它 HBM 份额反超三星、拿下英伟达 Vera Rubin 量产、毛利率冲到 75% 并指引下季 81%——是美股投资者押注 HBM 最直接的载体。但也要记得,它依然是三家里的「追赶者」,且周期属性还在(见上一篇的怀疑)。

卖铲子的:先进封装与设备。 HBM 卡在 TSV 和先进封装上,那么做这些环节的设备和材料公司,是「不赌谁赢、只赌这条链整体放量」的卡位。台积电(CoWoS 封装)、以及一系列半导体设备公司(做 TSV、键合、检测设备的),都受益于 HBM 的整体扩产。这类标的的逻辑是:无论最后是海力士还是三星赢,它们都要买这些设备来造 HBM。

下游的:英伟达。 反过来看,HBM 是英伟达 GPU 的「准入门票」和瓶颈——HBM 够不够、良率行不行,直接决定英伟达能出多少货。所以英伟达既是 HBM 最大的需求方,也是这条链景气度的最终来源。盯 HBM,某种程度上就是在盯英伟达的供给端能不能跟上。

我自己看这条链的方法是:把它当成一个「卖水给淘金者」的故事,但要分清你站在水链的哪一环。 最上游的纯存储(美光)弹性最大但周期性也最强;中游的封装设备最稳但弹性小;下游的英伟达是需求总开关。这条链最大的系统性风险只有一个,和上一篇说的一样——AI 资本开支这口井,会不会有一天打不出水。

写在最后

HBM 这个东西,三年前还是存储里一个不起眼的细分品类。今天,它成了整个 AI 算力链上谁也绕不过去的那堵墙。

它的故事之所以重要,不是因为它涨价了,而是因为它揭示了一个产业规律——在一条价值链上,瓶颈在哪里,利润就在哪里。当算力过剩、带宽稀缺,价值就从「算」流向了「喂数据」;当 HBM 成了那个最稀缺、最难造、卡着所有人脖子的环节,它就从配角变成了主角,利润率甚至盖过了食物链顶端的台积电。

但我也提醒自己:瓶颈是会移动的。今天 HBM 是墙,是因为算力相对过剩;如果哪天算力的供给逻辑变了,或者某种新架构绕开了对带宽的极端依赖,这堵墙的价值也会变。没有永远的瓶颈,只有当下的瓶颈。 HBM 现在站在浪尖上,是因为它恰好卡在了 AI 这一轮最痛的那个点上。

所以,如果只留一句——

HBM 不是更好的内存,它是 AI 时代算力链上的咽喉。谁掐住这道咽喉,谁就分到了这一轮最肥的利润;但咽喉的位置,从来不是永久的。

下一篇,我把三巨头——SK海力士、三星、美光——拉到一张桌子上横评:它们的技术路线、产能策略、和卡位差异,到底谁更可能笑到最后。

——

风险提示:本文为产业链研究,所涉公司仅作分析示例,不构成任何投资建议。市场有风险,投资需谨慎。

Minto
明投 Minto
投资分析 · 长期主义者
上一篇 · 存储三巨头横评:领跑者、…
下一篇 → · 比台积电还赚钱的存储:这…
你读完了 · Colophon

HBM:AI 算力链上,那堵谁也绕不过去的「带宽墙」

17
分钟
2026/06
期号
2026
年份
真正稀缺的,是一个不慌不忙的人。
明投 · MintoInvest Wisely
— From This Series
喜欢这篇?这类 行业研究 的深度拆解会持续发到你邮箱。
无广告 · 随时退订
— Enjoyed the read?
如果这篇文章对你有用,把它分享给一个朋友,就是对我最好的支持。

口碑是独立创作者最稀缺的燃料。

— Discussion

说说你的想法

评论基于 GitHub Discussions(Giscus)。登录后即可留言、点赞、互相讨论。

评论还在准备中。

想说什么可以直接发我邮件,比在评论区更容易认真回复。

mingtaohuang617@gmail.com →
支持沉浸式阅读