「行业研究」第十篇。AI 算力栈那篇,我提到价值正从芯片向网络迁移。这一篇把「网络」这一环单独拆开——光通信,这条 AI 数据中心里最不起眼、却越来越卡脖子的血管。
为什么 AI 让「连接」变成了大问题
先理解一个反直觉的事实——把一万张 GPU 买回来堆在一起,它们不会自动变成一台超级计算机。
训练一个大模型,需要成千上万张 GPU 协同工作:它们要不停地交换数据、同步参数。如果 GPU 之间的「沟通」速度跟不上,那再多的 GPU 也无法高效协同——大量算力会浪费在「等数据」上。让海量 GPU 真正变成一个整体的,是中间那张高速网络。
而随着 AI 集群越来越大——从千卡,到万卡,到十万卡——这张网络的重要性急剧上升。原因是:集群规模越大,GPU 之间需要交换的数据越多,互连的压力呈非线性增长。 一个十万卡的集群,光是让这些 GPU 彼此「说上话」,就是一个极其庞大的工程,互连的成本和耗电,占整个数据中心的比重越来越高。
这就是为什么 AI 把「连接」变成了大问题。在传统计算里,网络是配角;在 AI 超大集群里,网络是决定整个集群能不能高效运转的关键。而承担这种高速、大容量、长距离连接的,主要就是光——光模块、光纤、光交换。算力是肌肉,光是血管。肌肉再壮,血管供不上,也是废的。
光通信的「重复性需求」:一个比一次性买卖更好的生意
光通信这门生意,有一个特别值得投资者注意的特性——它的需求是「重复性」的,而非「一次性」的。 这一点,让它比很多硬件生意的商业模型更好。
逻辑在于光模块的升级节奏。AI 数据中心的光互连,有一个清晰的速率升级路径:400G → 800G → 1.6T → 3.2T……每一代 GPU 出来,集群规模和带宽需求上一个台阶,就需要更快的光模块来匹配。
关键在于:这不是一次性采购,而是持续的、被 GPU 迭代驱动的升级换代。 英伟达一年一迭代(还记得英伟达那篇),每一代新平台,都要求配套的光互连同步升级。这意味着光模块厂商面对的,是一个随 GPU 迭代不断重复的换代需求——旧的 800G 还没用旧,1.6T 的需求又来了。
「重复性需求」是比「一次性买卖」好得多的生意模型——它让收入更可预测、更持续,不像有些硬件卖一次就完了。只要 AI 集群在升级、GPU 在迭代,光互连就要跟着换代。这是光通信作为「卖铲子」标的,比一般卖铲子更优越的地方:它的铲子,客户得反复来买。
CPO:一场正在发生的架构变革
光通信赛道当下最大的变量,是一场叫 CPO(Co-Packaged Optics,光电共封装) 的架构变革。理解它,你才能判断这个赛道未来的赢家和输家会怎么洗牌。
问题的起点,又是电(还记得价值迁移那篇——电是 AI 最硬的约束)。传统的光模块是「可插拔」的——光电转换发生在交换机外面、插在端口上的模块里。这套方案灵活,但有个致命问题:随着速率越来越高,这些可插拔光模块的耗电急剧上升,成了数据中心电力账单里越来越大的一块。在「电是稀缺资源」的 AI 时代,这是不可接受的。
CPO 的思路,是把光电转换直接挪到交换芯片(ASIC)旁边、和它封装在一起——缩短电信号传输的距离,从而大幅降低功耗。简单说:CPO 用「把光器件搬到离芯片更近的地方」,换取「省电」。 在电力成为瓶颈的背景下,这个省电的价值是巨大的。
这场变革的意义在于,它会重新洗牌赛道的价值分配:
- 它把光通信从「做可插拔模块」的环节,往「先进封装 + 芯片级集成」的方向推——技术壁垒更高了。
- 它让那些既懂交换芯片、又懂光器件、还懂先进封装的玩家(典型如博通这类同时做交换 ASIC 的巨头)占据有利位置。
- 它可能边缘化一部分只会做标准可插拔模块的厂商。
CPO 之于光通信,有点像 HBM4 的「base die 用逻辑工艺」之于存储(还记得 HBM 那篇)——它都是把一个原本相对标准化的环节,往「更高集成、更高壁垒」推,从而抬高门槛、固化领先者。判断光通信的长期赢家,很大程度上就是判断:谁能在 CPO 这场架构迁移里占到位置。
关键区分:会打价格战的「模块」,和有壁垒的「光芯片」
这是看光通信投资,我认为最重要的一个区分——光通信不是铁板一块,它至少分成「会打价格战的低壁垒环节」和「有真护城河的高壁垒环节」,而价值正在向后者集中。
低壁垒、易价格战的环节:标准光模块的组装。 做标准化的可插拔光模块,本质是组装——把光芯片、电芯片、封装拼起来。这个环节竞争极其激烈(全球大量厂商,尤其中国厂商极有成本优势),容易陷入价格战、毛利被侵蚀。面对美股,纯做模块组装的逻辑,要警惕「需求很旺但利润被价格战吃掉」的陷阱。
高壁垒、有护城河的环节: 真正的价值,集中在模块里那几个最难的部件上——
- 光芯片 / 激光器:模块里负责发光、收光的核心器件,技术壁垒高,玩家少。
- DSP / 电芯片:负责高速信号处理的芯片,博通、Marvell 这类公司主导。
- 交换 ASIC:整张网络的大脑,博通是绝对主导者之一。
- CPO 相关的封装与集成 IP:上面讲的下一代架构的核心。
面向美股,看光通信的正确姿势,是顺着「壁垒」往上看——别盯着会打价格战的模块组装,盯着激光器、DSP、交换 ASIC、CPO 这些有真护城河的硬环节。 价值在这条链里高度不均匀地分布,而 AI 的红利,会优先、且持久地流向那些别人替代不了的硬部件,而不是谁都能做的组装。这又回到我反复讲的——在一条产业链里,找那个「卡脖子」的环节,利润就在那里。
写在最后
光通信,是 AI 故事里一条容易被忽略、却真实卡脖子的血管。
它的逻辑链很清晰:AI 集群越大,GPU 之间的连接越关键;连接越关键,光的价值越高;而 GPU 一年一迭代,光就得跟着一代代换代——这构成了一个难得的「重复性需求」。在「卖铲子」的逻辑里,光通信卖的是那种客户得反复来买的铲子,这让它的生意模型,比一次性硬件买卖更优越。
但它也不是一个可以闭眼买的赛道。它内部高度分化:标准模块组装会打价格战、利润被侵蚀;而真正的护城河,藏在激光器、DSP、交换芯片、CPO 这些硬环节里。而 CPO 这场由「省电」驱动的架构变革,正在重新洗牌整个赛道的价值分配——把它往更高壁垒、更高集成的方向推。
所以我看光通信,守两条:第一,认它的「重复性需求」是真红利;第二,严格区分会价格战的模块和有壁垒的光芯片,只在后者里找价值。 把这两条放一起,你就能既享受 AI 对光互连的持续拉动,又避开「需求很旺、利润很薄」的组装陷阱。
如果只留一句——
在 AI 数据中心里,光是连接算力的血管,而且是 GPU 每迭代一次就要换一次的血管——这是它最好的地方。但血管也分三六九等:别买谁都能做的管壁(模块组装),买那个别人造不出的、最硬的接口(光芯片与 CPO)。
下一篇,我们离开算力的世界,看一个完全不同、却同样在经历范式之变的赛道——创新药。
——
风险提示:本文为产业链研究,所涉公司仅作分析示例,不构成任何投资建议。市场有风险,投资需谨慎。