AI数据中心


发布于 2025-09-06 / 4 阅读 / 0 评论 /
AI数据中心产业和产业链分析

AI数据中心高速互联

2025年8月22日,英伟达推出Spectrum-XGS以太网,旨在令AI工厂打破建筑物的限制,未来的AI工厂,不止要大,还要能把城市、国家乃至洲际的数据中心拼接起来。

AI数据中心在不断扩大规模的同时,庞大的数据传输需求也带来了更高的延迟和能耗问题,跨数据中心网络延迟是AI训练和计算面临的重要挑战。

NPO

NPO,英文全称 Near packaged optics,中文意思是指:近封装光学。

NPO/CPO 是将网络交换芯片和光引擎(光模块)进行“封装”的技术。

传统的连接方式,叫做 Pluggable(可插拔)。

光引擎是可插拔的光模块。

光纤过来以后,插在光模块上,然后通过 SerDes 通道,送到网络交换芯片(AISC)。它是将光引擎与交换芯片分开,装配在同一块 PCB 基板上的。

CPO

CPO全称Co-packaged optics,共封装光学,也可称之为“光电共封装”,是2023年年初出现的新概念。

CPO是将交换芯片和光引擎共同装配在同一个Socketed (插槽)上,形成芯片和模组的共封装。这里所说的“光引擎”的意思就是指“光模块”。

该技术特点在于将硅光模块和CMOS芯片用先进封装(2.5D或3D封装)的形式集成在一起,以此实现光通信模块更低的功耗、更小的体积和更快的传输速率,主要用于数据中心领域。

在数据中心网络中,传统交换机好比一位“翻译官”,将输入的光纤数据转换成电信号进行处理,待处理完毕后,再将电信号重新转换回光信号进行输出,整个过程耗时又费力。其中,较为人熟知的进阶版本是采用CPO(光学共封装系统)交换机,该技术通过将光引擎与交换芯片集成在同一基板上,从而实现电信号与光信号之间的高效转换和传输。

CPO 的出现主要是为了解决高频电链接距离的问题。数据中心带宽的增长导致SerDes 速率不断提升,功耗随之增加。为了保障信号的高质量传输,优化 SerDes 功耗,信号传输距离将会相应缩短,即交换芯片和光模块之间的封装距离需要进一步缩短。除此之外,随着数据中心内部流量的不断增长,每根光纤的传输容量也在不断提升,而数据中心光纤的单芯容量只有 100-400G,要做到大规模的数据吞吐意味着需要不断增加通道的数量,CPO 可以提高集成度。根据数据显示,通过采用 CPO技术,光学连接所需的功率有望降低 50%以上。

然而,当传输数据量呈指数级增长时,作为基于现有电交换架构的升级方案,CPO难免显得力不从心。

CPO产业链

上游

(1)基板/衬底供应商

InP:住友电工、北京通美 云岭光电、华为海思

GaAs: Freiberger

(2)芯片设计

云岭光电、华为海思、Acacia、AAOI

(3)生产配套设备商

光刻机:ASML

刻蚀机:Lam

外延设备:AIXTRON

(4)磊晶生长/外延片

联亚光电、1QE、全新光电、英特雷、日立电线

中游

(1)晶粒制造

稳懋、宏捷、环宇、聊颖

(2)光芯片制造商

国际龙头:LUMENTUM、Finisar、博通、三菱集团、住友电工

国内厂商:源杰半导体、云岭光电、长光华芯、中科光芯、中电13所

下游

(1)封装测试

联钧光电、同欣光电、矽品光电

(2)有源器件/光模块

LUMENTUM、英特尔、中际旭创、新易盛、德科立

(3)终端客户

华为、中兴、中国电信、中国移动、阿里巴巴、谷歌、亚马逊

OCS

OCS全称Optical Circuit Switch,光路交换机。是由光通信技术发展而来,能够在光域内直接完成信号交换的设备。

2009年,光通信技术就已在学术界和产业界得到广泛的好评。

2025年8月22日,英伟达宣布推出Spectrum-XGS以太网,为OCS提供了广阔的应用前景。OCS正以其低延迟和低能耗的属性,重新定义数据传输的“光速”潜力。

当数据量呈现指数级增长时,OCS作为全光交换方案,有望引领下一个光子通信时代。

OCS则是构建出一条截然不同的技术路径,其通过重构光信号本身的物理路径,直接消除了光电转换环节。若将CPO交换机比作光信号的“高速公路”,那么OCS则更像是“光的立交桥”——在面对拥堵时,与其单纯提升速度,不如开辟全新的道路。

在2023年的一篇论文中,谷歌研究人员通过计算发现,OCS硬件部分和相关光纤组件成本低于整个超级计算系统成本的5%,且功耗低于系统总功耗的3%,展现出成本与效能优势。于是,谷歌立刻在其Jupiter数据中心网络中大量引入了OCS,成为全光交换领域“饮头啖汤”的玩家。

对新技术的大胆押注令谷歌赢得了奖赏。根据半导体分析机构SemiAnalysis的报告,谷歌的OCS定制化网络使其整个网络的吞吐量提升了30%,功耗降低了40%,数据流完成时间缩短了10%,网络宕机时间减少了50倍,且资本开支减少了30%。

更重要的意义在于,巨大的效用让市场看到了OCS的潜力。市场调研机构Cignal AI认为,除了谷歌外,2025年之后会有更多厂商投资于OCS领域,考虑到OCS在数据中心核心层、人工智能集群等部署量有望持续增长,预计到2029年市场规模有望超过16亿美元。国盛证券更是直言,OCS有望引领下一个光子通信时代。

OCS产业发展

2025年7月,开放计算项目(OCP)宣布成立OCS子项目,该项目旨在推动开放式光交换技术协作,推动OCS向开放化、标准化发展,从而形成全球范围的行业规范。项目初始成员包括Lumentum、谷歌、微软、英伟达、Coherent、iPronics等。

Lumentum已在OCS上赚到“第一桶金”。在第二季度业绩会上,Lumentum表示,OCS业务已实现向两家超大规模云厂商出货,第三家超大规模客户即将出货。公司将加速扩充OCS生产能力,预计相关业务未来有望带来数亿美元的收入贡献。

华为推出了数据中心全光交换机 Huawei OptiXtrans DC808,其采用MEMS技术,可实现高速且稳定的全光交换。在前不久举行的日本Interop Tokyo 2025展上,这款产品还获得了Best of Show Award特别奖。

OCS需解决的问题

从技术层面来看,OCS并非对CPO等光电交换方案的全方位替代。如英伟达在OCP EMEA 2025大会上所言,当前光交换机的制造成本仍显著高于电交换机,当两个方案(CPO和OCS)配合起来,功耗才可以进一步降低。

OCS方案之争

OCS领域本身也还存在方案之争,目前在MEMS、数字液晶DLC、压电陶瓷直接光束偏转DBS三条技术路径中,MEMS方案的核心应用客户为谷歌,参与厂商数量也较多;DLC方案目前主要由Coherent研发,已经在逐步导入CSP的供应链;DBS方案为Polatis的独家技术,目前仍未成熟。