英伟达B200铜连接“上位”,光模块岌岌可危?

作者: 陈兴华 03-20 18:26
AI解读文章
来源:爱集微 #英伟达# #铜连接#
3.5w

集微网报道 (文/陈兴华英伟达B200芯片闪亮登场同时,在高速连接器板块引发一定程度蝴蝶效应。

在英伟达GTC大会上,高速连接器概念横空出世,英伟达面向企业提供的GB200 NVL72服务器,内部使用的电缆长度累计接近2英里,共有5000条独立铜缆。这一度引发了市场对于“光退铜进”的担忧。不过,较多业内分析均指出,光模块仍将是行业主流技术。

目前,海外供应商主导着背板连接器(铜连接)市场,但国产替代趋势正在强化。而由于英伟达GB200 NVL72有着较高放量预期,国内高速连接厂商也将迎来更有利发展条件。

铜连接“上位”

根据半年迭代一次GPU的惯例,英伟达在GTC 2024上发布GB200超级芯片,单GB200 NVL72机架可包含72颗GPU,提供720PFLOPs训练性能+1440PFLOPs推理性能。

据悉,英伟达GB200 NVL72互联模式通过NV Switch实现,其中GPU与NVSwitch采用铜互联形式(高速背板连接器),外部则使用光互联形式(光模块-I/O连接器)。值得注意的是,其内部使用的电缆长度累计接近2英里,共有5000条独立铜缆。

在GTC大会上,黄仁勋对铜连接方案进行了特别讲解,并强调其在成本降低和性能展示上的优势。据一份调研纪要显示,铜缆背板在GB200的设计中起到了关键作用:连接背板连接器,并支持交换机和GPU板卡的连接,从而使服务器和交换机间的信号传输更为便捷。

随着AI热潮居高不下,GB200系列作为英伟达新一代的服务器级GPU芯片,其性能和效率的提升将对整个关联市场产生重大影响。尤其是其采用铜连接方案,可能会改变GPU集群的内部连接方式,降低成本并提高性能。这使得铜连接方案的市场前景值得期待。

目前,在AI服务器、大型交换机、路由器中使用背板连接器的趋势逐渐增强,技术发展也朝向两个方向演进,一是正交零背板,二是线缆背板。其中GB200采用的便是线缆背板模式,其优势在于更佳的散热、较低的传输损耗、更长的传输距离以及布线灵活性。

一位业内人士也指出,铜缆的优势是不需要电到光再光到电的转化,因为转化会浪费很多能量,但前提是铜缆可以做到高速率。如今,GB200 NVL72确认了铜缆方案的可行性。

此外,根据LightCounting分析显示,由于DAC高频高速线缆(通常译为直接电缆或直连铜缆)不耗电,是致力于提高能效的数据中心连接的默认解决方案,英伟达的策略是尽可能多地部署DAC,预计2024-2028年DAC高速铜缆年复合增速达到25%。

对于市场担忧的新一代B系列GPU单位算力对于光通信带宽的匹配有所下降,华泰通信指出,更多原因在于GPU算力提升幅度短期内超出了光通信带宽的提升速度。光模块向更高速率的迈进仍为大势所趋,通信带宽依旧是制约大规模集群中GPU利用率的“短板”。

“铜进光退”?

英伟达GB200单机柜方案采用铜缆方式进行GPU之间的互联,一度引发了市场对于“光退铜进”的担忧。不过,较多行业分析也并不以为然,认为光模块仍将是主流。

华泰通信认为,铜缆互联仅适用于单机柜方案。如集群规模超过72颗GPU,则会涉及多个机柜互联,其中第一层网络保持用铜缆,第二层(甚至三层)网络预计会使用光模块承载。单机柜方案更适用于中小参数规模模型的训练,与超大规模集群的适用场景存在“隔离”。

据了解,GPU第一层网络不使用光互联,并不是新方案。早在2023年5月,英伟达发布的GH200集群第一层网络便未使用光模块,而是采用了背板互联的方案。由此,英伟达最新发布的GB200即便采用了铜缆方案,也不存在所谓的铜缆取代了光互连。

广发通信则表示,“光进铜退”是大势所趋,但不应秉持非此即彼的思维。光模块意味着高带宽&长距离,但是成本、能耗高;铜缆在成本和能耗上有优势,但应用场景有限。

目前,在英伟达加速迭代GPU的大背景下,优先推出高速互联产品引导高端客户需求,但大部分应用场景的主要矛盾是带宽不足,而且能力需求远超铜缆的应用范围,那么自然而然会用光模块解决,少部分应用场景的主要矛盾是成本和能耗且铜缆能解决的就用铜方案。

从长期趋势上看,光模块的机会远大于铜缆,如今台积电在HPC上力推的3D堆叠封装,就是用硅光CPO解决chip to chip的互联问题,替代背板上的nvlink,初步测算长期将是一个百亿美金市场。广发通信指出,光模块的应用场景众多,但不代表铜缆没有适用场景,这并非二元论。

在多位行业人士看来,由于各有特性,光模块和铜缆的使用情况取决于客户的技术方案,但主流技术还是光模块。其中一位行业人士指出,从实物图看,GB200 NVL72内部使用铜缆时也大量采用了光模块,光模块比例进一步大幅度提升,“光进铜退”依旧是长期大趋势。

另据相关测算称,单个B200 nvl72柜子内部上方有两排交换机,共144个(72*2)端口,背面同样的两台交换机也有144个端口,总共288个800G的端口。当前用的是上一代cx7网口,对应800g光模块,800G光模块数量576颗(288*2),但这个机架里面的芯片只有72颗,说明芯片与光模块的比例为1:8,较B200的1:2.5配比有显著提升。

替代趋势加强

一定程度上,GB200将带动AI服务器与大型交换机、路由器需求的增长,进而促进背板连接器需求的放量。据黄仁勋的发言,多个潜在大客户预示着GB200有较高的放量预期。而在市场格局方面,目前海外供应商主导着背板连接器市场,但国产替代趋势正在强化。

在背板连接器的供给侧方面,上述调研纪要显示,一是海外产业链,目前海外高速铜连接器供应商以艾菲诺、莫仕和泰科为龙头,市场份额大概占据60%至80%。二是国产替代海外产品的趋势,国内代工公司如鼎通和意中电子也有代工铜连接器组件的业务。

进一步来看,英伟达AI芯片的迅速迭代正在为国内高速背板连接器厂商的发展创造有力条件。首先,国产厂商面对的专利壁垒相较以往有所减弱。由于外厂商在最新领域的研发大致与国内厂商同步,原本面临的5到10年研发领先的海外厂商专利壁垒已经不那么严密。

其次,国产设备商如华为等正积极扶持国产替代,其自2018年与华丰科技合作,加大了高速背板连接器的研发力度。目前,华丰科技的56G产品已成为华为的主要供应商之一,包括中兴、浪潮等公司也在高速连接领域与其合作,预示国产替代速度将非常快。

不过,国内需求侧的进展或存在一定之滞后。高速连接器厂商兆龙互连相关人士称,"部分厂商都已研发出了800Gb/s产品,但还没有正式运用到服务器方面,因为现在国内这一块的速率其实都不高,主要是100Gb/s、200Gb/s,国外的话可能会用到400Gb/s产品。"

数据显示,目前背板连接器的价值占单台服务器成本的比例约为3%至5%,但在AI服务器驱动下,线缆背板相较于传统背板PCB模式,价值量将显著提升。兴业证券认为,随着AI等技术的发展及应用,数据中心对高吞吐和大带宽的需求越发迫切。高速背板连接器等高速连接器作为数据中心系统互连关键硬件之一,将深度受益于AI算力需求增长。

如今,国内厂商在高速连接器领域已经有一定建树,例如立讯精密在高速连接器和电连接高速铜缆全球技术领先,并能提供电光混合方案、热管理和电源系统方案;华丰科技是高速背板连接器头部厂商;兆龙互连的产品广泛应用于国内头部互联网企业云计算数据中心和国外知名企业;鼎通科技通信连接器收入六成以上,已打入海外头部供应链等。

责编: 张轶群
来源:爱集微 #英伟达# #铜连接#
THE END

*此内容为集微网原创,著作权归集微网所有,爱集微,爱原创

关闭
加载

PDF 加载中...